文件多到管不过来？我做了个本地服务：丢进文件夹，AI 自动改名、分类、建索引

在 AI 时代，每个人处理信息的能力都被放大了很多倍。原来我一天可能只读、只写几个文件，还能很规矩地人工管理——用 Obsidian、Notion 或者印象笔记建一套自己的知识体系。像我这种矫情的 J 人，还会给每个文件编排很有规律的文件名再存起来，方便日后查阅。

但 AI 时代这事变了。我每天产出的文件，变成了几十个甚至上百个，原来那套手动体系我已经完全没能力维持了。于是我想了个办法，也做了实践，分享出来希望能给你一点启发。

一个盯着文件夹的本地服务

这个小小的程序，会去监控本地的一个文件夹。每往里放进一个文件，它就用大模型读取文件的内容，给这个文件自动改名、分类，并建立一个完善的索引——这些都是按照我自己的使用习惯来的。

整个设计思路是这样的：我有一个临时文件夹，里面存着所有下载下来的东西，还有别人在聊天软件里传给我的文件。这些文件名字奇奇怪怪、类型五花八门。后台程序会不断监控这个文件夹的变化，判断文件类型：

如果是文档或图片，就交给 Claude，用订阅套餐的额度去读、去看；
如果是音频或视频，就交给 Gemini 去分析。

我要做的只是告诉它一个标准，然后把文件丢进去、等一下。很快它就会按我指定的方式分类、处理，同时建立一个非常完善的索引，方便我自己打开浏览器查阅。它按内容类型分了不同的文件夹，比如我常用的会议记录、口播稿、健康档案、财务信息，还有给客户的提案、我找到的一些知识和方法论。

关键：两层「检索中间层」

这套方式对我这个使用者特别友好。因为我用 AI 输出的很多文件，都是网页文档，或者是没法直接检索内容的音频、视频。而行业里常用的 Obsidian 那种方式，会把所有内容都变成 Markdown 文件来存储和管理——对人来说，看一堆纯文本加各种标记符号是很辛苦的，远不如直接看网页、看方案来得直接。

但反过来，网页和多媒体内容，对智能体来说又是不友好的文档形式。

所以我建了两层所谓的「检索中间层」。目的只有一个：在我需要用、或者 Agent 需要调用的时候，它能知道该找哪个文档、把哪些信息抓进上下文里做进一步处理。大模型分析完一个文件之后，除了给它改一个好记的名字，还会抽象出一层内容梗概，并按我的使用习惯打上标签，形成一个给 Agent 看的目录清单。

如果丢进临时文件夹的是一个文件夹、而不是单个文件，它也会识别——要是识别到这是一个以文件夹形式存储的软件，就会把它打包成压缩文件存起来。整个过程大概在十几秒到二十秒内完成。

演示：根目录的碎文件，十几秒后各归各位

演示一下：现在这个文件夹是已经初步整理好的。我们模拟一个混乱状态，丢给它一些没改名、没分类的文件，看它怎么处理。把要处理的扔进来，等十几秒，它就能完成自动梳理。刷新一下文件夹，根目录下那些碎文件就没了——它们被放进了具体的文件夹里。

打开视频文件夹，能看到它把内容解读之后，用一个标准格式重命名了：一个具体的日期、内容类型、再加一句内容简介。音频也一样。刚才放进去那张图片，被自动识别成了「3D 动漫风格的男性角色全身立绘」存在了对应位置。

这只是最初步的一层整理。它还会关联到我 Claude Code 里的很多定时任务——比如财务文件夹里有发票这种类型，它会定期把发票帮我填好报销单（我另有一期专门讲这个 skill 和填发票的能力）。它也会把这些内容关联到我对应的项目里。怎么做到的？就是因为它给文件夹建了一套非常详细的索引规则和索引层。这是我近期还没归档的、大概九十多个文件，每一个除了文件名，都有一句简短的索引，方便被智能体快速检索和调用。

同样地，我 Claude Code 产出的网页、其他文档、图片，也都会生成在这个临时目录里，实时改名、分类、存储。而且这个过程 CC 是会记住的，这就避免了以前那种想找一个文件却找不到的尴尬。

它不是一个 skill，是一个本地服务

要说明的是：这个功能它不是一个 skill，而是我开发的一个本地服务。大家可以拿走我的源代码，做二次开发和调整——因为每个人整理文件的思路都不一样。但这个方式真的极大满足了我的整理癖，也省了我大量时间。

延伸玩法：抽出你的「身份内核」

还有一些延伸玩法。比如我给客户做咨询时，很多网页里大量包含了我的方法论、我的观点、我的价值排序。我额外会做的一件事，是定期去抽取这些内容，形成一份「身份内核」文档。有了这份文档，Claude Code 在做策划、做方案、做执行的时候，就会按照我的价值排序来决策和执行，让我的 CC 越来越好用。

这就是今天的分享，我们明天再见。

今天这个服务完全开源免费（MIT），仓库在 github.com/xntj-ai/guiwei。它是一个本地后台服务、不是 skill——把代码拿走，配好你自己的大模型 key（文档图片走 OpenAI 兼容接口、音视频走 Gemini），按你自己的整理习惯改改就能用。

文件对人友好的形式，对 Agent 往往不友好——所以我给它建了两层检索中间层。

来源:EP0055_audio.mp3 · ASR 模型 gemini-2.5-pro(切段并发) · 原片完整文字版

[00:00] 今天这期内容可以解决一个大问题那在 AI 的时代每个人对于信息的处理能力增强了非常多倍原来我们每天可能只能去读取或者是输出几个文件而已我们可以很好的人工的去进行管理比如说用到 Obsidian Notion 或者是说印象笔记这样的工具去建立一个自己的知识体系那像我这样矫情的 J 人呢就会给这些文件编排非常有规律的文件名进行存储方便我再次的去查阅里面的内容但是在 AI 时代这情况变了

[00:25] 每天我产出的文件数量变成了几十个甚至是上百个我完全没有能力按照原来的那套体系再去做这样的事情于是我想到一个好的方法并且做了实践希望也能够给你带来启示那这个小小的程序呢可以去监控本地的一个文件夹以至于每放进去一个文件它都可以去用大模型读取文件的内容并且给这个文件自动的更名分类并且建立一个完善的索引这一些呢都是按照我的使用习惯去完成的

[00:50] 那我就带大家来看一下整个的设计思路我会有一个临时的文件夹那这个文件夹里面存放着所有下载下来的内容以及在聊天软件里面别人传给我的东西那这些文件的名称是奇奇怪怪的类型也是非常多的种类的首先后台的程序会不断地监控这个文件夹的内容的变化去判断文件的类型如果它是一个文档或者是一个图片就交给 Claude 用订阅套餐的额度去读取去看如果检测到文档的内容是音频或者是视频就会给到 Gemini

[01:15] 的模型去分析我们需要做的只是告诉他一个标准并且把文件丢进去等一下很快就会按照我指定的方式进行分类和处理同时会建立一个非常完善的索引为了方便我本人打开浏览器去查阅它根据内容的类型不同分了不一样的文件夹比如说有我常用的会议的记录啊有我的口播稿有我的健康档案甚至是财务的信息还会有我给客户的提案和我找到的一些知识以及方法论那这样的方式有什么好处呢它对于我

[01:40] 这个使用者来讲是非常友好的因为我用 AI 输出的很多文件都是网页的文档或者是没有办法直接检索到内容的音频和视频那像行业里常用的 Obsidian 这样的方式呢会把所有的内容变成 Markdown MD 的文件去存储和管理对于人来讲看一个纯文本的内容还有各种各样的标记符号是非常辛苦的一件事情远远不如我们直接去看网页或者是看方案来的直接但网页方案和多媒体的内容对于智能体来讲它又是一个不友好的文档形式

[02:06] 所以我就会去建立两层所谓的检索中间层目的呢只有一个就是在我需要使用的时候或者是在 Agent 需要调用的时候它能知道需要去找哪个文档去把哪些信息抓进上下文进行进一步的处理那在大模型分析完这个文件之后呢除了给它改一个好记的名字也会抽象出一层内容的梗概层并且按照我的使用习惯去打上标签形成一个给 Agent 看的目录清单如果丢到这个临时文件夹

[02:31] 里的东西它是一个文件夹而不是一个文件的话也会进行识别如果它识别到了一个以文件夹的方式进行存储的软件会把这个文件夹打包成一个压缩文件进行存储整个过程大概是在十几秒到二十秒的时间内完成的我也会把这个源代码分享出来大家可以私信管我要我们来展示一下整个的一个操作的过程现在看到的这个文件夹呢就是已经初步整理好的一个文件夹我们模拟一个混乱的状态丢给它一些没有进行改名字没有进行分类的文件

[02:56] 看一下它的这个处理的过程那我们就把这些需要处理的扔进来就去等一下可以等十几秒钟的时间它就可以完成一个自动的梳理那我们只需要刷新这个文件夹就可以看到它把文件放到了对应的文件夹里面非常的丝滑完成之后可以刷新一下这个文件夹你会发现根目录下的这些碎文件已经没有了它们被放到了具体的文件夹当中比如说我打开这个视频的文件夹就可以看到它把内容解读之后使用了一个标准的格式进行了重命名就是一个具体的日期内容的类型

[03:22] 那这个内容的一个简介那除了视频之外呢音频也是一样同样也是这样的一个改名的一个过程啊图片刚刚才我们放进来那个图片自动识别成了一个 3D 动漫风格的男性角色全身的立绘存在了这里那这只是最初步的一层整理啊还会关联到我 Claude Code 里面很多的定时任务比如说在财务文件夹当中有一种发票的类型它会定期的把发票帮我填好报销单我有另外一期视频是讲这个 skill 和填发票的这个能力的

[03:47] 那它也会把这些内容去关联到我对应的项目当中那是怎么实现的呢是因为它给这个文件夹建立了一个非常详细的索引规则和索引层这是我近期还没有归档的大概 90 多个文件在这里面每一个除了文件名之外都会有一个简短的索引以至于它可以被智能体快速的进行检索和调用那同样的我的 Claude Code 产出的网页也好其他类型的文档也好图片也好也都会生成在这个临时文件的目录里面

[04:12] 实时的进行改名分类和存储而且这个过程 CC 是会记住的这也就避免了我们之前出现的那种想要找一个文件找不到的那样尴尬的情况那这个功能它不是一个 skill 啊它是开发了一个本地的服务大家可以拿走我的源代码进行二次的开发和调整因为每个人整理文件的思路是不一样的嘛但这个方式真的极大的满足了我的整理癖和节省了我的时间那还有一些延伸的玩法比如说我在给客户的咨询当中有很多的

[04:37] 网页里面会大量包含了我的方法论我的观点和我的价值排序我额外还会做的一件事情是定期去抽取这些内容形成我的身份内核的一个文档那有了这样的一个文档 Claude Code 在做策划在做方案在做执行的时候就会按照我的价值排序进行决策和执行会让我的 CC 变得越来越好用那这就是今天我给大家带来的分享我们明天再见拜拜