← 回首页

文件多到管不过来?我做了个本地服务:丢进文件夹,AI 自动改名、分类、建索引

真人长视频 · EP0055 2026年7月1日 5:00
这一期讲什么

AI 时代,我每天产出的文件从几个变成了几十上百个——网页、方案、音频、视频,名字奇奇怪怪、类型五花八门,原来那套手动命名归档的体系彻底扛不住了。

于是我做了个本地的后台服务:盯着一个「收件」文件夹,每丢进去一个文件,就用大模型读它的内容、自动改名、分类、建索引。十几秒搞定。

配套下载 · 给你的 Claude Code 学

在 AI 时代,每个人处理信息的能力都被放大了很多倍。原来我一天可能只读、只写几个文件,还能很规矩地人工管理——用 Obsidian、Notion 或者印象笔记建一套自己的知识体系。像我这种矫情的 J 人,还会给每个文件编排很有规律的文件名再存起来,方便日后查阅。

但 AI 时代这事变了。我每天产出的文件,变成了几十个甚至上百个,原来那套手动体系我已经完全没能力维持了。于是我想了个办法,也做了实践,分享出来希望能给你一点启发。

一个盯着文件夹的本地服务

这个小小的程序,会去监控本地的一个文件夹。每往里放进一个文件,它就用大模型读取文件的内容,给这个文件自动改名、分类,并建立一个完善的索引——这些都是按照我自己的使用习惯来的。

整个设计思路是这样的:我有一个临时文件夹,里面存着所有下载下来的东西,还有别人在聊天软件里传给我的文件。这些文件名字奇奇怪怪、类型五花八门。后台程序会不断监控这个文件夹的变化,判断文件类型:

  • 如果是文档或图片,就交给 Claude,用订阅套餐的额度去读、去看;
  • 如果是音频或视频,就交给 Gemini 去分析。

我要做的只是告诉它一个标准,然后把文件丢进去、等一下。很快它就会按我指定的方式分类、处理,同时建立一个非常完善的索引,方便我自己打开浏览器查阅。它按内容类型分了不同的文件夹,比如我常用的会议记录、口播稿、健康档案、财务信息,还有给客户的提案、我找到的一些知识和方法论。

关键:两层「检索中间层」

这套方式对我这个使用者特别友好。因为我用 AI 输出的很多文件,都是网页文档,或者是没法直接检索内容的音频、视频。而行业里常用的 Obsidian 那种方式,会把所有内容都变成 Markdown 文件来存储和管理——对人来说,看一堆纯文本加各种标记符号是很辛苦的,远不如直接看网页、看方案来得直接。

但反过来,网页和多媒体内容,对智能体来说又是不友好的文档形式。

所以我建了两层所谓的「检索中间层」。目的只有一个:在我需要用、或者 Agent 需要调用的时候,它能知道该找哪个文档、把哪些信息抓进上下文里做进一步处理。大模型分析完一个文件之后,除了给它改一个好记的名字,还会抽象出一层内容梗概,并按我的使用习惯打上标签,形成一个给 Agent 看的目录清单。

如果丢进临时文件夹的是一个文件夹、而不是单个文件,它也会识别——要是识别到这是一个以文件夹形式存储的软件,就会把它打包成压缩文件存起来。整个过程大概在十几秒到二十秒内完成。

演示:根目录的碎文件,十几秒后各归各位

演示一下:现在这个文件夹是已经初步整理好的。我们模拟一个混乱状态,丢给它一些没改名、没分类的文件,看它怎么处理。把要处理的扔进来,等十几秒,它就能完成自动梳理。刷新一下文件夹,根目录下那些碎文件就没了——它们被放进了具体的文件夹里。

打开视频文件夹,能看到它把内容解读之后,用一个标准格式重命名了:一个具体的日期、内容类型、再加一句内容简介。音频也一样。刚才放进去那张图片,被自动识别成了「3D 动漫风格的男性角色全身立绘」存在了对应位置。

这只是最初步的一层整理。它还会关联到我 Claude Code 里的很多定时任务——比如财务文件夹里有发票这种类型,它会定期把发票帮我填好报销单(我另有一期专门讲这个 skill 和填发票的能力)。它也会把这些内容关联到我对应的项目里。怎么做到的?就是因为它给文件夹建了一套非常详细的索引规则和索引层。这是我近期还没归档的、大概九十多个文件,每一个除了文件名,都有一句简短的索引,方便被智能体快速检索和调用。

同样地,我 Claude Code 产出的网页、其他文档、图片,也都会生成在这个临时目录里,实时改名、分类、存储。而且这个过程 CC 是会记住的,这就避免了以前那种想找一个文件却找不到的尴尬。

它不是一个 skill,是一个本地服务

要说明的是:这个功能它不是一个 skill,而是我开发的一个本地服务。大家可以拿走我的源代码,做二次开发和调整——因为每个人整理文件的思路都不一样。但这个方式真的极大满足了我的整理癖,也省了我大量时间。

延伸玩法:抽出你的「身份内核」

还有一些延伸玩法。比如我给客户做咨询时,很多网页里大量包含了我的方法论、我的观点、我的价值排序。我额外会做的一件事,是定期去抽取这些内容,形成一份「身份内核」文档。有了这份文档,Claude Code 在做策划、做方案、做执行的时候,就会按照我的价值排序来决策和执行,让我的 CC 越来越好用。

这就是今天的分享,我们明天再见。


今天这个服务完全开源免费(MIT),仓库在 github.com/xntj-ai/guiwei。它是一个本地后台服务、不是 skill——把代码拿走,配好你自己的大模型 key(文档图片走 OpenAI 兼容接口、音视频走 Gemini),按你自己的整理习惯改改就能用。

文件对人友好的形式,对 Agent 往往不友好——所以我给它建了两层检索中间层。