文件多到管不过来?我做了个本地服务:丢进文件夹,AI 自动改名、分类、建索引
AI 时代,我每天产出的文件从几个变成了几十上百个——网页、方案、音频、视频,名字奇奇怪怪、类型五花八门,原来那套手动命名归档的体系彻底扛不住了。
于是我做了个本地的后台服务:盯着一个「收件」文件夹,每丢进去一个文件,就用大模型读它的内容、自动改名、分类、建索引。十几秒搞定。
在 AI 时代,每个人处理信息的能力都被放大了很多倍。原来我一天可能只读、只写几个文件,还能很规矩地人工管理——用 Obsidian、Notion 或者印象笔记建一套自己的知识体系。像我这种矫情的 J 人,还会给每个文件编排很有规律的文件名再存起来,方便日后查阅。
但 AI 时代这事变了。我每天产出的文件,变成了几十个甚至上百个,原来那套手动体系我已经完全没能力维持了。于是我想了个办法,也做了实践,分享出来希望能给你一点启发。
一个盯着文件夹的本地服务
这个小小的程序,会去监控本地的一个文件夹。每往里放进一个文件,它就用大模型读取文件的内容,给这个文件自动改名、分类,并建立一个完善的索引——这些都是按照我自己的使用习惯来的。
整个设计思路是这样的:我有一个临时文件夹,里面存着所有下载下来的东西,还有别人在聊天软件里传给我的文件。这些文件名字奇奇怪怪、类型五花八门。后台程序会不断监控这个文件夹的变化,判断文件类型:
- 如果是文档或图片,就交给 Claude,用订阅套餐的额度去读、去看;
- 如果是音频或视频,就交给 Gemini 去分析。
我要做的只是告诉它一个标准,然后把文件丢进去、等一下。很快它就会按我指定的方式分类、处理,同时建立一个非常完善的索引,方便我自己打开浏览器查阅。它按内容类型分了不同的文件夹,比如我常用的会议记录、口播稿、健康档案、财务信息,还有给客户的提案、我找到的一些知识和方法论。
关键:两层「检索中间层」
这套方式对我这个使用者特别友好。因为我用 AI 输出的很多文件,都是网页文档,或者是没法直接检索内容的音频、视频。而行业里常用的 Obsidian 那种方式,会把所有内容都变成 Markdown 文件来存储和管理——对人来说,看一堆纯文本加各种标记符号是很辛苦的,远不如直接看网页、看方案来得直接。
但反过来,网页和多媒体内容,对智能体来说又是不友好的文档形式。
所以我建了两层所谓的「检索中间层」。目的只有一个:在我需要用、或者 Agent 需要调用的时候,它能知道该找哪个文档、把哪些信息抓进上下文里做进一步处理。大模型分析完一个文件之后,除了给它改一个好记的名字,还会抽象出一层内容梗概,并按我的使用习惯打上标签,形成一个给 Agent 看的目录清单。
如果丢进临时文件夹的是一个文件夹、而不是单个文件,它也会识别——要是识别到这是一个以文件夹形式存储的软件,就会把它打包成压缩文件存起来。整个过程大概在十几秒到二十秒内完成。
演示:根目录的碎文件,十几秒后各归各位
演示一下:现在这个文件夹是已经初步整理好的。我们模拟一个混乱状态,丢给它一些没改名、没分类的文件,看它怎么处理。把要处理的扔进来,等十几秒,它就能完成自动梳理。刷新一下文件夹,根目录下那些碎文件就没了——它们被放进了具体的文件夹里。
打开视频文件夹,能看到它把内容解读之后,用一个标准格式重命名了:一个具体的日期、内容类型、再加一句内容简介。音频也一样。刚才放进去那张图片,被自动识别成了「3D 动漫风格的男性角色全身立绘」存在了对应位置。
这只是最初步的一层整理。它还会关联到我 Claude Code 里的很多定时任务——比如财务文件夹里有发票这种类型,它会定期把发票帮我填好报销单(我另有一期专门讲这个 skill 和填发票的能力)。它也会把这些内容关联到我对应的项目里。怎么做到的?就是因为它给文件夹建了一套非常详细的索引规则和索引层。这是我近期还没归档的、大概九十多个文件,每一个除了文件名,都有一句简短的索引,方便被智能体快速检索和调用。
同样地,我 Claude Code 产出的网页、其他文档、图片,也都会生成在这个临时目录里,实时改名、分类、存储。而且这个过程 CC 是会记住的,这就避免了以前那种想找一个文件却找不到的尴尬。
它不是一个 skill,是一个本地服务
要说明的是:这个功能它不是一个 skill,而是我开发的一个本地服务。大家可以拿走我的源代码,做二次开发和调整——因为每个人整理文件的思路都不一样。但这个方式真的极大满足了我的整理癖,也省了我大量时间。
延伸玩法:抽出你的「身份内核」
还有一些延伸玩法。比如我给客户做咨询时,很多网页里大量包含了我的方法论、我的观点、我的价值排序。我额外会做的一件事,是定期去抽取这些内容,形成一份「身份内核」文档。有了这份文档,Claude Code 在做策划、做方案、做执行的时候,就会按照我的价值排序来决策和执行,让我的 CC 越来越好用。
这就是今天的分享,我们明天再见。
今天这个服务完全开源免费(MIT),仓库在 github.com/xntj-ai/guiwei。它是一个本地后台服务、不是 skill——把代码拿走,配好你自己的大模型 key(文档图片走 OpenAI 兼容接口、音视频走 Gemini),按你自己的整理习惯改改就能用。
来源:EP0055_audio.mp3 · ASR 模型 gemini-2.5-pro(切段并发) · 原片完整文字版
[00:00] 今天这期内容可以解决 一个大问题 那在 AI 的时代 每个人对于信息的 处理能力增强了非常多倍 原来我们每天可能只能去 读取或者是 输出几个文件而已 我们可以很好的人工的 去进行管理 比如说用到 Obsidian Notion 或者是说印象笔记这样的工具 去建立一个自己的知识体系 那像我这样矫情的 J 人呢 就会给这些文件编排非 常有规律的文件名进行存储 方便我再次的去查阅里面的内容 但是在 AI 时代 这情况变了
[00:25] 每天我产出的文件数量 变成了几十个甚至是上百个 我完全没有能力按照原来的 那套体系 再去做这样的事情 于是我想到一个好的 方法并且做了实践 希望也能够给你带来启示 那这个小小的程序呢 可以去监控本地的 一个文件夹 以至于每放进去一个文件 它都可以去用大模型读 取文件的内容 并且给这个文件自动的更名分类 并且建立一个完善的索引 这一些呢都是按照我的 使用习惯去完成的
[00:50] 那我就带大家来看一下 整个的设计思路 我会有一个临时的文件夹 那这个文件夹里面存放着 所有下载下来的内容 以及在聊天软件里面别 人传给我的东西 那这些文件的名称是 奇奇怪怪的 类型也是非常多的种类的 首先后台的程序会不断地 监控这个文件夹的内容的变化 去判断文件的类型 如果它是一个文档或者是 一个图片 就交给 Claude 用订阅套餐的 额度去读取去看 如果检测到文档的内容是 音频或者是视频 就会给到 Gemini
[01:15] 的模型去分析 我们需要做的只是 告诉他一个标准 并且把文件丢进去 等一下 很快就会按照我指定的方式 进行分类和处理 同时会建立一个非常完善的索引 为了方便我本人打开浏 览器去查阅 它根据内容的类型不同 分了不一样的文件夹 比如说有我常用的会议的记录啊 有我的口播稿 有我的健康档案 甚至是财务的信息 还会有我给客户的提案 和我找到的 一些知识以及方法论 那这样的方式有什么好处呢 它对于我
[01:40] 这个使用者来讲是 非常友好的 因为我用 AI 输出的很多文件 都是网页的文档 或者是没有办法直接检 索到内容的 音频和视频 那像行业里常用的 Obsidian 这样的方式呢 会把所有的内容变成 Markdown MD 的文件 去存储和管理 对于人来讲看一个纯文本的内容 还有各种各样的标记符号 是非常辛苦的一件事情 远远不如我们直接去看网页 或者是看方案来的直接 但网页方案和多媒体的内容对于 智能体来讲它又是 一个不友好的文档形式
[02:06] 所以我就会去建立两层 所谓的检索中间层 目的呢只有一个 就是在我需要使用的时候 或者是在 Agent 需要调用的时候它能知道 需要去找哪个文档 去把哪些信息抓进上下文 进行进一步的处理 那在大模型分析完这个 文件之后呢 除了给它改一个好记的名字 也会抽象出一层内容的梗概层 并且按照我的 使用习惯去打上标签 形成一个给 Agent 看的目录清单 如果丢到这个临时文件夹
[02:31] 里的东西 它是一个文件夹而不是 一个文件的话 也会进行识别 如果它识别到了一个 以文件夹的方式进行存储的软件 会把这个文件夹打包成 一个压缩文件进行存储 整个过程大概是在十几秒 到二十秒的时间内完成的 我也会把这个源代码分享出来 大家可以私信管我要 我们来展示一下整个的 一个操作的过程 现在看到的这个文件夹呢 就是已经初步整理好的 一个文件夹 我们模拟一个混乱的状态 丢给它一些没有进行改名字 没有进行分类的文件
[02:56] 看一下它的这个处理的过程 那我们就把这些需要处理的 扔进来 就去等一下 可以等十几秒钟的时间 它就可以完成一个自动的梳理 那我们只需要刷新这个文件夹 就可以看到它把文件 放到了对应的文件夹里面 非常的丝滑 完成之后可以刷新一下 这个文件夹 你会发现根目录下的 这些碎文件 已经没有了 它们被放到了具体的 文件夹当中 比如说我打开这个视频的文件夹 就可以看到它把内容解读之后 使用了一个标准的 格式进行了重命名 就是一个具体的日期内容的类型
[03:22] 那这个内容的一个简介 那除了视频之外呢 音频也是一样 同样也是这样的一个改名的 一个过程啊 图片刚刚才我们放进来那个图片 自动识别成了一个 3D 动漫风格的 男性角色全身的立绘存在了这里 那这只是最初步的 一层整理啊 还会关联到我 Claude Code 里面很多的 定时任务比如说 在财务文件夹当中有一 种发票的类型 它会定期的把发票帮我填好 报销单 我有另外一期视频是讲 这个 skill 和填发票的这个能力的
[03:47] 那它也会把这些内容去 关联到我对应的项目当中 那是怎么实现的呢 是因为它给这个文件夹 建立了一个 非常详细的 索引规则和索引层 这是我近期还没有归档的 大概 90 多个文件在这里面 每一个除了文件名之外 都会有一个简短的索引 以至于它可以被智能体快速的 进行检索和调用 那同样的我的 Claude Code 产出的 网页也好其他类型的 文档也好图片也好 也都会生成在这个临时 文件的目录里面
[04:12] 实时的进行改名分类和存储 而且这个过程 CC 是会记住的 这也就避免了 我们之前出现的那种 想要找一个文件 找不到的那样尴尬的情况 那这个功能它不是一个 skill 啊 它是开发了一个本地的服务 大家可以拿走我的源代码 进行二次的开发和调整 因为每个人整理文件的 思路是不一样的嘛 但这个方式真的极大的满足了 我的整理癖和节省了我的时间 那还有一些延伸的玩法 比如说我在给客户的咨询当中 有很多的
[04:37] 网页里面会大量包含了 我的方法论我的观点和我的 价值排序 我额外还会做的一件事情是 定期去抽取这些内容 形成我的身份内核的一个文档 那有了这样的一个文档 Claude Code 在做策划在做方案 在做执行的时候 就会按照我的价值排序 进行决策和执行 会让我的 CC 变得越来越好用那这就是 今天我给大家带来的分享 我们明天再见拜拜