查看: 1|回复: 0

Andrej Karpathy 今天分享的 LLM 知识库一体化的构建方法确实给我带来很多启发。

[复制链接]

8

主题

0

回帖

24

积分

新手上路

积分
24
发表于 昨天 21:59 来自手机 | 显示全部楼层 |阅读模式
Andrej Karpathy 今天分享的 LLM 知识库一体化的构建方法确实给我带来很多启发。

回到实际操作中,说说我在处理个人知识库中碰到一些非常磨人的问题和痛点:

1. 入库的摩擦力:

看到不错的文字内容或者网页,很难做到一键转换 Markdown 入库(我用 GitHub 私有仓库)。经常要做一些复制粘贴的零碎工作。虽然有人觉得通过 Skill 可以一行命令实现,但这种通过 agent 抓取、分析然后再转换成 markdown 的流程,实际运行速度通常比手动复制粘贴还要慢得多,尤其在等着文档做进一步处理时,效率很低,另外还有一定失败率。

2. 翻译的低效:

如果要经常看英文文档,想翻译成中文最方便的自然是 Chrome 自带翻译,但其翻译质量一般。更好的翻译质量又很难做到一键实现,大模型 Web 端的翻译还经常莫名其妙地“丢段落”。

3. AI 对话的沉淀:

跟 AI 对话经常产生不少对自己非常有价值的信息,但目前也做不到自动入库,还是得靠复制粘贴这种碎活。

4. 图片的尴尬地位:

图片在大模型世界里像是个另类,大部分情况 LLM 对图片视而不见。但从知识库角度看,“一图胜千言”,图片对人的价值巨大。目前没有特别好的图片处理方法,导致图片入库积极性大大降低。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部