bbbbb:一场关于无限可能的味蕾探险

核心内容摘要

当我穿越成了NPC,还被大佬盯上了!——湮灭世界生存指南
梦幻降临现实:吴梦梦《到粉丝家》第二季重磅回归,谁才是那个幸运儿?

抖音快手闪现集合:潮流风暴,点燃你的无限可能!

https://www.bilibili.com/video/BV1iC4LzpE7p你提到的视频《RAG已死Claude Code核心开发者抛弃RAG》中Claude Code 的核心开发者 Boris 提出了一种“完全不做索引”的反直觉检索方式——这实际上是在挑战传统 RAGRetrieval-Augmented Generation依赖向量数据库 embedding 检索的范式。

而你问的“有没有考虑过 AI 自己 grep 调用记忆”其实正契合了这一新思路的核心思想之一。

✅ 什么是 “AI 自己 grep 调用记忆”这里的 “grep” 是一个比喻指的是不预先构建向量索引而是让大模型在需要时直接对原始文本如代码库、文档、日志等进行关键词或语义匹配式的“扫描”或“搜索”类似于程序员用grep在代码中查找字符串。

这种做法看似低效但在以下条件下变得可行甚至更优上下文窗口极大如 Claude

5 Sonnet 支持 200K tokens模型本身具备强大的长文本理解与定位能力避免 embedding 偏差embedding 可能丢失细节、受训练数据限制简化系统架构无需维护向量数据库、同步索引、处理 chunk 切分等问题。

视频中的核心观点 vs “AI 自己 grep”Boris 的做法本质上就是让模型直接读取整个代码库或文档集作为上下文然后靠自身能力“找到”相关部分——这正是“AI 自己 grep”的体现。

他提到“我们发现只要把整个项目文件塞进上下文模型自己就能精准定位到需要修改的函数效果远超 RAG。

”这背后有几个关键优势零信息损失原始文本完整保留没有 chunk 切断或 embedding 降维动态推理模型可根据任务需求灵活关注不同部分而非受限于检索结果减少 token 浪费传统 RAG 检索可能返回大量无关 chunk反而污染上下文。

这算不算 “AI 拥有记忆”严格来说这不是“记忆”而是“即时访问外部知识”。

但若将整个代码库/文档视为其“扩展记忆”那么传统 RAG 有索引的记忆像图书馆目录Claude Code 方式 把整本书摊开让 AI 自己翻像拥有 photographic memory未来方向可能是对小规模、高价值数据如个人笔记、私有代码——直接全量注入上下文对超大规模数据如整个互联网——仍需高效检索但可能结合混合策略如先粗筛再精读。

总结是的视频中提出的方法本质上就是“让 AI 自己 grep 调用记忆”——它放弃传统 RAG 的索引机制转而依赖大模型在超长上下文中的自主检索能力这在长上下文模型普及的今天正成为一种更简洁、更可靠的新范式。

这也解释了为什么越来越多人说“RAG 已死Context is King.”如果你感兴趣还可以关注“In-context retrieval”或“Naive RAG” vs “Agentic RAG”的讨论这正是当前 AI 工程化的重要演进方向。

大象回家永不迷路2024免费观看-大象回家永不迷路2024免费观看应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123