核心内容摘要
PDF-Extract-Kit-1.0部署全流程:从零开始到成功运行
视觉化解读上下文工程正变得越来越重要但我们觉得很多人仍然难以真正理解它的实际含义。
今天让我们以逐步的方式来全面了解上下文工程的一切我们开始吧简单来说上下文工程就是一门艺术兼科学其核心是在恰当的时间、以恰当的形式将恰当的信息提供给你的LLM。
以下是Andrej Karpathy关于上下文工程的一段引语…要理解上下文工程首先必须理解上下文的含义。
如今的智能体已经演变成远不止聊天机器人。
下图
总结了智能体正常运作所需的六种上下文类型它们是注在人工智能领域“上下文”通常指模型处理任务时参考的额外信息如用户输入的背景或历史数据“智能体”则指能够自主感知环境、决策并行动的AI系统例如基于大语言模型的程序这些概念是理解上下文工程的关键。
指令示例知识记忆工具护栏这告诉你仅仅“提示”智能体是不够的。
你必须对输入上下文进行工程化。
这样想如果LLM是CPU。
那么上下文窗口就是RAM。
本质上你是在用完美的指令为你的人工智能编“RAM”。
我们该怎么做呢上下文工程可以分解为4个基本阶段这里的比喻将大语言模型LLM比作计算机的中央处理器CPU上下文窗口比作随机存取存储器RAM。
CPU负责处理信息RAM存储当前使用的数据类似地LLM处理输入指令上下文窗口则提供处理所需的信息。
通过精心设计上下文编程“RAM”我们可以优化AI的性能和输出。
|编写上下文选择上下文压缩上下文隔离上下文让我们逐一理解每个阶段…
编写上下文编写上下文指的是将上下文保存在上下文窗口之外以帮助智能体执行任务。
注上下文窗口context window指大语言模型处理输入时能考虑的最大文本长度类似于计算机内存。
智能体agent在人工智能中指能够感知环境并自主执行任务的系统如聊天机器人或自动化程序。
您可以通过将其写入以下位置来实现长期记忆跨会话持久保存短期记忆在会话内持久保存状态对象
读取上下文读取上下文指的是将其拉入上下文窗口以帮助智能体执行任务。
上下文窗口是大语言模型LLM中一次性能处理的文本序列的最大长度。
将上下文拉入窗口意味着使模型能够访问这些信息以进行推理或生成。
这个上下文可以从以下来源拉取工具内存知识文档向量数据库
压缩上下文压缩上下文意味着只保留任务所需的token。
“知识”在这里指用于存储信息的数据库如文档或向量数据库后者专门处理高维向量数据常用于机器学习中的相似性搜索。
“压缩上下文”是一种优化技术通过筛选输入数据仅保留对当前任务最重要的部分以减少计算开销并提高效率。
而“token”是大语言模型处理文本时的基本单位通常对应单词或子词。
检索到的上下文可能包含重复或冗余信息例如多轮工具调用从而增加额外token消耗和成本。
上下文
总结在这里能发挥作用。
隔离上下文隔离上下文涉及将其分割开来以帮助智能体执行任务。
一些流行的实现方式包括使用多个智能体或子智能体每个都有其自己的上下文使用沙盒环境来存储和执行代码以及使用一个状态对象因此本质上当你构建一个上下文工程工作流时你是在工程化一个“上下文”管道以便让大语言模型在正确的时间、以正确的格式看到正确的信息。
这正是上下文工程的工作原理就像你工程化特征以使机器学习模型工作一样…那些对输出没有贡献的特征应该被移除高度相关的特征在某些情况下可能帮助不大等等……类似地你工程化大语言模型的上下文使其能够准确响应。
特征工程是数据科学中预处理数据的关键步骤通过选择和构造相关特征来提升模型性能。
类比到上下文工程是通过设计输入上下文的结构和内容来优化大语言模型的输出。
最后唠两句为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200% 远超其他行业平均水平整个人工智能行业的求职增速达到
3
4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升
6
6%。
AI产业的快速扩张也让人才供需矛盾愈发突出。
麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。
那0基础普通人如何学习大模型 深耕科技一线十二载亲历技术浪潮变迁。
我见证那些率先拥抱AI的同行如何建立起效率与薪资的代际优势。
如今我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理分享于此为你扫清学习困惑共赴AI时代新程。
我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。
零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。
业务赋能 突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。
获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】