核心内容摘要
手把手教你用iKuai软路由搭建PXE无人值守装机环境(附排错指南)
继续看技术看几个点。
关于RAG幻觉的内容我们讲过很多这次再回顾下温故知新看一个技术
总结。
另一个是看看文生科学图【教材这种学科图】这块的点对比下已有方案有一些设计思路。
技术总是有趣的从基本问题出发多
总结多归纳**多从底层实现分析逻辑**会有收获。
RAG系统的6个幻觉问题及4个缓解阶段策略
总结来看RAG的的幻觉问题其实RAG本身通过融合外部知识库提升事实依据输出可信度与可解释性但检索器与生成器的复杂交互引入新幻觉如检索过时/无关信息导致误导。
所以针对这个问题可以再搞了包含查询优化T
参考识别T
提示工程T
响应修正T4的归因流水线具体工作在《Attribution Techniques for Mitigating Hallucinated Information in RAG Systems: A Survey》(https://arxiv.org/pdf/
2601.
还定了个涵盖过度自信、过时性、不可验证性、指令偏离、上下文不一致、推理缺陷的6类RAG特有幻觉分类体系是一个不错的索引如下图所示我们
总结性看幻觉类型体系以及对应的缓解策略
RAG系统的6个幻觉类型RAG系统特有6类幻觉核心区别在于定义与发生阶段核心依据是幻觉源于检索器证据质量问题还是生成器内容生成问题具体分为如下几个一个是过度自信生成器阶段不确定信息绝对化。
缓解方案有包括T3VUC添加模糊词、T4RLKF校准置信度、SelfCheckGPT多响应一致性校验。
一个是过时性检索器阶段信息因时间失效。
缓解方案有包括T1添加时间关键词、T2DPR评估时效性、WebGPT实时检索一个是不可验证性检索器生成器阶段缺乏足够参考支持。
缓解方案有包括T2REPLUG重排参考、T4Self-Refine补充证据、AGREE检测未验证内容。
一个是指令偏离检索器生成器阶段未遵循用户指令。
缓解方案有包括T1MixAlign澄清模糊查询、T2Self-RAG语义对齐重排、T3UPRISE匹配提示模板。
一个是上下文不一致生成器阶段与检索参考矛盾。
缓解方案有包括T3RECITE引导引用参考、T4SourceCheckup语句级一致性校验一个是推理缺陷生成器阶段逻辑矛盾或推理链断裂。
缓解方案有包括T3SubgraphRAG结构化推理提示、T4SearChain修正推理链
缓解幻觉的四个模块T1至T44个模块按“检索前-检索后-生成前-生成后”流程其中检索器导向T
T2聚焦生成前的证据质量优化提升检索内容的相关性、时效性、可验证性**生成器导向T
T4**聚焦生成过程与结果的校准规范生成逻辑、修正事实错误、校准置信度。
具体的预检索查询优化T1阶段优化原始查询提升检索相关性与时效性将原始查询q优化为q’提升检索相关性与时效性。
代表性的有SmartBook添加时间关键词、WebCPM同义词替换/释义后检索参考识别T2阶段筛选核心参考内容解决不可验证性、过时性幻觉从检索结果R’中筛选核心参考R_final。
代表方案有DPR稠密检索、CoDA优先时效性参考、SELF-RAG重排参考预生成提示工程T3阶段构建结构化提示引导生成器接地缓解过度自信、推理缺陷等代表方案有VUC添加模糊限制词、UPRISE动态选择提示模板、SubgraphRAG知识图谱结构化提示后生成响应修正T4阶段校验并修正生成结果修正上下文不一致、不可验证性等残留幻觉。
代表方案有A_gen RLKF奖励模型惩罚虚假自信、Self-Refine自我批判修正、CoVe验证链修正
再看科研文生图方案及评估思路接着看科研文生图方案及评估进展讲的故事是现有AI画图比如画物理受力图、化学分子结构看着像那么回事但经常犯科学错误比如把三角形角度画错、分子键数不对这就是“看着对、逻辑错”。
所以就搞点故事工作在《Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility》,https://SciGenbench.github.io,https://arxiv.org/pdf/
2
17027做个比对实验搞个数据然后对比下。
具体看
两种画图思路对比一种是直接画像素比如常见的AI画图工具【端到端将文本描述转换为像素图像闭源Nanobanana-Pro、GPT-Image-
1.
Flux2-flex开源HunyuanImage-
3.
Qwen-Image】优点是画得好看逼真缺点是容易出错另一种是先写代码再生成图他们叫ImgCoder【理解提取实体与关系→规划定义内容、布局、标签、约束→编码生成可执行代码如ImgCoderQwen3-ImgCoder、Gemini3-Pro-ImgCoder等变体】比如用Python代码定义好坐标、角度再画图优点是绝对精准缺点是样式比较单一不够生动
建专门的“科学画图考试题库”SciGenBench数据集上包含数学、物理、化学、生物等5个学科25种图比如电路图、分子结构、几何图形共1400道题专门用来测试AI画的图“科不科学”而不是只看“好不好看”然后效果评估方面使用Gemini3-Flash评分
分评5项指标正确性与保真度、布局与精度、可读性与遮挡、科学合理性、表现力与丰富度【这是维度设计】结论方面用代码画图的ImgCoder在精准度上更高比如画函数曲线不会错直接画像素的AI在视觉效果上更优用这些画得又对又好的图去训练大模型【使用合成图像微调Qwen3-VL-8B-Instruct】能让大模型做科学题比如几何证明、物理计算的能力变强【绝对提升
7分】数据越多效果越好。
。
## 学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】