核心内容摘要
雷电将军的释怀网站:跨越时空的慰藉与新生
哈喽大家好很久都没有更新大模型这块的书了今天给大家说一下这本《大语言模型基础与前沿》本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用涵盖大语言模型的广泛主题从基础到前沿从方法到应用涉及从方法论到应用场景方方面面的内容。
作者简介熊涛美国明尼苏达大学双城分校电子与计算机工程博士。
曾在多家中美知名高科技公司担任高级管理职位和首席科学家在人工智能的多个领域包括大语言模型、图神经网络等从事研发和管理工作多年。
适宜人群本书内容全面、系统性强适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。
书评这本书是这个领域截至目前比较全的文献综述给出了从大语言模型的基本原理到训练大语言模型的分词大语言模型的调优到大语言模型的微调大语言模型的上下文ICL提示词工程大语言模型重点应用的增强检索大语言模型的对齐减毒并行计算硬件架构甚至能源和碳轨迹领域的前沿关键研究论文基本算法的优劣价值和演进方向都给出了简评将近30页的参考文献可见作者是下了功夫的。
我现在讲的这些还是很有限如果你对大模型感兴趣那建议你把这本书看完并吃透它这本书的pdf版本我已经帮你打包好了朋友们如果需要此本 《大语言模型基础与前沿》扫码获取~CSDN大礼包大模型入门最佳书《大语言模型基础与前沿》免费分享**安全链接放心点击**书籍目录第 1章 大语言模型辩论、争议与未来发展方向
1
1 新时代的曙光
1
2 LLM有意识吗
3
3 未来发展方向
1
4 小结 13第 2章 语言模型和分词
1
1 语言建模的挑战
1
2 统计语言建模
1
3 神经语言模型
1
4 评估语言模型
1
5 分词
1
6 小结 27
Transformer
2
1 Transformer编码器模块
2
2 编码器-解码器架构
3
3 位置嵌入
3
4 更长的上下文
3
5 外部记忆
4
6 更快、更小的Transformer
4
7 推理优化
4
8 小结 56
预训练目标和解码策略
5
1 模型架构
5
2 预训练目标
6
3 具有代表性的语言模型
6
4 解码策略
6
5 小结 72
上下文学习和轻量级微调
7
1 上下文学习
7
2 提示语言模型的校准
9
3 轻量级微调
9
4 小结 104
训练更大的模型
1
1 扩大尺度法则
1
2 涌现能力
1
3 人工智能加速器
1
4 并行
1
5 混合训练和低精度训练
1
6 其他节省内存的设计
1
7 小结 137
稀疏专家模型
1
1 为什么采用稀疏专家模型
1
2 路由算法
1
3 其他改进措施
1
4 小结 156
检索增强型语言模型
1
1 预训练检索增强型语言模型
1
2 词元级检索
1
3 通过高效和精简检索进行问答和多跳推理
1
4 检索增强型Transformer
1
5 检索增强型黑盒语言模型
1
6 视觉增强语言建模
1
7 小结 170
对齐语言模型与人类偏好
1
1 基于人类反馈进行微调
1
2 基于语言反馈进行微调
1
3 基于监督学习进行微调
1
4 基于人工智能反馈的强化学习
1
5 基于自我反馈进行迭代优化
1
6 基于人类偏好进行预训练
1
7 小结 193第 10章 减少偏见和有害性
1
1 偏见
1
2 有害性
1
3 偏见和有害性的检测与减少
2
4 小结 206第 11章 视觉语言模型
2
1 语言处理的多模态落地
2
2 不需要额外训练即可利用预训练模型
2
3 轻量级适配
2
4 图文联合训练
2
5 检索增强视觉语言模型
2
6 视觉指令调整
2
7 小结 227第 12章 环境影响
2
1 能源消耗和温室气体排放
2
2 估算训练模型的排放量
2
3 小结 231参考文献 232书籍内容无论如何如果准备all in 大模型这本书是必看除了掌握扎实的基础我觉得这本书重点告诉了我们对待未知领域如何报以科学的态度去学习和认知而不能总像外行一样看热闹而看门道的内行必须以科学的态度大语言模型这本书可以作为看门道的指南。
朋友们如果需要此本 《大语言模型基础与前沿》扫码获取~CSDN大礼包大模型入门最佳书《大语言模型基础与前沿》免费分享**安全链接放心点击**