核心内容摘要
SiameseUIE模型安全加固:对抗样本防御方案
相信很多朋友都看过这篇论文在 2023 年 3 月一支来自中国人民大学的团队发表了一篇大模型综述《A Survey of Large Language Models》如果还是觉得陌生那么你一定在各类研报、文章等渠道中看过这张图而它就出自这篇综述。
该项目发展历程
综述爆火如今更新到第 13 个版本包含了 83 页的正文内容并收录了 900 余篇参考文献。
论文地址https://arxiv.org/abs/
2303.
2023 年 8 月发布了该综述v10的中文翻译版。
在 2023 年 12 月底为更好地提供大模型技术的中文参考资料团队启动了中文书的编写工作并且于 2024 年 4 月 15 日左右完成初稿。
该书共 391 页参考文献共 447 篇旨在为对大模型技术感兴趣的初学者提供全面介绍展示整体框架和发展方向。
温馨提示该书适合有一定深度学习知识的高年级本科生和低年级研究生阅读可以作为入门大模型技术的首选书籍已经推荐给身边的学弟学妹了。
该书一共五大部分包括大模型基础、大模型预训练、大模型微调、提示词、智能体、大模型在研究/专业领域的应用等。
里面有非常多精彩的解读与数据整理比如 LLaMA 系列模型衍生工作进化图。
也有当下热门的智能体Agent相关介绍。
再比如各专业领域内代表性的大语言模型与数据资源。
为了更好地整理和传播大模型的最新进展与技术体系官方也为读者提供了以下相关资源LLMBoxLLMBox 是一个全面的代码工具库专门用于开发和实现大语言模型其基于统一化的训练流程和全面的模型评估框架。
LLMBox 旨在成为训练和利用大语言模型的一站式解决方案其内部集成了大量实用的功能实现了训练和利用阶段高度的灵活性和效率。
YuLan 大模型YuLan 系列模型是中国人民大学高瓴人工智能学院师生共同开发的支持聊天的大语言模型名字”玉兰”取自中国人民大学校花。
最新版本从头完成了整个预训练过程并采用课程学习技术基于中英文双语数据进行有监督微调包括高质量指令和人类偏好数据。
希望通过阅读本书大家能够深入了解大模型技术的现状和未来趋势为自己的研究和实践提供指导和启发。
想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2026 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容
学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI
100本大模型方向电子书
26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC
实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。
600套技术大会 PPT听行业大咖讲实战PPT 整理自
年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。
求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌
107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自
年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析
102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑
97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”
路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。
L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、
关键技术以及大模型应用场景。
L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。
L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。
L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。
L5阶段专题集丨特训篇 【录播课】