首页速度优化当安全测试遇上大模型：误报率下降50%的技术实践

网站优化

EcomGPT-7B快速入门：10分钟完成首次API调用与商品标题生成

如何通过 NVIDIA DGX A100 显卡服务器，优化 AI 医疗影像分析中的数据处理与模型推理速度？

2026-06-08 22:45:31

阅读时长:5分钟

562次阅读

核心内容摘要

游戏自动化助手：彻底解放双手，实现《Limbus Company》效率提升新突破

如何安全获取红米AX3000路由器的SSH权限：开启网络定制新可能

现在训练一个GPT-2级别的LLM大语言模型成本已经低于100美元。

Andrej Karpathy的个人项目nanochat迎来重大更新。

现在训练一个GPT-2级别的LLM大语言模型成本已经低于100美元。

具体来说在单个8XH100节点上仅需3小时花费约73美元。

Karpathy直言GPT-2是他最喜欢的LLM因为它是LLM技术栈首次以现代形式整合在一起的标志。

这也成了他某种“奇怪且持久的执念”利用过去7年的技术进步以极低的成本将模型训练到GPT-2的能力水平。

他一直怀疑如今要在100美元以内实现这一目标完全是可行的。

而现在的nanochat做到了7年600倍的成本缩减让我们把时间拨回2019年。

当时OpenAI为了训练GPT-2使用了32个TPU v3芯片耗时168小时整整7天。

按照当时每小时8美元的TPU价格计算总成本约为

3万美元那个模型在CORE评分DCLM论文提出的一种综合指标涵盖ARC/MMLU等22项评估上得分为

256525现如今随着nanochat合并了一系列改进许多源自modded-nanogpt仓库Karpathy在单个8XH100节点上仅用

04小时约73美元就达到了更高的CORE评分这不仅仅是快了更是省了。

这是一次跨越7年的600倍成本降低。

换算下来训练GPT-2的成本大约每年下降

5倍。

Karpathy认为这个数字可能还是被低估了。

因为他目前仍在定期发现更多的改进空间手头还有一个充满想法的积压清单等待尝试。

核心优化技术栈为了达到这个效果Karpathy列出了几项“开箱即用”且效果立竿见影的关键改进Flash Attention 3 kernels速度更快并且允许使用window_size参数来获得交替的注意力模式。

Muon 优化器Karpathy表示自己曾尝试花了一天时间去掉它只用AdamW但没能成功Muon不可或缺门控残差路径和跳跃连接由可学习的标量进行门控Value Embeddings值嵌入当然还有许多较小的优化叠加在一起产生了最终的效果。

“通往GPT-2”排行榜受modded-nanogpt的启发Karpathy还专门创建了一个“通往GPT-2时长”time to GPT-2的排行榜。

目前这个首发的“Jan29”模型以

04小时的成绩位列榜首。

Karpathy希望nanochat能成长为一个非常精简且经过调试的实验性LLM工具用于原型设计、娱乐当然还有学习。

他对此充满期待并欢迎大家一起来迭代。

关于优化的详细细节和复现指南Karpathy已在GitHub上发布了详细的长文。

他还放出了一张推导当前nanochat模型系列Scaling Laws缩放定律的图表并称之为“令人满意的视觉糖果”Github讨论页指路https://github.com/karpathy/nanochat/discussions/481

9·1免费版破解版苹果-9·1免费版破解版苹果应用

相关标签

污出天际，燃爆眼球：那些让你惊呼“还有这种操作”的网站 18-XXXXXL18-19D18触屏：不止于大，更在于“芯”的智慧交互体验节奏律动，永不落幕：Beatbox笔盒，你的掌上音乐宇宙 ADC影视官方版：重塑数字视听边界，深度解析年龄确认与实名认证下的纯净感官盛宴探索17C永久隐藏入口：解锁无限可能的新纪元探索“男女差差差差差差”的深层魅力：打破藩篱，拥抱多元黑土翻白眼奥义：从凡俗到升华的觉醒之旅探索精彩无限：免费观看丸崽全集入口，开启你的娱乐新纪元极速光影，盛夏预演：揭秘“婷婷五月播播”最新动态的华丽蜕变寂夜私语：18世界的深度探索与心动之旅彻底告别片荒！解锁B站隐藏的真人影视宝库，这份“免费大片清单”请收好西施：倾国倾城的泪，王者荣耀里的别样风华 51吃瓜网-热心的朝阳群众，分享每日新鲜事儿日本旅游胜地大比拼：AAA与AAAAA，你的心选是哪个？

雷神入夜狂飙：高清壁纸点燃你的视觉盛宴

2026-06-08 22:45:31 5分钟阅读

城市脉搏：一场意外邂逅的柔软叙事

2026-06-08 22:45:31 1分钟阅读

斗罗大陆：比比东的“不亦乐乎”，爱恨交织的权力游戏

2026-06-08 22:45:31 2分钟阅读

EcomGPT-7B快速入门：10分钟完成首次API调用与商品标题生成

核心内容摘要

如何安全获取红米AX3000路由器的SSH权限：开启网络定制新可能

3万美元那个模型在CORE评分DCLM论文提出的一种综合指标涵盖ARC/MMLU等22项评估上得分为

256525现如今随着nanochat合并了一系列改进许多源自modded-nanogpt仓库Karpathy在单个8XH100节点上仅用

04小时约73美元就达到了更高的CORE评分这不仅仅是快了更是省了。

5倍。

04小时的成绩位列榜首。

9·1免费版破解版苹果-9·1免费版破解版苹果应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

百度百家号客服电话人工服务

EcomGPT-7B快速入门：10分钟完成首次API调用与商品标题生成

核心内容摘要

如何安全获取红米AX3000路由器的SSH权限：开启网络定制新可能

3万美元那个模型在CORE评分DCLM论文提出的一种综合指标涵盖ARC/MMLU等22项评估上得分为

256525现如今随着nanochat合并了一系列改进许多源自modded-nanogpt仓库Karpathy在单个8XH100节点上仅用

04小时约73美元就达到了更高的CORE评分这不仅仅是快了更是省了。

5倍。

04小时的成绩位列榜首。

9·1免费版破解版苹果-9·1免费版破解版苹果应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

相关优化文章 推荐

百度百家号客服电话人工服务

相关优化文章推荐