首页速度优化面试题：AI应用架构师的算力规划常见面试问题与答案

网站优化

第2章Java基本语法(上): 变量与运算符--标识符变量

Qwen3-TTS-12Hz-1.7B-Base代码实例：Python调用+Web界面实操手册

2026-06-12 12:58:59

阅读时长:7分钟

562次阅读

核心内容摘要

Modbus RTU/TCP 高性能仿真与采集系统实战：应对每秒 10MB 数据洪流的设计与优化

什么是模型管理平台？OpenCSG如何构建企业级AI基础设施

原文towardsdatascience.com/llms-are-dumber-than-a-house-cat-81e7b3d63190挫折困惑或许“缺乏优雅”是一个更好的表达。

这是当你看到顶级科学家对已经理解的技术感到惊奇时所感受到的痛苦。

AI 影响者用惊奇牌来吸引点击但对于科学家和工程师来说情况就不同了。

一旦你揭开了魔术的真相它就会消失。

因此看到微软等公司的研究人员在 GPT-4 发布四个月后还用“不可能”、“疯狂”和“惊人”这样的词来描述它真是让人感到刺痛。

cdn.embedly.com/widgets/media.html?typetext%2Fhtmlkeya19fcc184b9711e1b4764040d3dc5c07schematwitterurlhttps%3A//twitter.com/Nabil_Alouani_/status/1742870695929889050image并不是特别针对 Sebastian Bubeck但如果自动补全功能可以“震撼他的心灵”想象一下这对普通用户的影响。

开发者和数据从业者每天都在使用大型语言模型LLM来生成代码、合成数据和文档。

他们也可能被夸大的能力所误导。

错误发生往往是在人类过度信任工具的时候。

TL;DR:这是一个反炒作的观点你将了解 LLM 是如何工作的为什么它们很愚蠢以及为什么它们仍然非常有用——尤其是在有人的情况下。

忙碌人士对 LLM 的入门介绍如果一个 LLM 是一个文件夹它会有两个文件第一个是可以执行代码第二个是填充着数字的大型 CSV表格文件。

代码定义了你的模型神经网络的架构以及运行它的必要指令。

这就像告诉你的计算机如何组织自己以执行特定类型的计算。

CSV 文件是一长串数字列表称为权重。

这些权重决定了你的人工神经网络神经网中的神经元如何行为。

想象一个神经网就像一个厨师试图完善一个食谱。

每个成分输入都可能极大地改变菜肴输出的味道。

神经网的权重代表了每个成分的精确测量值。

就像厨师调整每个成分的量以改善味道一样神经网调整每个输入的权重以获得期望的结果。

随着时间的推移和重复训练厨师学会了调味的平衡——神经网络也是如此。

它学会了最优的权重以做出准确的预测或决策。

每一个成功的食谱通过试错法精炼都会记录下精确的测量值。

那就是你的 CSV 文件。

那就是你的权重集合。

就像训练一位技艺高超的厨师需要时间和资源一样权重也是昂贵的。

你必须向你的模型注入大量数据并让它连续训练数天。

你还需要专门的计算机称为 GPU以同时运行多个计算并行处理。

例如Meta 的 Llama2 70B 模型使用了 6,000 个 GPU 进行了 12 天的训练观看视频达到了 2 百万美元的成本。

是的这只是为了获得权重。

链接一旦你支付了数百万美元来获取你的“秘方”你可以无限期地重复使用它们成本只是几分钱。

每次你将一个秘方应用于一系列原料时你就是在执行我们所说的“推理”。

这些“秘方”比厨师的要复杂一些。

它们包括数千篇科学文献、小说和博客文章。

几乎任何在线发布的单词序列——包括废话——都会进入 LLM 的训练数据中。

到目前为止你有一个“预训练”的模型它还不能回答你的问题。

你得到的是“预测下一个标记”。

你给模型一系列单词然后它想象可能的延续。

例如你说“生命、宇宙和万物的终极问题的答案是……”然后模型会说“42”。

现在如果你向你的预训练模型提问“法国的首都是什么”它可能会说“西班牙的首都是什么”因为它在成千上万的在线测验中看到过这种模式。

如果你想让你的模型回答问题你需要添加额外的步骤。

微调你整理了一份问题Q和适当的答案A的列表并将这些 Q/A 对输入到你的模型中。

然后模型会根据你提供的示例学习回答问题。

指南更多微调在这个步骤中你添加了安全护栏提高了准确性并调整了语气。

指南技术涉及进一步的微调、评分RLHF和编写核心提示。

令人印象深刻的是你保留了预训练模型的“幻想”能力并在其之上添加了问答能力。

经过训练和几个微调步骤后你得到的东西就像 ChatGPT Classic——一个可以回答你的问题并生成各种输出的聊天机器人。

然而很多人没有意识到你现在非常有用的助手 LLM 仍然在为每个答案冥思苦想。

LLMs 不会思考它们 24/7 都在产生幻觉。

当人们说“LLMs 产生幻觉”时他们通常是指“LLMs 产生事实错误”。

这种解释离目标还有几英里。

“当我被问到 LLMs 中的‘幻觉问题’时我总是有点挣扎。

因为从某种意义上说幻觉就是 LLMs 所做的一切。

它们是梦境制造机。

” —— “安德烈·卡帕西OpenAI 联合创始人。

”LLMs 就像自由式说唱者。

它们并不太关心准确性。

他们的目标是根据你给出的提示生成一个合理的答案。

就像即兴创作歌词的说唱者一样LLMs 一次预测一个标记——同时试图保持在对上下文的接地感。

cdn.embedly.com/widgets/media.html?srchttps%3A%2F%2Fwww.tiktok.com%2Fembed%2Fv2%2F7296510861110185246display_nametiktokurlhttps%3A%2F%2Fwww.tiktok.com%2F%40harrymackofficial%2Fvideo%2F7296510861110185246imagehttps%3A%2F%2Fp16-sign-va.tiktokcdn.com%2Fobj%2Ftos-maliva-p-0068c799-us%2F8b00880beea148ef96795c4e9f989b94_1698851338%3Fx-expires%3D1703689200%26x-signature%3Do5iHNiCUrXqM0g23T8U7WGnSEoc%253Dkeya19fcc184b9711e1b4764040d3dc5c07typetext%2Fhtmlschematiktok当然LLMs 会从它们训练阶段获得的知识中汲取信息但在撰写回复之前它们并不进行推理。

准确性仅仅是由于巧妙的方法而产生的一个积极的“副作用”。

假设你正在构建一个 LLM。

你的最终目标是生成事实信息。

如果你将人类所写的内容全部压缩成“知识配方”那么当你尝试预测下一个词语时你应该能够得出事实对吧在某种程度上你是在打一个赌即大部分训练数据都是事实。

然后通过微调和安全指南你增加了成功的机会。

事实输入事实输出。

然而你的 LLM 本身并不对什么是真什么是假进行推理。

它只是根据之前看到的语言模式预测最可能出现的词语。

这就是人们为什么称 LLMs 为胡说八道机器的原因。

这不是指该词的俚语含义而是指哲学上的含义。

哲学家哈里·弗兰克福特将胡说八道描述为与现实脱节的信息。

当你撒谎时你会扭曲现实。

当你讲述真相时你描述你对现实的表征。

但当你胡说八道时你会不考虑现实或真相地编造事物。

正是这种对真理关注度的缺乏——这种对事物真实状态的漠不关心——我认为是胡说八道的本质所在。

*这指向了垃圾话本质的一个相似且基本方面尽管它是在不考虑真相的情况下产生的但它不必是错误的。

——《垃圾话》哈里·法兰克福. [作者强调].“但是真的有必要进行推理吗”你可能问。

“如果我们有大量干净的数据预测下一个标记应该能让我们达到一个创意的事实喷射机甚至可能是 AGI……不是吗”保持这个想法。

失落在压缩中OpenAI 的联合创始人之一伊利亚·苏茨克维认为: “预测下一个标记嗯意味着你理解了导致该标记产生的底层现实。

”伊利亚是当今世界上最聪明的人之一但他并非对逻辑谬误免疫。

cdn.embedly.com/widgets/media.html?srchttps%3A%2F%2Fwww.youtube.com%2Fembed%2FYEUclZdj_Sc%3Fstart%3D1%26feature%3Doembed%26start%3D1display_nameYouTubeurlhttps%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DYEUclZdj_Scimagehttps%3A%2F%2Fi.ytimg.com%2Fvi%2FYEUclZdj_Sc%2Fhqdefault.jpgkeya19fcc184b9711e1b4764040d3dc5c07typetext%2Fhtmlschemayoutube人类语言是现实的压缩版本但它是一种有损压缩。

当你将现实的描述压缩成一系列词语时你会丢失信息。

当你压缩一张图片或一个 Excel 表格时你会得到一个 zip 文件。

如果你右键点击并提取内容你可以恢复之前压缩的 100%信息。

与人类语言不同。

当有人告诉你“想象一只紫色的大象飞越一片橙色的海洋”时他们正在将一个虚构场景压缩成九个词语。

很可能你只是将上一句话解压缩成你脑海中播放的短视频。

欣赏你如何获得一般概念但一些关键信息在压缩中丢失了。

你不知道大象的确切大小。

你不知道它是什么紫色的以及它是不是一个生物大象还是一个人工大象。

此外是什么让海洋变成橙色的它有什么样的波浪当然你可以添加词语来弥补缺失的信息——颜色、质地和速度仅举几例。

但为了让这些额外的描述有意义你需要能够模拟它们的意义。

如果大象是由肝磷脂制成的并以三倍音速飞行呢如果你没有“肝磷脂”和“三倍音速”的模型你的解压缩就会失败。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/f0a63bf089beb00f3e4f377b1e1c4d

pngHepatizon 是一种古老的紫色金属Mach-3 是音速的三倍。

你使用人类语言来编码现实但你需要比语言更多的东西来解码它。

想想符号、逻辑、心理模拟和对物理定律的理解。

现在让我们将 LLMs 加入这幅画面。

LLMs 是人类语言的压缩——而且它也是一种有损压缩。

你压缩两次信息就会丢失两次。

这意味着你离现实的真实表征越来越远。

同样的逻辑也适用于存在紫色金属大象以亚音速飞行的替代现实。

如果你不掌握现实所遵循的物理定律你就无法模拟假设的现实。

让我们用一个例子来说明。

Sanjok 谜题My friend,whos about33feet(10meters)awayfromme,very playfully,gently,andslowly throws a Sanjok at me.A Sanjokisa pillow-likeobjectmade of a special kind of steel:a state-shifting steel.The state-shifting ability activates only when the Sanjokistraveling through the air.Every second,the steel switches backandforthfrombeingaslightasa bag of feathers to a state where itsasheavyasa giant boulder.This means the total weight of the Sanjok can varyfrom1pound(

45kg)to5,000pounds(2268kgs)--andvice versa.Whosindanger? What should I do?花上一分钟。

你可能还需要一张纸。

准备好答案了吗让我们先看看 ChatGPT-4 的答案https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/40c652c851e02f56a35d4a9836c75bd

png这里是依据力学物理和简单启发式方法的事件顺序。

你的朋友扔出 Sanjok。

这是一个缓慢、轻柔的投掷速度大约为每秒 10 英尺3 米。

在第一秒内Sanjok 处于“轻模式”重量为一磅

45 千克。

在空中飞行一秒后Sanjok 切换到“重模式”。

现在 Sanjok 的重量为 5,000 磅2,268 千克。

让我们在这里“暂停”时间。

Sanjok 现在悬挂在空中高度为 6 英尺2 米。

它距离你的朋友 10 英尺3 米距离你 23 英尺7 米。

Sanjok 的重量抵消了你朋友弱投掷的初速度。

Sanjok 将从 6 英尺2 米的高度开始自由落体。

现在按“播放”。

5,000 磅的 Sanjok 大约需要

64 秒落地。

牛顿和伽利略可以作证。

考虑到 Sanjok 的重量你可以忽略所有外部力如空气阻力除了重力。

Sanjok 在

64 秒后落地。

它落在距离你的朋友大约 6 英尺3 米和距离你 23 英尺7 米的地方上下几英寸不等。

结论如果你在开阔场地玩这个游戏没有人处于危险之中。

无需躲藏或寻找掩护。

但如果你在木屋顶上玩 Sanjok那就另当别论了。

你可以解决 Sanjok 谜题因为你的现实模型包括了物理定律。

LLMs 难以解决因为它们的现实模型是 100%的抽象语言模式——除此之外什么都没有目前如此。

如果你想让 LLM 给出正确答案你必须将 Sanjok 谜题分解成几个步骤。

让每个步骤都类似于你的 LLM 在训练数据中看到的其他谜题。

将几个数百个三句谜语的变体输入到训练/微调数据中。

在提示中写下答案。

cdn.embedly.com/widgets/media.html?typetext%2Fhtmlkeya19fcc184b9711e1b4764040d3dc5c07schematwitterurlhttps%3A//twitter.com/ylecun/status/1734551536129196464image你仍然可以通过在许多领域使用下一个标记预测来超越人类输出。

每个 LLM 在写日本诗歌方面都比我强。

但是预测下一个标记并不意味着你的 LLM 理解导致该标记创建的现实。

你只需要知道在训练数据中单词前后是什么无论它们的意思如何。

这就是为什么 LLMs 在处理他们以前从未见过的简单物理谜题时很困难。

这就是为什么伊利亚的论点在更仔细的审视下站不住脚。

LLMs 虽然很棒LLMs 在伪造知识方面非常出色这得益于它们的流畅性。

即使它们生成错误的陈述它们也会使用连贯而优雅的表述这使得非专家难以区分事实和虚构的胡言乱语。

“我们很容易被这些系统欺骗认为它们很聪明只是因为它们能够流畅地操纵语言。

”我们拥有的唯一能够操纵语言的实体例子是人类所以当我们看到能够灵活操纵语言的东西时我们假设该实体将具有与人类相同的智能但这并不正确。

这些系统非常愚蠢。

部分原因是它们愚蠢因为它们只训练了语言而大多数人类知识与语言无关。

在某种程度上今天最聪明的 AI 系统对物理世界的理解不如你的家猫。

Yann LecunFacebook AI Research (FAIR)的首席人工智能科学家。

“与语言无关的人类知识”是所有在压缩过程中丢失的信息。

它包括数学、推理、计划和物理定律等。

当考虑实际场景时这些知识差距就会显现出来。

例如一家名为 Patronus AI 的初创公司对 GPT-4 进行了一系列金融任务的测试。

2023 年可用的最强大模型得分为 79%——虽然这个数字令人印象深刻但考虑到任务的重大风险仍然是不够的。

“那种表现率绝对不能接受”Patronus AI 联合创始人 Anand Kannappan 说。

“它必须高得多才能真正以自动化和成品的方式工作。

”cdn.embedly.com/widgets/media.html?typetext%2Fhtmlkeya19fcc184b9711e1b4764040d3dc5c07schematwitterurlhttps%3A//twitter.com/Grady_Booch/status/1737170101202530602image许多 AI 专家认为我们需要进一步的创新来解锁更多功能这并不奇怪。

扩大 LLMs 的规模有潜力但它不会填补所有现有的差距更不用说达到人工通用智能了。

“我认为我们需要另一个突破。

我们可以对大型语言模型施加相当大的压力我们应该这样做我们也将这样做”OpenAI 首席执行官萨姆·奥特曼说。

“我们可以继续攀登我们目前所在的山峰而顶峰还相当遥远。

”“但是在合理的范围内如果你把它推到极致也许所有这些其他东西都会出现”他补充道。

“但是在合理的范围内我认为这不会做我认为对通用智能至关重要的东西。

”这是否意味着在此期间 LLMs大型语言模型就毫无用处了人类 LLMs 工具超级力量Patronus AI 将 GPT-4 在自动化 100%特定任务方面的表现描述为“不可接受”。

另一种看待结果的方式是LLMs 可以处理那令人厌烦的 79%而人类操作员则专注于关键的 21%。

换句话说你的工作量同时变得更小、更有挑战性。

在其他研究中也观察到了类似趋势其中开发者、数据从业者和商业顾问在使用 LLMs 时某些任务的速度提高了两倍。

输出质量也有所提高。

你会看到很多“LLMs 能否取代数据科学家”和“LLMs 能否取代开发者”的问题。

目前这些问题的答案是不。

LLMs 不会取代你但使用 LLMs 的人会。

此外我们谈论的并不是 LLMs。

它是“LLMs 工具”。

cdn.embedly.com/widgets/media.html?typetext%2Fhtmlkeya19fcc184b9711e1b4764040d3dc5c07schematwitterurlhttps%3A//twitter.com/OpenAI/status/1715050642560151963image单独的 LLMs 就像是梦想机器。

装备上代码解释器、网络浏览器和图像生成器它们就变成了 AI 助手。

想象一下 ChatGPT 刚推出时与现在的区别。

使用这样的 AI 助手你不再需要从零开始每个任务。

然而你必须验证你的提示的输出。

链接我们使用人工智能助手越多就越需要验证。

作为闭环中的人类这是你的主要角色。

“[LLMs] 就算有保证也无法进行自己的规划/推理”人工智能研究员 Subbarao Kambhampati 说**。

“因此它们最好在 LLM-Modulo 设置带有合理的推理器或闭环中的专家人类中使用。

”这种场景有两种互补的演绎方式用人工智能助手增强人类人类成为结合信息和人工智能输出以产生结果的手工艺人。

将任务委托给人工智能助手人类成为管理者、监督者负责委托、验证和纠正人工智能的输出。

你为什么还在这里大型语言模型LLMs虽然愚笨但它们能让你变得更聪明、更快、更有资源。

它们是你与计算能力之间的桥梁——一座由自然语言构成的桥梁。

在“LLM 工具”的正确组合下你只需一个提示就能解决任何问题或者至少朝着解决方案迈进。

“这就是我们即将看到的革命朋友们。

不是机器取代工作而是一次前所未有的个人生产力激增这为社会整体带来了机遇和问题。

” —— 来自前谷歌首席决策科学家 Cassie Kozyrkov 的评论。

生产力的大幅提升不会自然而然发生。

你需要亲自动手你需要敲击键盘。

你想要编写提示设计人工智能助手并养成验证的习惯。

大多数这些任务都是用自然语言完成的。

但就像人类一样AI 模型不会仅仅因为你用普通的英语说话就能读懂你的心思。

链接你想要学习如何编写清晰的指令将它们与代码结合并尝试不同的模型。

说到这里这里有四个资源可以帮助你开始如何为 LLMs 编写专家提示—— 由这位秃头大叔25 提示技巧、示例和评论撰写。

Midjourney 快速入门指南 –由 Midjourney 研究实验室图像生成简介。

开发者 Prompt Engineering– 由伊莎·富兰德和安德鲁·吴免费在线课程教授如何编程式地提示Prompt Engineering 是编程的未来– 同样由这位秃头先生深入探讨附简洁示例。

技术持续改变我们做的工作类型以及我们工作的方式。

那些迅速拥抱它的人在适应游戏中会领先一步。

问题是为什么你还在阅读关于 LLMs 的内容而不是去实际操作它们保持联系你可以通过**成为 Medium 会员来支持我并获得微薄的佣金。

你也可以订阅以获取邮件通知.**微笑也同样有效。

通过我的推荐链接加入 Medium – 纳比勒·阿卢安尼我也在**领英和X**上活跃并回复每一条信息。

对于 Prompt Engineering 相关咨询请通过以下邮箱联系我[email protected].

第2章Java基本语法(上): 变量与运算符--标识符变量

核心内容摘要

什么是模型管理平台？OpenCSG如何构建企业级AI基础设施

pngHepatizon 是一种古老的紫色金属Mach-3 是音速的三倍。

45kg)to5,000pounds(2268kgs)--andvice versa.Whosindanger? What should I do?花上一分钟。

png这里是依据力学物理和简单启发式方法的事件顺序。

45 千克。

64 秒落地。

64 秒后落地。

老牛影院在线观看免费播放电视剧最-老牛影院在线观看免费播放电视剧最应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

百度百家号客服电话人工服务

第2章Java基本语法(上): 变量与运算符--标识符 变量

核心内容摘要

什么是模型管理平台？OpenCSG如何构建企业级AI基础设施

pngHepatizon 是一种古老的紫色金属Mach-3 是音速的三倍。

45kg)to5,000pounds(2268kgs)--andvice versa.Whosindanger? What should I do?花上一分钟。

png这里是依据力学物理和简单启发式方法的事件顺序。

45 千克。

64 秒落地。

64 秒后落地。

老牛影院在线观看免费播放电视剧最-老牛影院在线观看免费播放电视剧最应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

相关优化文章 推荐

百度百家号客服电话人工服务

第2章Java基本语法(上): 变量与运算符--标识符变量

相关优化文章推荐