成人污

核心内容摘要

小男孩与妈妈小马拉车游戏攻略大全:解锁亲子时光的无限乐趣
探索中国X站:数字时代的文化脉搏与未来图景

高柳家:传承百年风华,品味东方雅韵

原文towardsdatascience.com/llms-coding-software-development-artificial-intelligence-68f195bb2ad3https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/6bdf5bb5eaa3bc463054d27af6866c

png自制图像。

在发布本系列的

文章“为什么 LLMs 不适合编码”后我在社交媒体上收到了一些评论例如“我正在用 ChatGPT 进行编码它工作得非常完美。

”“你错了。

大型语言模型是有用的编码助手。

”我对这种反应感到惊讶因为这篇文章系列的目的是不是要阻止任何人使用大型语言模型LLMs进行编码而是要确定需要改进的关键领域以将 LLMs 转化为更有效的编码助手。

虽然 ChatGPT 等 LLM 在某些情况下可能有所帮助但它们通常生成的代码可能在语法上是正确的但不是最优的甚至可能在功能上不正确。

在上一篇文章中我们讨论了分词器、应用于代码时上下文窗口的复杂性以及训练本身的性质如何影响这些模型在编码任务中的性能。

在这篇文章中我们将更深入地探讨这些模型用于编码任务所经历的训练类型以及为什么LLMs 天生不擅长“开箱即用”的编码保持与最新库和代码功能同步的挑战。

编码模型的训练由 LLM 驱动的编码助手已经成为现实。

GitHub Copilot是今天最知名的产品之一在我们的开发环境中提供代码补全和聊天助手。

正如开发者所声称的“GitHub Copilot 使用概率确定来生成建议”。

仔细查看他们的文档提供了更多关于产品工作原理的细节https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0c2995b22bb9ea1939663056b8b24dca.png自制 GitHub Copilot 官方网站 FAQ 部分的截图。

GitHub Copilot 网站。

也就是说无论我们在哪里放置光标我们都会得到一个建议。

但等等。

通用 LLMs 的训练是为了预测给定一系列标记的下一个标记这意味着只有光标前的行被用于推理从左到右生成。

有双向模型使用左右上下文进行预测。

然而在实践中ChatGPT 这样的单向模型使用了一些变通方法以便在代码中有效地使用。

准备基础 LLM 进行编码任务的常见技术是在代码数据集上执行自适应微调例如在将模型专门化到自然语言中的具体主题时。

DeepMind 的 Yujia Li 在文章“Competition-Level Code Generation with AlphaCode”中描述了这一过程…/Images/541a4d44612c8e61c5a1619640e0ed1a.png[source] Li, Y., Choi, D., Chung, J., Kushman, N., Schrittwieser, J., Leblond, R., … Vinyals, O. (

.Competition-level code generation with AlphaCode. Science, 378(

, 1092–

如上图(A)部分所示用于编码的通用 LLM 是从在自然语言上训练的基础模型开始的并在代码库上进行预训练。

例如给定上下文print(, 模型被训练来预测补全hello) 使用从左到右的生成。

然后模型使用一系列编码问题和它们的解决方案进行微调如图(B)所示。

因此给定一个编码问题模型被训练来生成解决方案。

通过在代码数据集上预训练大型语言模型LLM这些模型可以学习特定于编程语言的模式、风格和结构。

此外微调数据集应包括各种编码任务如代码补全和填充这将帮助模型学会根据前面的上下文预测适当的代码片段。

一旦模型训练完成确保模型了解正确上下文的另一种策略是在推理过程中将其作为提示的一部分传递。

例如对于代码填充提示可以包括周围的代码作为上下文有效地将任务重新表述为与模型的单向能力相一致。

作为编码助手的 LLM 的挑战在本系列的

文章中我们探讨了大型语言模型LLM在生成代码方面的局限性以及这些局限性产生的原因。

然而有一个重要的局限性我们没有提到保持与最新包和功能同步。

在软件开发中这对于生成有效和安全的代码至关重要但对于 LLM 来说实际上是非常具有挑战性的原因有两个静态知识库GitHub Copilot作为任何 LLM都是在特定时间点对数据——代码和文档——的快照进行训练的。

因此它可能不知道在它们最后一次训练更新之后发布的软件库和框架中的最新功能、已弃用功能或安全补丁。

版本特定性软件开发严重依赖于特定版本的库和框架。

由于 LLM 没有实时更新它们可能提供过时的代码片段导致兼容性问题或过时方法的使用。

接口如 API可能会频繁更改新功能可能会添加或旧功能可能会删除。

基于旧数据的 LLM 可能不会意识到新的安全风险这可能导致代码被破坏。

此外在现代软件开发中管理依赖项是复杂的如果 LLM 缺乏最新的兼容性和版本信息可能不会提供最佳建议。

每个问题都有一个解决方案集成开发环境IDE和其他编码工具可以集成实时更新并获取最新的文档或库版本类似于 ChatGPT-4 的 Bing 浏览功能以扩展其知识库。

就我所知GitHub Copilot 的聊天功能具有浏览能力。

然而正如讨论的那样LLM 依赖于其预训练模型来生成响应GitHub Copilot 在其文档中也对此进行了警告GitHub Copilot 提供由 OpenAI 从数十亿行开源代码构建的模型建议。

因此GitHub Copilot 的训练集可能包含不安全的编码模式、错误或对过时 API 或习语的引用。

当 GitHub Copilot 基于这些训练数据生成建议时这些建议也可能包含不希望的模式。

当使用 LLM 作为编码助手时我们应该意识到动态咨询外部数据库以获取软件更新和文档的能力可能有限。

最后的想法尽管大型语言模型在生成代码的骨干作为起点和帮助处理语法和基本概念方面可能很有用但我们应该意识到它们的局限性并避免过度依赖这些产品。

每个编码项目可能需要高度特定的解决方案以适应特定的业务规则或用户需求——这些细微差别对于 LLM 来说非常难以捕捉因为它们被训练来重现训练数据中发现的通用模式。

然而我们可以采用针对代码定制的提示工程策略来引导 LLM 朝着我们期望的输出方向。

如果您感兴趣可以在以下文章中了解更多信息编码任务的提示工程⚠ 警告 ⚠编写能够正确运行的代码是一回事编写针对性能优化的代码则是另一回事。

认识到LLMs 可能并不总是提供最有效的算法或为特定硬件或软件环境优化代码是很重要的。

此外在执行 AI 生成的代码时始终考虑安全性至关重要。

最后大型语言模型本质上依赖于最大似然估计而高效的软件开发需要性能感知的代码生成策略。

那就结束了非常感谢阅读我希望这篇文章能帮助您在使用 LLMs 进行编码时您也可以订阅我的通讯以便及时获取新内容。

特别是如果您对关于大型语言模型和 ChatGPT 的文章感兴趣为什么 LLMs 不适合编码ChatGPT moderation API输入/输出控制ChatGPT API 的自定义内存

免费观看已满十八岁电视剧下载安装-免费观看已满十八岁电视剧下载安装应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123