首页速度优化算法优化：Qwen3-32B推理加速关键技术解析

网站优化

扩散语言模型也能当搜索代理？DLLM-Searcher用“边想边搜“的并行范式干掉了自回归模型

【推荐100个unity插件】体积照明体积光 —— Volumetric Light Beam

2026-06-09 16:36:37

阅读时长:8分钟

562次阅读

核心内容摘要

TrollInstallerX：iOS 14-16.6.1全设备适配的TrollStore安全部署工具

大家好我是一名喜欢在家折腾本地部署的开发者这次我来分享如何在本地运行 Ollama并将它与 FastGPT 和 Dify 两个知识库对接。

看起来复杂但其实步骤并不难。

我会尽量把内容讲得清楚易懂加上一些幽默让整个过程更有趣。

第一步本地部署 Dify 和 FastGPT 首先我想找个知识库应用结果在网上看上了 Dify 和 FastGPT。

说实话起初看了半天文档也分不出哪个更好用就像在咖啡 ☕️ 和茶之间犹豫不决干脆两个都来吧这样我就可以比较它们的优缺点看看哪个更适合我的需求。

正好这两个工具都支持本地部署我这个爱折腾的性格立刻就上头了赶紧跑去 GitHub 上说干就干。

部署均使用 Docker 进行我的电脑是 M3 16G 的 Macbook Air性能一般但运行这两者没有问题。

不过在 Ollama 跑 3B 大小的模型时已经是极限温度接近 90 摄氏度建议选择较小的模型。

第二步部署 Dify 和 FastGPT在研究知识库应用时我决定同时部署 Dify 和 FastGPT。

毕竟选择困难症发作时最好的办法就是“全都要”这样我就可以亲自测试它们搞清楚到底哪个更适合我的需求。

幸运的是这两个知识库都支持本地部署真是太方便了让我可以在自己的电脑上尽情试验。

接下来我会详细介绍如何用 Docker 来部署它们。

步骤 1准备环境确保有稳定的网络环境下载 Docker 镜像时别被中断了不然心态很容易炸。

安装 Docker。

Mac 用户我强烈推荐使用 Orbstack 进行安装这玩意儿轻量又好用。

而 Windows 和 Linux 用户可以直接去 Docker 官网下载安装。

步骤

1安装 Dify打开 Dify 官方 GitHub 页面。

下载代码或者直接下载 ZIP 文件包按照官方的 QuickStart 指引进入到docker文件夹中里面就是我们需要的东西。

在docker文件夹内执行以下命令docker-compose up -d这个命令会自动下载 Docker 镜像并启动容器。

如果网络良好整个过程应该会非常顺畅只需稍等片刻喝杯咖啡就搞定 ☕️。

完成后可以在浏览器中访问http://localhost/install进行登录和配置。

如果在国内使用网络直接下载 Docker 镜像有问题可以使用镜像加速器来帮忙别被卡住了。

更多详细说明可以参考官方手册。

步骤

2安装 FastGPT轻松搞定没你想的那么难打开 FastGPT 官方 GitHub 页面。

下载代码或 ZIP 文件包按照官方 QuickStart 指引进入files/docker文件夹使用里面的 Docker 配置。

与 Dify 不同FastGPT 需要一些额外配置。

默认情况下没有docker-compose.yml文件因此启动时需要指定例如官方推荐的docker-compose-pgvector.yml。

此外还需要创建一个config.json配置文件放在docker目录下内容可以参考 config.json。

配置好后执行以下命令来启动docker-compose -f docker-compose-pgvector.yml up -d完成后可以通过浏览器访问http://localhost:3000来使用 FastGPT。

FastGPT 的配置比 Dify 稍微复杂一些需要在http://localhost:3001配置模型并修改config.json来匹配你的需求。

如果遇到下载困难强烈建议使用镜像加速器或优化网络让你的部署更顺利。

步骤 3配置和运行安装完成后还需要进行一些简单的配置按照文档一步一步操作就可以搞定啦。

Dify 的使用非常简单直接注册登录即可例如你可以用它来快速存储和检索文档。

而 FastGPT 则有固定的管理员账号适合需要更多定制化功能的场景比如通过它来构建更复杂的对话模型FastGPT 模型配置页面地址是http://localhost:3001默认账号是root密码是123456。

FastGPT 主页面地址是http://localhost:3000账号为root密码可以在config.json中找到默认是1234。

按照这些步骤轻松搞定步骤 4文件大小限制在 Dify 里面上传文件会有 15M 的单个限制需要改个配置。

打开 docker 文件夹里的.env文件把下面两条的15改成150即可# Upload file size limit, default 15M. UPLOAD_FILE_SIZE_LIMIT15 NGINX_CLIENT_MAX_BODY_SIZE15M第三步本地部署 Ollama 前面的 Dify 和 FastGPT 都已经部署好了现在轮到 Ollama 出场了把 AI 模型部署在本地就像是为这场 AI 派对请来了一位“桥梁专家”它能帮助不同的知识库联手合作协同作战让整个系统变得更智能、更高效。

步骤 1安装 Ollama首先前往 Ollama 的官网下载并安装 Ollama过程非常简单就像你平时安装其他应用程序一样轻松。

下载并安装 Ollama。

搜索并选择所需的模型这里我们以 llama

2 为例进入到 llama

2 页面。

使用命令ollama run llama

2:3b让 Ollama 开始“上班”吧它一上班你就可以和模型进行互动啦要让它下班休息只需要输入CtrlD或者直接来一句/bye它就会乖乖“打卡”回家了。

步骤 2Dify 对接 Ollama好了Ollama 已经准备就绪现在是时候让它和 Dify 握个手成为好搭档了。

打开 Dify进入设置 - 模型供应商。

找到 Ollama填写模型名称为llama

2:3b基础 URL 填写为http://host.docker.internal:11434其他选项保持默认即可。

这样 Ollama 就正式与 Dify 建立了“合作伙伴”关系。

步骤 3FastGPT 对接 Ollama接下来我们也需要让 FastGPT 加入这场 AI 聚会。

登录 FastGPT 的模型配置页面选择“渠道” - 添加新渠道。

在类型中选择 Ollama名称填写llama

2:3b代理地址填写为http://host.docker.internal:11434其他设置保持简单。

因为密钥是必填项你可以随便填写一些字符FastGPT 不会认真查。

修改config.json文件找到llmModels数组然后添加以下内容{“model”: “llama

2:3b”,“name”: “llama

2:3b”,“avatar”: “/imgs/model/openai.svg”,“maxContext”: 125000,“maxResponse”: 4000,“quoteMaxToken”: 120000,“maxTemperature”:

2,“charsPointsPrice”: 0,“censor”: false,“vision”: true,“datasetProcess”: true,“usedInClassify”: true,“usedInExtractFields”: true,“usedInToolCall”: true,“usedInQueryExtension”: true,“toolChoice”: true,“functionCall”: false,“customCQPrompt”: “”,“customExtractPrompt”: “”,“defaultSystemChatPrompt”: “”,“defaultConfig”: {},“fieldMap”: {}}接着在文件夹中执行docker-compose down来暂停服务然后通过docker-compose -f docker-compose-pgvector.yml up -d重新启动服务。

完成后通过http://localhost:3000访问 FastGPT你会看到你刚刚添加的llama

2:3b模型已经在列表中等着你了现在Ollama 已经成功地和 Dify、FastGPT 结合整个系统就像是一支高效合作的团队随时准备帮你解决各种问题。

这种组合特别适合需要在本地高效管理和利用知识的场景。

后记为什么要折腾部署 Ollama 并对接 FastGPT 和 Dify 呢主要是因为想在本地搭建一套知识库并结合 AI 来进行查询或训练等操作。

通过本地部署用户可以更好地掌控数据的安全性和隐私性同时可以自定义和优化 AI 的运行方式让系统更符合自己的需求。

这样一来不仅可以满足日常工作中的各种需求还能让你随时随地“调教”你的 AI让它变得更加聪明伶俐简直就是家里养了个智能小助手想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2026 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容

学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI

100本大模型方向电子书

26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC

实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

600套技术大会 PPT听行业大咖讲实战PPT 整理自

年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌

107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自

年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析

102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑

97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”

路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。

L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、

关键技术以及大模型应用场景。

L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。

L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。

L5阶段专题集丨特训篇【录播课】

扩散语言模型也能当搜索代理？DLLM-Searcher用“边想边搜“的并行范式干掉了自回归模型

核心内容摘要

TrollInstallerX：iOS 14-16.6.1全设备适配的TrollStore安全部署工具

1安装 Dify打开 Dify 官方 GitHub 页面。

2安装 FastGPT轻松搞定没你想的那么难打开 FastGPT 官方 GitHub 页面。

2 为例进入到 llama

2 页面。

2:3b让 Ollama 开始“上班”吧它一上班你就可以和模型进行互动啦要让它下班休息只需要输入CtrlD或者直接来一句/bye它就会乖乖“打卡”回家了。

2:3b基础 URL 填写为http://host.docker.internal:11434其他选项保持默认即可。

2:3b代理地址填写为http://host.docker.internal:11434其他设置保持简单。

2:3b”,“name”: “llama

2:3b”,“avatar”: “/imgs/model/openai.svg”,“maxContext”: 125000,“maxResponse”: 4000,“quoteMaxToken”: 120000,“maxTemperature”:

2:3b模型已经在列表中等着你了现在Ollama 已经成功地和 Dify、FastGPT 结合整个系统就像是一支高效合作的团队随时准备帮你解决各种问题。

学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI

100本大模型方向电子书

实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

600套技术大会 PPT听行业大咖讲实战PPT 整理自

求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌

107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自

年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析

102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑

97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”

关键技术以及大模型应用场景。

黄色网站小便-黄色网站小便应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

百度百家号客服电话人工服务

扩散语言模型也能当搜索代理？DLLM-Searcher用“边想边搜“的并行范式干掉了自回归模型

核心内容摘要

TrollInstallerX：iOS 14-16.6.1全设备适配的TrollStore安全部署工具

1安装 Dify打开 Dify 官方 GitHub 页面。

2安装 FastGPT轻松搞定没你想的那么难打开 FastGPT 官方 GitHub 页面。

2 为例进入到 llama

2 页面。

2:3b让 Ollama 开始“上班”吧它一上班你就可以和模型进行互动啦要让它下班休息只需要输入CtrlD或者直接来一句/bye它就会乖乖“打卡”回家了。

2:3b基础 URL 填写为http://host.docker.internal:11434其他选项保持默认即可。

2:3b代理地址填写为http://host.docker.internal:11434其他设置保持简单。

2:3b”,“name”: “llama

2:3b”,“avatar”: “/imgs/model/openai.svg”,“maxContext”: 125000,“maxResponse”: 4000,“quoteMaxToken”: 120000,“maxTemperature”:

2:3b模型已经在列表中等着你了现在Ollama 已经成功地和 Dify、FastGPT 结合整个系统就像是一支高效合作的团队随时准备帮你解决各种问题。

学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI

100本大模型方向电子书

实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

600套技术大会 PPT听行业大咖讲实战PPT 整理自

求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌

107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自

年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析

102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑

97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”

关键技术以及大模型应用场景。

黄 色 网 站小便-黄 色 网 站小便应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

相关优化文章 推荐

百度百家号客服电话人工服务

黄色网站小便-黄色网站小便应用

相关优化文章推荐