MogFace模型剪枝与蒸馏实战:减少耦合过度,打造轻量级子网络

核心内容摘要

基于springboot+vue的农产品销售管理系统(源码+论文+部署+安装)
小白必看:Xinference快速安装与模型替换教程

linux-do_signal

之前写过一篇使用deepseek和智谱AI实现《红楼梦》中人物关系智能问答的随笔但deepseek提供的免费tokens只有500万个GraphRAG构建图谱的索引和问答过程对token的消耗是巨量的因此亟需找到一种本地化部署的方案不用依赖在线大模型的api形式。

看到国外博客上有人公布了GraphRAGOllama的本地化部署方案按照博客内容进行了复现这里做一个详细记录。

本地化部署方案的优点本地大模型构建图谱和问答可以利用Ollama随时拉取最新大模型并进行切换无需消耗token极大降低了成本启动简单可以实现快速部署和实验。

本地部署步骤在本地新建conda环境可以确保所有新建的依赖环境是独立的conda create -n graphrag-ollama-local python

10 conda activate graphrag-ollama-local安装Ollama支持pip install形式安装也可以访问官网查看更多安装细节https://ollama.com/pip install ollama使用Ollama拉取大模型实现GraphRAG的索引和向量化流程ollama pull mistral #llm ollama pull nomic-embed-text #embedding从github拉取GraphRAGOllama项目git clone https://github.com/TheAiSingularity/graphrag-local-ollama.git进去上述项目中cd graphrag-local-ollma/安装GraphRAG包pip install -e .类似GraphRAG方案中需要新建input地址来存放外部文档mkdir -p ./ragtest/input在GraphRAG-local-ollama项目中提供了部分样例文档这部分英文文档可以进行初始化测试跑成功cp input/* ./ragtest/input初始化ragtest生成settings.yaml文件python -m graphrag.index --init --root ./ragtest将本项目中的settings.yaml文件直接复制到安装好的graphrag包中项目样例配置文件已经将llm和embedding对应的大模型分别配置为mistral和nomic-embed-textmv settings.yaml ./ragtest配置完成后可以开始GraphRAG的索引流程python -m graphrag.index --root ./ragtest上述索引过程大概耗时30分钟索引构建完成就可以看到样例文档的图谱文件此时可以进行文档的智能问答python -m graphrag.query --root ./ragtest --method global What is machine learning?除了智能问答以为我们还想看看样例文档的图谱构建结果如何也就是图谱长什么样子可以借助如下命令进行修改配置文件settings.yaml中的参数snapshots: graphml: true此时构建索引过程中样例文档的图谱文件会自动生成一份graphml文件可以通过python中的graphml包对这个文件机型读取graphml文件的保存路径为output/

/artifacts/summarized_graph.graphml可以使用项目中visualize-graphml.py文件对graphml进行可视化可以看到样例文档的图谱形状包括各个实体及关系。

python visualize-graphml.py想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2026 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容​

学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI

100本大模型方向电子书

26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC

实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

600套技术大会 PPT听行业大咖讲实战PPT 整理自

年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌

107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自

年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析

102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑

97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”

路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。

L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、

关键技术以及大模型应用场景。

L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。

L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。

L5阶段专题集丨特训篇 【录播课】

资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容​2026 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”

fuqer100%today-fuqer100%today最新版v.6.09.90-2265安卓网应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123