核心内容摘要
口罩检测模型在公共交通场景的优化实践
这不今天就给大家介绍一个神器LLaMA‑Factory说白了它就是一个全自动的AI专家生产线。
你不需要再手动去写那些复杂的加载模型、配置参数的代码了。
LLaMA‑Factory把所有繁琐的步骤都封装成了一个清爽的网页界面——选择模型、选择方法、上传数据、调整参数、一键启动就像在网上购物一样简单今天咱们就以中文医疗问答为例手把手带你用LLaMA‑Factory微调一个Qwen3‑
6B‑Instruct模型。
为什么选这个组合呢•硬件友好
6B参数的模型一张RTX 3080就能轻松搞定不用为显存发愁•中文优化Qwen系列对中文支持极佳特别适合咱们的应用场景•QLoRA加持4-bit量化LoRA适配器让训练显存需求降到最低消费级GPU也能玩转大模型微调准备好了吗咱们这就从理论走向实践亲手打造一个能回答医疗问题的AI医生助手第一步搭建咱们的实验室硬件要求别担心门槛不高• Ubuntu Server
2
04 LTS当然其他Linux发行版也行• 安装好NVIDIA驱动这个必须有•CUDA ≥
1
6• 搭建Python环境强烈推荐用Conda管理包依赖特别方便• 安装PyTorch确保GPU和CUDA配合正常这是基础中的基础安装LLaMA‑Factory三行命令搞定git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory conda create -n llama-factory python
11 conda activate llama-factory pip install -e .[torch,metrics]如果遇到环境冲突这种事儿经常有试试用pip install --no-deps -e .解决。
检查安装是否成功装完之后咱们验证一下是不是真的装好了。
运行llamafactory-cli version如果看到下面这样的输出就说明大功告成了---------------------------------------------------------- | Welcome to LLaMA Factory, version
0.
9.
dev0 | | | | Project page: https://github.com/hiyouga/LLaMA-Factory | ----------------------------------------------------------启动WebUI界面激动人心的时刻运行llamafactory-cli webui指令就能进入可视化界面了。
WebUI主要分为四个板块训练、评估与预测、对话、导出。
界面长这样咱们先加载个模型试试水选择Qwen3‑
6B‑Instruct模型测试下原始的回答效果第二步准备教材数据就是一切咱们这次用的是网上开源的Huatuo-Lite数据集。
这可不是随便找的数据它是在Huatuo26M数据集的基础上经过多次提纯和重写而精炼优化的包含了18万个高质量的医疗问答对还带有医院科室和相关疾病两个额外的数据维度。
简单说就是质量很高的医疗问答教科书。
数据集下载地址Huatuo-Lite数据集从下图可以看出数据集的格式数据格式化让机器能读懂咱们这次使用Alpaca格式的JSON文件这是目前最流行的微调数据格式之一。
数据样例长这样[ { instruction: 请根据患者的问题给出建议, input: 太阳穴两边都痛头也痛而且人也昏昏沉沉的手脚还无力头疼的厉害感觉头都要炸了我刚开始的头一天以为是休息不好但是三天了还是这样手按着头都是痛的, output: 需要进一步了解病人的情况是否有发烧工作生活学习的压力如何睡眠如何等等这些都可能是导致头痛的原因。
常见的原因是精神压力过大没有休息好也可以见于一些脑部疾病。
建议及时就医以便得到更好的治疗。
} ]现在需要写个Python脚本把原始数据整理成这种格式。
代码如下from datasets import load_dataset import os import json def process_row(row, i): 处理单行数据 # 确保row是字典类型 if not isinstance(row, dict): print(fWarning: Row {i} is not a dictionary, type: {type(row)}) return None if label not in row or row[label] is None or row[label] : # 如果为空, 则跳过 print(fSkipping row {i}: empty or missing label) return None # 将\n\r 转移为\n并且转义 question row[question].replace(\n\r, \n).replace(\\n, \\n) output row[answer].replace(\n\r, \n).replace(\\n, \\n) # 构建JSON对象 row_data { instruction: 请根据患者的问题给出建议, input: question, output: output } return row_data # 配置环境变量, 使用镜像源 os.environ[HF_ENDPOINT] https://hf-mirror.com max_rows 5000 valid_count 0 with open(data/alpaca_huotuo_rows-5k.json, w, encodingutf-
as f: f.write([\n) for i in range(min(max_rows, len(data_dataset[train]))): row data_dataset[train][i] processed_row process_row(row, i) if processed_row is not None: json_str json.dumps(processed_row, ensure_asciiFalse, indent
# 为每行添加 4 个空格的缩进 indented_json \n.join( line for line in json_str.split(\n)) f.write(indented_json ,\n) valid_count 1 f.write(]\n)数据上传把教材放到指定位置把生成的alpaca_huotuo_rows-5k.json文件上传到数据目录data/下然后在data/dataset_info.json中新增如下配置alpaca_huotuo_rows-5k: { file_name: alpaca_huotuo_rows-5k.json },第三步调参数这里有门道切换到微调页面基础模型选择Qwen3‑
6B‑Instruct微调数据集选择alpaca_huotuo_rows-5k。
接下来就是调参数的环节了这几个参数特别重要•学习率: 决定了模型每次参数更新的幅度大小一般在
之间。
学习率太大模型容易学疯了不收敛太小呢又学得太慢。
这次咱们按默认设置5e-5也就是
00005。
•训练轮数: 就是模型完整过一遍数据集的次数。
轮数太多容易过拟合就是死记硬背不会举一反三太少又学不够。
一般
轮就差不多了。
•最大样本数限制参与训练的数据量。
完整数据集可能有几万条调试阶段用不着那么多只从训练集中抽取前N条样本参与训练就行。
•批量大小: 每次更新模型参数时用的样本数量。
就像补习功课批量大一次学很多知识点但学得粗糙批量小一次学得少但精细。
LLamaFactory中通过批处理大小和梯度累积两个参数控制。
实际批次大小 批处理大小 × 梯度累积步数。
•验证集比例: 从训练数据中划分出一部分作为验证集用来评估模型在没见过的数据上表现如何。
一般设置10%到20%。
咱们这次微调的配置参数如下图第四步开始训练见证奇迹的时刻参数配置好了点击开始按钮模型就开始训练了。
训练过程中可以看到实时的损失值变化就像看股票走势图一样损失值越来越小说明模型学得越来越好。
训练过程训练过程中可以在 WebUI 中查看训练进度Loss 收敛效果一般低于 1 即可达到不错的效果如下图所示训练进度如果训练过程中 Loss 不收敛或者收敛速度很慢可以根据步骤三种的参数说明尝试调整参数重新训练。
训练完成后模型会自动保存到指定目录。
这时候你就拥有了一个专门回答医疗问题的AI助手了第五步测试效果检验学习成果训练完成后切换到聊天页面选择刚才训练好的模型试试问几个医疗相关的问题问题1: 感冒了应该怎么办回答: 感冒是常见的上呼吸道感染建议多休息、多喝水可以适当服用感冒药缓解症状。
如果症状持续加重或出现高热建议及时就医。
问题2: 高血压患者饮食需要注意什么回答: 高血压患者应该低盐饮食每天盐摄入量控制在6克以下多吃新鲜蔬菜水果少吃高脂肪食物戒烟限酒保持适当运动。
推理过程看到没经过微调的模型回答医疗问题明显更专业、更准确了。
这就是微调的魅力所在第六步打包模型把成果带走如果你想把训练好的模型部署到其他地方或者分享给别人就需要把模型打包起来。
LLaMA‑Factory提供了很方便的导出功能。
切换到导出页面选择刚才训练的检查点设置导出路径点击开始导出。
这样就能得到一个完整的、可以独立运行的模型了。
导出完成后你就可以把这个模型拿到任何支持的平台上运行比如部署成API服务或者集成到你的应用中。
写在最后通过LLaMA‑Factory微调模型我们成功把一个通用的AI模型变成了医疗问答专家。
整个过程其实并不复杂准备数据→配置参数→开始训练→测试效果→导出模型。
当然这只是入门级的操作。
想要训练出更好的模型还需要在数据质量、参数调优、模型评估等方面下更多功夫。
但不管怎么说你已经迈出了AI模型微调的第一步这就是一个很好的开始记住AI的世界没有标准答案只有不断的尝试和优化。
今天你学会了用LLaMA‑Factory微调模型明天说不定就能训练出下一个ChatGPT呢最后给个小建议刚开始别追求完美先把流程跑通然后再慢慢优化。
就像学开车一样先学会开再学会开得好。
AI模型微调也是这个道理。
加油未来的AI工程师普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。
大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。
目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。
随着AI大模型技术的迅速发展相关岗位的需求也日益增加。
大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。
如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。
我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。
我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。
希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事02适学人群应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。
零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。
业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。
vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验