首页速度优化绝美的视觉洗礼：凪光SONE-620在线播放，那份触手可及的纯粹与惊艳

网站优化

xrk：重塑未来，赋能无限可能

甘雨焯出白水：一场关于清雅与治愈的味蕾诗篇

2026-06-08 22:22:41

阅读时长:6分钟

562次阅读

核心内容摘要

鸡鸡对鸡鸡

参考如何把你的 DeePseek-R1 微调为某个领域的专家今天我们一起来聊聊大模型的进阶使用“模型微调” 也就是较大 - 掘金看完就想试Unsloth打造个性化AI助手案例展示-CSDN博客unsloth 布署见unsloth 部署简单易上手版本-CSDN博客把基础模型下载到本地确定数据集的格式训练过程import os from unsloth import FastLanguageModel, is_bfloat16_supported from datasets import load_dataset import subprocess from trl import SFTTrainer,SFTConfig # 设置代理可选详见autodl参考文档 #

加载模型和 tokenizer model, tokenizer FastLanguageModel.from_pretrained( model_name/root/Qwen/Qwen2-

5B-Instruct, max_seq_length2048, dtypeNone, load_in_4bitTrue, ) #

添加 LoRAUnsloth 自动优化 model FastLanguageModel.get_peft_model( model, r32, # LoRA rank target_modules[q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj, lm_head], lora_alpha64, lora_dropout

05, biasnone, use_gradient_checkpointingunsloth, # 更高效 random_state3407, ) #

加载数据集假设是 Alpaca 格式 dataset load_dataset(json, data_files/root/ft_data.json, splittrain) # load_dataset批量处理数据集 #

定义 formatting_func关键把结构化的 instruction/input/output 字段批量转换成模型能识别的对话格式文本 #更标准的写法和test的写法一致 def formatting_func(examples): outputs [] for i in range(len(examples[instruction])): instruction examples[instruction][i].strip() input_text examples[input][i].strip() if input in examples and examples[input][i] else output examples[output][i].strip() # 构造标准化 messages和推理时一致 messages [ {role: user, content: f{instruction}\n{input_text} if input_text else instruction}, {role: assistant, content: output} ] # 用 apply_chat_template 生成格式和推理时完全相同 text tokenizer.apply_chat_template( messages, tokenizeFalse, # 只生成文本不编码 add_generation_promptFalse # 训练时不需要加 assistant 生成提示符 ) outputs.append(text) return outputs#

使用 Unsloth 的 train 方法自动处理 packing、formatting 等 training_config SFTConfig( per_device_train_batch_size4, gradient_accumulation_steps2, warmup_steps10, max_steps100, learning_rate1e-4, logging_steps2, save_steps50, output_dir/root/my_qwen_assistant, optimadamw_8bit, seed3407, fp16False, bf16True, packingFalse, # 关闭打包与 Unsloth 无填充批处理兼容 remove_unused_columnsFalse, # 保留数据集字段避免格式化函数报错 ) trainer SFTTrainer( modelmodel, tokenizertokenizer, train_datasetdataset, formatting_funcformatting_func, # ←← Unsloth 的 SFTTrainer 要求这个 max_seq_length2048, dataset_num_proc2, packingFalse, argstraining_config, ) #

训练并保存 trainer_stats trainer.train() model.save_pretrained(my_qwen_assistant) tokenizer.save_pretrained(my_qwen_assistant)推理过程from peft import PeftModel from unsloth import FastLanguageModel, is_bfloat16_supported #

加载基础模型保持和训练一致的dtype/device_map base_model, tokenizer FastLanguageModel.from_pretrained( model_name/root/Qwen/Qwen2-

5B-Instruct, max_seq_length2048, dtypeNone, load_in_4bitTrue, ) #

加载LoRA适配器校验路径 lora_model_path /root/my_qwen_assistant # 校验LoRA权重是否存在 import os if not os.path.exists(lora_model_path): raise ValueError(fLoRA权重路径不存在{lora_model_path}) print(f成功加载LoRA权重{lora_model_path}) model PeftModel.from_pretrained(base_model, lora_model_path) model.eval() # 评估模式 #

推理仅用LoRA模型删除基础模型推理代码 messages [ {role: user, content: 项目名称xxxx一xxx二xxx。

三xxx。

。

} ] # 用和训练时一致的chat template生成输入 input_ids tokenizer.apply_chat_template( messages, tokenizeTrue, add_generation_promptTrue, return_tensorspt ).to(model.device) # 生成参数简化聚焦核心 outputs model.generate( input_idsinput_ids[input_ids], attention_mask input_ids[attention_mask], max_new_tokens800, do_sampleTrue, # 开启采样提升回复多样性 temperature

7, top_p

95, repetition_penalty

1, pad_token_idtokenizer.eos_token_id, eos_token_idtokenizer.eos_token_id, ) # 解码输出 response tokenizer.decode(outputs[0][input_ids[input_ids].shape[1]:], skip_special_tokensTrue) print(LoRA模型推理结果) print(response.strip()) #可选验证基础模型结果对比用 base_model.eval() outputs_base base_model.generate( input_idsinput_ids[input_ids], attention_mask input_ids[attention_mask], max_new_tokens800, do_sampleTrue, temperature

7, top_p

95, repetition_penalty

1, pad_token_idtokenizer.eos_token_id, eos_token_idtokenizer.eos_token_id, ) response_base tokenizer.decode(outputs_base[0][input_ids[input_ids].shape[1]:], skip_special_tokensTrue) print(\n基础模型推理结果) print(response_base.strip())

9.1手抓大雷五分钟-9.1手抓大雷五分钟应用

相关标签

Nodejs+vue面向移动端的房屋租赁系统小程序好写作AI：别卷了！你的论文写作路径，AI说可以“私人订制” GLM-4.7-Flash应用案例：基于Ollama的智能客服搭建 MusePublic Art Studio惊艳效果：SDXL Base权重直载+呼吸感界面真实体验比迪丽LoRA模型安装包制作：将模型与环境打包成可分发的一键安装程序别等监管通报才行动！Seedance2.0的实时隐私风险评分系统如何提前14天预警数据泄露链路？中美AI测试新规碰撞：算法备案制下的生存指南 58.DevOps进阶 3大方案解决苹果设备虚拟化难题：UTM跨系统计算环境实战指南通义千问2.5-7B量化部署：Q4_K_M仅4GB显存优化教程 100万用户+20亿流水+4000万日峰值——数智红包的“数据神话”是怎么炼成的？ 2026远程控制软件测评：ToDesk vs 向日葵，哪款才是打工人的效率神器？多智能体协作新标准：A2A协议全解析（程序员必学，建议收藏） INFO8010 Deep Learning课程视频与资料汇总：一站式学习资源导航

计算机Java毕设实战-基于springboo的社团成员活动策划组织管理系统(【完整源码+LW+部署说明+演示视频，全bao一条龙等】

2026-06-08 22:22:41 7分钟阅读

3个突破性步骤解决HEIC缩略图显示难题：windows-heic-thumbnails的系统级集成方案

基于COMSOL技术的热湿耦合过程及蒸汽上部通入冷凝实验研究

2026-06-08 22:22:41 7分钟阅读

自动化测试工具选择及集成流程

2026-06-08 22:22:41 7分钟阅读

xrk：重塑未来，赋能无限可能

核心内容摘要

鸡鸡对鸡鸡

加载模型和 tokenizer model, tokenizer FastLanguageModel.from_pretrained( model_name/root/Qwen/Qwen2-

5B-Instruct, max_seq_length2048, dtypeNone, load_in_4bitTrue, ) #

添加 LoRAUnsloth 自动优化 model FastLanguageModel.get_peft_model( model, r32, # LoRA rank target_modules[q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj, lm_head], lora_alpha64, lora_dropout

05, biasnone, use_gradient_checkpointingunsloth, # 更高效 random_state3407, ) #

加载数据集假设是 Alpaca 格式 dataset load_dataset(json, data_files/root/ft_data.json, splittrain) # load_dataset批量处理数据集 #

训练并保存 trainer_stats trainer.train() model.save_pretrained(my_qwen_assistant) tokenizer.save_pretrained(my_qwen_assistant)推理过程from peft import PeftModel from unsloth import FastLanguageModel, is_bfloat16_supported #

加载基础模型保持和训练一致的dtype/device_map base_model, tokenizer FastLanguageModel.from_pretrained( model_name/root/Qwen/Qwen2-

5B-Instruct, max_seq_length2048, dtypeNone, load_in_4bitTrue, ) #

推理仅用LoRA模型删除基础模型推理代码 messages [ {role: user, content: 项目名称xxxx一xxx二xxx。

7, top_p

95, repetition_penalty

7, top_p

95, repetition_penalty

1, pad_token_idtokenizer.eos_token_id, eos_token_idtokenizer.eos_token_id, ) response_base tokenizer.decode(outputs_base[0][input_ids[input_ids].shape[1]:], skip_special_tokensTrue) print(\n基础模型推理结果) print(response_base.strip())

9.1手抓大雷五分钟-9.1手抓大雷五分钟应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

百度百家号客服电话人工服务

xrk：重塑未来，赋能无限可能

核心内容摘要

鸡鸡对鸡鸡

加载模型和 tokenizer model, tokenizer FastLanguageModel.from_pretrained( model_name/root/Qwen/Qwen2-

5B-Instruct, max_seq_length2048, dtypeNone, load_in_4bitTrue, ) #

添加 LoRAUnsloth 自动优化 model FastLanguageModel.get_peft_model( model, r32, # LoRA rank target_modules[q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj, lm_head], lora_alpha64, lora_dropout

05, biasnone, use_gradient_checkpointingunsloth, # 更高效 random_state3407, ) #

加载数据集假设是 Alpaca 格式 dataset load_dataset(json, data_files/root/ft_data.json, splittrain) # load_dataset批量处理数据集 #

训练并保存 trainer_stats trainer.train() model.save_pretrained(my_qwen_assistant) tokenizer.save_pretrained(my_qwen_assistant)推理过程from peft import PeftModel from unsloth import FastLanguageModel, is_bfloat16_supported #

加载基础模型保持和训练一致的dtype/device_map base_model, tokenizer FastLanguageModel.from_pretrained( model_name/root/Qwen/Qwen2-

5B-Instruct, max_seq_length2048, dtypeNone, load_in_4bitTrue, ) #

推理仅用LoRA模型删除基础模型推理代码 messages [ {role: user, content: 项目名称xxxx一xxx二xxx。

7, top_p

95, repetition_penalty

7, top_p

95, repetition_penalty

1, pad_token_idtokenizer.eos_token_id, eos_token_idtokenizer.eos_token_id, ) response_base tokenizer.decode(outputs_base[0][input_ids[input_ids].shape[1]:], skip_special_tokensTrue) print(\n基础模型推理结果) print(response_base.strip())

9.1手抓大雷五分钟-9.1手抓大雷五分钟应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

相关优化文章 推荐

百度百家号客服电话人工服务

相关优化文章推荐