AI
AI

LoRA微调实战:使用QLoRA在单卡GPU上微调70亿参数大模型

朋友想在单张4090上微调7B模型做客服,我一开始觉得不可能。按项目交付手册走,从业务场景、数据清洗到上线评估,踩了一堆坑,最后用QLoRA搞定了。这里分享下完整的交付过程和可运行的脚本。

微调数据准备的坑:从原始文本到训练数据集的完整流水线

技术同事电话打过来,说微调后的模型输出全是乱码。我一看,训练数据格式错了,差点没把自己绕进去。这篇文章记录了我从原始文档到训练数据集的完整流水线,包括数据清洗、标注、质量检查的坑,还有可复用的代码。