微调deepseek-r1蒸馏版工具调用
· 阅读需 6 分钟
有关deepseek-r1蒸馏版的微调方案,目前主流在用<think></think>
的形式组织相关语料样本,目前还未涉及到工具调用(Function-Call)的形式,
刚好同事需要基于LLaMA-Factory构建思维链的工具调用语料,于是我顺便补充了一下LLaMA-Factory关于chat template
的单元测试,以推导出LLaMA-Factory中关于样本集处理以及抛开JSON
格式理解本质chat template
。
思维不要固化。