1 篇博文含有标签「nlp」

微调deepseek-r1蒸馏版工具调用

2025年3月5日 · 阅读需 6 分钟

Developer in ChengDu,China

有关deepseek-r1蒸馏版的微调方案，目前主流在用<think></think>的形式组织相关语料样本，目前还未涉及到工具调用(Function-Call)的形式，刚好同事需要基于LLaMA-Factory构建思维链的工具调用语料，于是我顺便补充了一下LLaMA-Factory关于chat template的单元测试，以推导出LLaMA-Factory中关于样本集处理以及抛开JSON格式理解本质chat template。思维不要固化。