跳到主要内容

1 篇博文 含有标签「nlp」

查看所有标签

微调deepseek-r1蒸馏版工具调用

· 阅读需 6 分钟
Danny He
Developer in ChengDu,China

有关deepseek-r1蒸馏版的微调方案,目前主流在用<think></think>的形式组织相关语料样本,目前还未涉及到工具调用(Function-Call)的形式, 刚好同事需要基于LLaMA-Factory构建思维链的工具调用语料,于是我顺便补充了一下LLaMA-Factory关于chat template的单元测试,以推导出LLaMA-Factory中关于样本集处理以及抛开JSON格式理解本质chat template。 思维不要固化。