本文重点进行DeepSeek-R1-1.5B 到 Qwen-2.5-1.5B 的模型蒸馏(Distillation
),由于硬件资源有限,只能只用cpu进行模型蒸馏。