扫描下载APP
其它方式登录
苹果团队提出“简单自蒸馏”(SSD)方法,通过高温采样与截断从大模型自身生成数据并直接用于监督微调,无需强化学习、教师模型或代码执行验证,在Qwen和Llama系列多个模型上显著提升代码生成能力,尤其在高难度任务中pass@1提升达30.4%,核心机制是重塑模型token概率分布以兼顾精度与探索。