小模型指导大模型!田渊栋等爆锤蒸馏 更可控 新方法更高效 更透明 新智元报道编辑,KingHZ,新智元导读,基于连续概念,Meta团队新研究提出了超越,下一个token预测,语言建模新范式,更加重要的是,新方法不仅能增强原有的范式,而且比起知识蒸馏,数据量减少20%... AI资讯# 云计算费用# 向量# 爆锤蒸馏 4周前01160