15B硬刚GPT

新智元报道编辑,犀牛KingHZ,新智元导读,CMU团队用LCPO训练了一个15亿参数的L1模型,结果令人震惊,在数学推理任务中,它比S1相对提升100%以上,在逻辑推理和MMLU等非训练任务上也能稳...
3周前
02220