3B模型爆发超强推理!微软论文实锤涌现 10美元成功复现DeepSeek顿悟时刻 新智元报道编辑,Aeneas好困,新智元导读,不到10美元,3B模型就能复刻DeepSeek的顿悟时刻了,来自荷兰的开发者采用轻量级的RL算法Reinforce,Lite,把复刻成本降到了史上最低!同... AI资讯# DeepSeek# 微软# 知名企业 4周前01780