360联合北大震撼发布!5%参数量逼近Deepseek

AI资讯1个月前发布 XiaoWen
190 0 0

360联合北大震撼发布!5%参数量逼近Deepseek


新智元报道

编辑:编辑部 HYZ


【新智元导读】

推理黑马出世,仅以5%参数量撼动AI圈。360北大团队研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,32B参数,能够匹敌DeepSeek-R1-671B巨兽。

2025年2月24日,由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近DeepSeek-R1-671B的性能。

360联合北大震撼发布!5%参数量逼近Deepseek

核心突破:小模型,大能量

技术革新:领域专精+模型融合

研究团队使用「分治-融合」策略:

开源承诺:推动技术普惠


研发团队表示:

「Tiny-R1-32B-Preview的成功是站在了巨人的肩膀上,受益于开源社区精神,结合DeepSeek-R1蒸馏、DeepSeek-R1-Distill-32B增量训练、模型融合等技术,使用360-LLaMA-Factory训练而来,未来我们也将持续探索更轻量、更强大的模型,推动AI技术普惠化进程,并回馈开源社区。」

360 团队: Lin Sun, Guangxiang Zhao, Xiaoqi Jian, Weihong Lin, Yongfu Zhu, Change Jia, Linglin Zhang, Jinzhu Wu, Sai-er Hu, Xiangzheng Zhang

北大团队: Yuhan Wu, Zihan Jiang, Wenrui Liu, Junting Zhou, Bin Cui, Tong Yang

360联合北大震撼发布!5%参数量逼近Deepseek

360联合北大震撼发布!5%参数量逼近Deepseek

© 版权声明

相关文章

暂无评论

none
暂无评论...