让SFT重新伟大!CMU等华人学者提出全新 媲美复刻版DeepSeek 批判式微调 新智元报道编辑,peter东乔杨,新智元导读,在面对复杂的推理任务时,SFT往往让大模型显得力不从心,最近,CMU等机构的华人团队提出了,批判性微调,CFT,方法,仅在50K样本上训练,就在大多数基准... AI资讯# DeepSeek# sft# 华人学者 3周前02220
o3 陶哲轩亲测点赞 新智元报道编辑,桃子,新智元导读,o3,mini成功挑战图论中专家级证明,还得到了盛赞,经过实测后,他总结称LLM并非是数学研究万能解法,其价值取决于问题得性质和调教AI的方式,o3,mini竟然已经... AI资讯# mini# 图论# 定理 3周前01540
R1 刚刚 3.7降世!最强编程大脑暴击DeepSeek 全球首个混合推理模型Claude 新智元报道编辑,编辑部JHNY,新智元导读,就在刚刚,Anthropic祭出首个混合推理Claude3.7Sonnet,堪称扩展思考模式的最强模型,在最新编码测试中,新模型暴击o3,mini、Deep... AI资讯# DeepSeek# 云计算费用# 数学 4周前01040
NP难问题接近被AI破解!南航牛津爆改DeepSeek 新智元报道编辑,Aeneas好困,新智元导读,给DeepSeek,R1推理指导,它的数学推理能力就开始暴涨,更令人吃惊是,Qwen2.5,14B居然给出了此前从未见过的希尔伯特问题的反例!而人类为此耗... AI资讯# DeepSeek# 中国南方航空# 多项式 4周前01700
MIT创5连冠神话!3位00后华人称霸TOP 普特南数赛公布 5 新智元报道编辑,静音桃子,新智元导读,一年一度普特南数赛开奖了,MIT连续5年夺冠,5位00后本科生再创奇迹,还有团队第一,花落MIT,普特南数学竞赛,结果出炉!MIT再次成为全世界的焦点,连续5年夺... AI资讯# mit# top# 卡内基梅隆大学 4周前01920
北大校友破解125年数学世纪难题!联手科大少年班天才 刚刚 菲尔兹奖预定 新智元报道编辑,AeneasKingHZ,新智元导读,就在刚刚,希尔伯特第六问题,被华人学者解决了!北大数学07级的邓煜、中科大少年班的马骁联手陶哲轩高徒ZaherHani,完成了这个125年的奇迹,... AI资讯# 北大# 定理# 希尔伯特 4周前01260
DeepSeek背后功臣戴上迟来的冠冕 2024图灵奖颁给强化学习两位奠基人!ChatGPT 新智元报道编辑,编辑部HNZ,新智元导读,强化学习之父RichardSutton和他的导师AndrewBarto,获得了2024年图灵奖,有人说,图灵奖终于颁给了强化学习,这是迟到的,奖励,2024年... AI资讯# ChatGPT# 图灵奖# 强化学习 4周前01780