o3 陶哲轩亲测点赞

新智元报道编辑,桃子,新智元导读,o3,mini成功挑战图论中专家级证明,还得到了盛赞,经过实测后,他总结称LLM并非是数学研究万能解法,其价值取决于问题得性质和调教AI的方式,o3,mini竟然已经...
3周前
01540

OpenAI o3

新智元报道编辑,编辑部JHh,新智元导读,这两天,国外网友纷纷发现o3,mini,high在思考过程中居然会经常出现中文!难道真如网友猜测,是借鉴DeepSeek了,国外网友,一觉醒来,发现o3,mi...
4周前
01080

32B击败DeepSeek

新智元报道编辑,桃子好困,新智元导读,32B小模型在超硬核,时间线索,推理谜题中,一举击败了o1、o3,mini、DeepSeek,R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍,用上...
4周前
01920