15B硬刚GPT 新智元报道编辑,犀牛KingHZ,新智元导读,CMU团队用LCPO训练了一个15亿参数的L1模型,结果令人震惊,在数学推理任务中,它比S1相对提升100%以上,在逻辑推理和MMLU等非训练任务上也能稳... AI资讯# 4# GPT# token 3周前02380
机器人操作全能 具身智能新时代!VLA迎来最强基础模型Magma UI导航 新智元报道编辑,LRS,新智元导读,Magma是一个新型多模态基础模型,能够理解和执行多模态任务,适用于数字和物理环境,通过标记集合,SoM,和标记轨迹,ToM,技术,将视觉语言数据转化为可操作任务,... AI资讯# 云计算费用# 智能体# 机器人 3周前02380
Scaling另有他用 Ilya错了 ViT大佬力挺谷歌1000亿数据新发现 新智元报道编辑,KingHZ,新智元导读,谷歌发布了1000亿文本,图像对数据集,是此前类似数据集的10倍,创下新纪录!基于新数据集,发现预训练ScalingLaw,虽然对模型性能提升不明显,但对于小... AI资讯# scaling# 云计算费用# 模态 3周前02260
32B击败DeepSeek 新智元报道编辑,桃子好困,新智元导读,32B小模型在超硬核,时间线索,推理谜题中,一举击败了o1、o3,mini、DeepSeek,R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍,用上... AI资讯# DeepSeek# mini# 云计算费用 4周前01680
Grok DeepSeek效应初现 新智元报道编辑,KingHZ,新智元导读,DeepSeek和xAI相继用R1和Grok,3证明,预训练ScalingLaw不是OpenAI的护城河,将来95%的算力将用在推理,而不是现在的训练和推理各... AI资讯# DeepSeek# OpenAI# 云计算费用 4周前01660
Meta等提出全新基准MLGym 谁是最强AI研究助手 LLM智能体大排名 新智元报道编辑,英智,新智元导读,AI研究智能体全新升级!Meta等推出MLGym,一个专门用于评估和开发LLM智能体的Gym环境,MLGym提供了标准化的基准测试,让LLM智能体在多任务挑战中展现真... AI资讯# ai研究助手# meta# 云计算费用 4周前01640
LeCun世界模型再近一步!Meta研究证明 AI可无先验理解直觉物理 新智元报道编辑,英智KingHZ,新智元导读,AI如何理解物理世界,视频联合嵌入预测架构V,JEPA带来新突破,无需硬编码核心知识,在自监督预训练中展现出对直观物理的理解,超越了基于像素的预测模型和多... AI资讯# 世界模型# 云计算费用# 度量 4周前01600
离谱!OpenAI被曝博士级AI智能体2万美元 新智元报道编辑,编辑部JHZ,新智元导读,刚刚,OpenAI被爆三类智能体定价!价格从每月2k美元到20k美元不等,用于自动化编码和博士级别的研究等任务,此前,美国国家实验室使用OpenAI的o1模型... AI资讯# DeepSeek# OpenAI# 云计算费用 4周前01560
2025杰出论文奖!吴恩达亲临现场 3篇上榜 南大周志华带队斩获AAAI 新智元报道编辑,桃子好困,新智元导读,一年一度AAAI2025杰出论文开奖了!三篇杰出论文榜上有名,周志华带队论文斩获大奖,AAAI2025杰出论文出炉了!今年共有3篇论文摘下杰出论文桂冠,其中一篇是... AI资讯# aaai# 云计算费用# 南大 4周前01420
Dynasor 思维扫描术 AI话痨终结者!UCSD清华提出 新智元报道编辑,好困犀牛,新智元导读,推理模型在复杂任务上表现惊艳,缺点是低下的token效率,UCSD清华等机构的研究人员发现,问题根源在于模型的,自我怀疑,!研究团队提出了Dynasor,CoT,... AI资讯# cot# dynasor# token 4周前01380