Scaling另有他用 Ilya错了 ViT大佬力挺谷歌1000亿数据新发现 新智元报道编辑,KingHZ,新智元导读,谷歌发布了1000亿文本,图像对数据集,是此前类似数据集的10倍,创下新纪录!基于新数据集,发现预训练ScalingLaw,虽然对模型性能提升不明显,但对于小... AI资讯# scaling# 云计算费用# 模态 3周前02140
15B硬刚GPT 新智元报道编辑,犀牛KingHZ,新智元导读,CMU团队用LCPO训练了一个15亿参数的L1模型,结果令人震惊,在数学推理任务中,它比S1相对提升100%以上,在逻辑推理和MMLU等非训练任务上也能稳... AI资讯# 4# GPT# token 3周前02220
机器人操作全能 具身智能新时代!VLA迎来最强基础模型Magma UI导航 新智元报道编辑,LRS,新智元导读,Magma是一个新型多模态基础模型,能够理解和执行多模态任务,适用于数字和物理环境,通过标记集合,SoM,和标记轨迹,ToM,技术,将视觉语言数据转化为可操作任务,... AI资讯# 云计算费用# 智能体# 机器人 3周前02340
OpenAI最强模型惨遭剖脑 CoT写下作弊自白书!不写代码耍心机被当场抓包 新智元报道编辑,Aeneas英智,新智元导读,如今的前沿推理模型,学会出来的作弊手段可谓五花八门,比如放弃认真写代码,开始费劲心思钻系统漏洞!为此,OpenAI研究者开启了,CoT监控,大法,让它的小... AI资讯# cot# OpenAI# 云计算费用 3周前01100
R1 刚刚 3.7降世!最强编程大脑暴击DeepSeek 全球首个混合推理模型Claude 新智元报道编辑,编辑部JHNY,新智元导读,就在刚刚,Anthropic祭出首个混合推理Claude3.7Sonnet,堪称扩展思考模式的最强模型,在最新编码测试中,新模型暴击o3,mini、Deep... AI资讯# DeepSeek# 云计算费用# 数学 4周前0900
成历史!AI初创全新Zep系统 知识图谱破解上下文诅咒 大模型 记忆断片 新智元报道编辑,peter东乔杨,新智元导读,Zep,一个为大模型智能体提供长期记忆的插件,能将智能体的记忆组织成情节,从这些情节中提取实体及其关系,并将它们存储在知识图谱中,从而让用户以低代码的方式... AI资讯# zep系统# 上下文# 云计算费用 4周前01180
Deep 端到端强化微调是关键 Research订阅全推送 5分钟顶人类8小时!OpenAI 新智元报道编辑,KingHZ英智,新智元导读,最近,OpenAI的研究团队在采访中表示,全新的DeepResearch功能,可以为你节省几个小时甚至几天的时间!DeepResearch,深度研究,是继... AI资讯# deep# isa# OpenAI 4周前01140
Grok DeepSeek效应初现 新智元报道编辑,KingHZ,新智元导读,DeepSeek和xAI相继用R1和Grok,3证明,预训练ScalingLaw不是OpenAI的护城河,将来95%的算力将用在推理,而不是现在的训练和推理各... AI资讯# DeepSeek# OpenAI# 云计算费用 4周前01600
LeCun世界模型再近一步!Meta研究证明 AI可无先验理解直觉物理 新智元报道编辑,英智KingHZ,新智元导读,AI如何理解物理世界,视频联合嵌入预测架构V,JEPA带来新突破,无需硬编码核心知识,在自监督预训练中展现出对直观物理的理解,超越了基于像素的预测模型和多... AI资讯# 世界模型# 云计算费用# 度量 4周前01400
小模型指导大模型!田渊栋等爆锤蒸馏 更可控 新方法更高效 更透明 新智元报道编辑,KingHZ,新智元导读,基于连续概念,Meta团队新研究提出了超越,下一个token预测,语言建模新范式,更加重要的是,新方法不仅能增强原有的范式,而且比起知识蒸馏,数据量减少20%... AI资讯# 云计算费用# 向量# 爆锤蒸馏 4周前01120