RIP方法让模型性能狂飙60% LeCun力荐!进化算法淘汰77%低质数据 新智元报道编辑,peter东乔杨,新智元导读,近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法,拒绝指令偏好,RIP,,得到了YannLeCun的转赞,相比未经过滤的数据,使... AI资讯# rip# 实验# 样本 1个月前02140
加速度计成本暴降1 新智元报道编辑,LRST,新智元导读,哈尔滨工业大学团队提出HEROS,GAN技术,通过生成式深度学习将低成本加速度计信号转化为高精度信号,突破其精度与量程瓶颈,该技术利用最优传输监督和拉普拉斯能量调... AI资讯# aaai# 传感器# 信号 1个月前01800
DeepSeek 新智元报道编辑,编辑部,新智元导读,斯坦福和普林斯顿研究者发现,DeepSeek,R1生成的自定义CUDA内核,完爆了o1和Claude3.5Sonnet,拿下总排名第一,虽然目前只能在不到20%任务... AI资讯# DeepSeek# 信号# 斯坦福 1个月前02100
Grok DeepSeek效应初现 新智元报道编辑,KingHZ,新智元导读,DeepSeek和xAI相继用R1和Grok,3证明,预训练ScalingLaw不是OpenAI的护城河,将来95%的算力将用在推理,而不是现在的训练和推理各... AI资讯# DeepSeek# OpenAI# 云计算费用 1个月前01920
全面增强LLM推理 新智元报道编辑,LRST,新智元导读,基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向,按照思考方法收集训练数据集,通过有监督学习微调大语言模型;训练一个一致性奖励模型,并将该模型用作... AI资讯# 上下文# 云计算费用# 北航 1个月前01760
全球首次!2B复现DeepSeek 新智元报道编辑,编辑部HNZ,新智元导读,由UCLA等机构共同组建的研究团队,全球首次在20亿参数非SFT模型上,成功实现了多模态推理的DeepSeek,R1,啊哈时刻,!就在刚刚,我们在未经监督微调... AI资讯# DeepSeek# rl# 云计算费用 1个月前01980
Dynasor 思维扫描术 AI话痨终结者!UCSD清华提出 新智元报道编辑,好困犀牛,新智元导读,推理模型在复杂任务上表现惊艳,缺点是低下的token效率,UCSD清华等机构的研究人员发现,问题根源在于模型的,自我怀疑,!研究团队提出了Dynasor,CoT,... AI资讯# cot# dynasor# token 1个月前02000
32B击败DeepSeek 新智元报道编辑,桃子好困,新智元导读,32B小模型在超硬核,时间线索,推理谜题中,一举击败了o1、o3,mini、DeepSeek,R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍,用上... AI资讯# DeepSeek# mini# 云计算费用 1个月前01920
Meta等提出全新基准MLGym 谁是最强AI研究助手 LLM智能体大排名 新智元报道编辑,英智,新智元导读,AI研究智能体全新升级!Meta等推出MLGym,一个专门用于评估和开发LLM智能体的Gym环境,MLGym提供了标准化的基准测试,让LLM智能体在多任务挑战中展现真... AI资讯# ai研究助手# meta# 云计算费用 1个月前01720