GPU也能跑DeepSeek同款GRPO!显存只需1 古董 新智元报道编辑,KingHZ,新智元导读,开源微调神器Unsloth带着黑科技又来了,短短两周后,再次优化DeepSeek,R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1,10!开源微... AI资讯# DeepSeek# gpu# 上下文 3周前03340
!GPT LLM平均得分90 轻松拿捏高等数学 新智元报道编辑,KingHZ,新智元导读,在32道高等数学测试中,LLM表现出色,平均能得分90.4,按百分制计算,GPT,4o和MistralAI更是几乎没错!向量计算、几何分析、积分计算、优化问题... AI资讯# 向量# 定理# 微积分 3周前01740
OpenAI最强模型惨遭剖脑 CoT写下作弊自白书!不写代码耍心机被当场抓包 新智元报道编辑,Aeneas英智,新智元导读,如今的前沿推理模型,学会出来的作弊手段可谓五花八门,比如放弃认真写代码,开始费劲心思钻系统漏洞!为此,OpenAI研究者开启了,CoT监控,大法,让它的小... AI资讯# cot# OpenAI# 云计算费用 3周前01240
Ilya向全世界宣布 预训练结束了!全球AI数据耗尽 超级智能才是未来 新智元报道编辑,Aeneas好困,新智元导读,全球顶会NeurIPS2024中,Ilya登场演讲,向全世界宣告,预训练结束了!数据如同化石燃料般难以再生,未来,AI的发展方向就是具备自我意识的超级智能... AI资讯# ilya# 大模型# 深度学习 4周前01460
Dean带货揭Gemini训练秘籍 在TPU上scaling 谷歌超硬核教科书来了!Jeff 新智元报道编辑,KingHZ,新智元导读,谷歌团队发布LLM硬核技术教科书,从,系统视图,揭秘LLMScaling的神秘面纱,JeffDean强调书中藏着谷歌最强AI模型Gemini训练的更多信息,由... AI资讯# scaling# 原理# 大模型 4周前01660
3B模型爆发超强推理!微软论文实锤涌现 10美元成功复现DeepSeek顿悟时刻 新智元报道编辑,Aeneas好困,新智元导读,不到10美元,3B模型就能复刻DeepSeek的顿悟时刻了,来自荷兰的开发者采用轻量级的RL算法Reinforce,Lite,把复刻成本降到了史上最低!同... AI资讯# DeepSeek# 微软# 知名企业 4周前01780
AI提速300% Dean对话Transformer作者 谷歌AI掌门人Jeff 1000万倍工程师要来了 新智元报道编辑,犀牛,新智元导读,谷歌首席科学家JeffDean与Transformer作者NoamShazeer在一场访谈中不仅揭秘了让模型速度提升三倍的低精度计算技术,分享了,猫神经元,等早期AI... AI资讯# jeff# 上下文# 大模型 4周前01360
千亿资本百万年薪引爆人才争夺战!机器人上街遛狗 全球顶级AI大咖空降上海 用微信扫码二维码分享至好友和朋友圈新智元报道编辑,编辑部HYZ,新智元导读,魔都这三天,一场颠覆未来的AI超级盛宴,再次点燃了科技界热情!2025GDC大会上,全球顶尖开发者、AI行业大咖、著名开发者... AI资讯# ai大咖# 上海市# 人工智能 4周前01540
DeepSeek开源放大招 FlashMLA让H800算力狂飙!曝光低成本秘笈 新智元报道编辑,编辑部HNYZ,新智元导读,DeepSeek开源周第一天就放大招!FlashMLA强势登场,这是专为英伟达HopperGPU打造MLA解码内核,注意,DeepSeek训练成本极低的两大... AI资讯# DeepSeek# 内存# 算法 4周前01280
南大钱超团队攻克百亿晶体管难题 斩获EDA顶会2025最佳论文!AI学院本硕博生联手 新智元报道编辑,编辑部HYZ,新智元导读,南大AI学院钱超教授团队,荣获EDA顶会2025最佳论文奖!其中,论文一作、四作、五作都是南大人工智能学院的本硕博生,芯片设计领域的传统难题——如何为多达百亿... AI资讯# eda# 时序# 晶体管 4周前01240