GPU也能跑DeepSeek同款GRPO!显存只需1 古董 新智元报道编辑,KingHZ,新智元导读,开源微调神器Unsloth带着黑科技又来了,短短两周后,再次优化DeepSeek,R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1,10!开源微... AI资讯# DeepSeek# gpu# 上下文 3周前03260
自己难以追上AI步伐 谷歌CEO劈柴 DeepSeek让人兴奋 新智元报道编辑,KingHZ,新智元导读,在世界政府峰会上,谷歌CEO劈柴分享了对AI的看法,认为DeepSeek的成功激动人心,AI将彻底改变人类的生活,他正在带领谷歌AllinAI,此外,他还分享... AI资讯# DeepSeek# 互联网# 知名企业 3周前03120
让SFT重新伟大!CMU等华人学者提出全新 媲美复刻版DeepSeek 批判式微调 新智元报道编辑,peter东乔杨,新智元导读,在面对复杂的推理任务时,SFT往往让大模型显得力不从心,最近,CMU等机构的华人团队提出了,批判性微调,CFT,方法,仅在50K样本上训练,就在大多数基准... AI资讯# DeepSeek# sft# 华人学者 3周前02160
马斯克20万块GPU炼出Grok 新智元报道编辑,编辑部HNYZ,新智元导读,马斯克口中全世界最聪明大模型Grok,3,终于震撼登场!20万块GPU训出的模型,实属全球首次,果然,Grok,3已火速屠榜多个排行榜,击败o3,mini,... AI资讯# DeepSeek# gpu# OpenAI 4周前02000
DeepSeek占比升至9.6% 稳居全球第二! 发布 全球生成式AI行业趋势 新智元报道编辑,英智,新智元导读,生成式AI正重塑众多行业格局!传统搜索、网站与自由开发者、教育科技等行业受到冲击,AI对行业变革又有哪些推动作用,答案就在报告中,近日,SimilarWeb发布了最新... AI资讯# DeepSeek# 代码# 全球生成式 4周前01980
感谢DeepSeek!英伟达财报破纪录 Blackwell开卖血赚800亿老黄笑疯 黄仁勋 新智元报道编辑,Aeneas,新智元导读,英伟达公布的最新财报,直接破纪录了!全年营收1305亿美元,创下历史新高,Blackwell更是需求惊人,老黄直接开口感谢DeepSeek,它带来的全新Sca... AI资讯# DeepSeek# NVIDIA# 国际消费电子展 4周前01960
R1效率神器!1000场直播爆款拆解 DeepSeek 飞书多维表格 新智元报道编辑,编辑部HYZ,新智元导读,DeepSeek开源AI引爆全民应用潮!飞书多维表格成为最佳入门级方案,如今亚朵星球、茶百道等纷纷接入,让团队如虎添翼显著提升效率,2025年开年,DeepS... AI资讯# DeepSeek# 朱萧木# 电商平台 4周前01720
DeepSeek全面开源V3 刚刚 新智元报道编辑,KingHZ好困,新智元导读,DeepSeek公开推理系统架构,成本利润率可达545%!明天还有更大惊喜吗,就在刚刚,当大家以为开源周已经结束的时候,真,OpenAI,DeepSeek... AI资讯# DeepSeek# 冗余# 大模型 4周前01680
32B击败DeepSeek 新智元报道编辑,桃子好困,新智元导读,32B小模型在超硬核,时间线索,推理谜题中,一举击败了o1、o3,mini、DeepSeek,R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍,用上... AI资讯# DeepSeek# mini# 云计算费用 4周前01680
Grok DeepSeek效应初现 新智元报道编辑,KingHZ,新智元导读,DeepSeek和xAI相继用R1和Grok,3证明,预训练ScalingLaw不是OpenAI的护城河,将来95%的算力将用在推理,而不是现在的训练和推理各... AI资讯# DeepSeek# OpenAI# 云计算费用 4周前01660