让SFT重新伟大!CMU等华人学者提出全新 媲美复刻版DeepSeek 批判式微调 新智元报道编辑,peter东乔杨,新智元导读,在面对复杂的推理任务时,SFT往往让大模型显得力不从心,最近,CMU等机构的华人团队提出了,批判性微调,CFT,方法,仅在50K样本上训练,就在大多数基准... AI资讯# DeepSeek# sft# 华人学者 3周前02000
GPU也能跑DeepSeek同款GRPO!显存只需1 古董 新智元报道编辑,KingHZ,新智元导读,开源微调神器Unsloth带着黑科技又来了,短短两周后,再次优化DeepSeek,R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1,10!开源微... AI资讯# DeepSeek# gpu# 上下文 3周前03220
自己难以追上AI步伐 谷歌CEO劈柴 DeepSeek让人兴奋 新智元报道编辑,KingHZ,新智元导读,在世界政府峰会上,谷歌CEO劈柴分享了对AI的看法,认为DeepSeek的成功激动人心,AI将彻底改变人类的生活,他正在带领谷歌AllinAI,此外,他还分享... AI资讯# DeepSeek# 互联网# 知名企业 3周前03040
DeepSeek占比升至9.6% 稳居全球第二! 发布 全球生成式AI行业趋势 新智元报道编辑,英智,新智元导读,生成式AI正重塑众多行业格局!传统搜索、网站与自由开发者、教育科技等行业受到冲击,AI对行业变革又有哪些推动作用,答案就在报告中,近日,SimilarWeb发布了最新... AI资讯# DeepSeek# 代码# 全球生成式 4周前01800
百度官宣 全面接入DeepSeek!7亿用户光速进入AI搜索时代 新智元报道编辑,编辑部HNYZ,新智元导读,刚刚又一巨头下场,百度搜索官宣,全面接入DeepSeek!同时集成的,还有文心大模型深度搜索功能,中国互联网行业,再次迎来标志性事件——AllinDeepS... AI资讯# DeepSeek# 千帆# 搜索引擎 4周前01620
马斯克20万块GPU炼出Grok 新智元报道编辑,编辑部HNYZ,新智元导读,马斯克口中全世界最聪明大模型Grok,3,终于震撼登场!20万块GPU训出的模型,实属全球首次,果然,Grok,3已火速屠榜多个排行榜,击败o3,mini,... AI资讯# DeepSeek# gpu# OpenAI 4周前02000
但没任何科学进步 CEO放话 诺奖得主DeepMind DeepSeek是中国最好AI模型 新智元报道编辑,犀牛好困,新智元导读,xAI、谷歌DeepMind和Anthropic的CEO们纷纷对DeepSeek的技术创新性提出质疑,认为其并未带来实质性的科学突破,AI大佬纷纷泼冷水,到底是技... AI资讯# deepmind# DeepSeek# hassabis 4周前01160
DeepSeek下周顶级代码库5连发!巅峰对决OpenAI 正面硬刚GPT 下周,真的要卷起来了!刚刚,DeepSeek官宣连更5天,全是开源,5个代码库,每日一个彩蛋,完整公告如下,从下周开始,我们将开源5个代码仓库,以完全透明的方式与大家分享我们虽小但真诚的进展,这些在我... AI资讯# DeepSeek# OpenAI# 代码库 4周前01360
全网独家!扣子Coze支持DeepSeek工具调用 零代码搭建多模态神器 新智元报道编辑,编辑部HNYZ,新智元导读,字节扣子Coze放大招!全网独家支持DeepSeek,R1,V3工具调用,自由组合插件,0代码打造AI专属助手,不论是看图、联网、写代码,DeepSeek无... AI资讯# DeepSeek# 代码# 命令提示符 4周前01140
3B模型爆发超强推理!微软论文实锤涌现 10美元成功复现DeepSeek顿悟时刻 新智元报道编辑,Aeneas好困,新智元导读,不到10美元,3B模型就能复刻DeepSeek的顿悟时刻了,来自荷兰的开发者采用轻量级的RL算法Reinforce,Lite,把复刻成本降到了史上最低!同... AI资讯# DeepSeek# 微软# 知名企业 4周前01600