小模型指导大模型!田渊栋等爆锤蒸馏 更可控 新方法更高效 更透明 新智元报道编辑,KingHZ,新智元导读,基于连续概念,Meta团队新研究提出了超越,下一个token预测,语言建模新范式,更加重要的是,新方法不仅能增强原有的范式,而且比起知识蒸馏,数据量减少20%... AI资讯# 云计算费用# 向量# 爆锤蒸馏 4周前01580
全面增强LLM推理 新智元报道编辑,LRST,新智元导读,基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向,按照思考方法收集训练数据集,通过有监督学习微调大语言模型;训练一个一致性奖励模型,并将该模型用作... AI资讯# 上下文# 云计算费用# 北航 4周前01500
Deep 端到端强化微调是关键 Research订阅全推送 5分钟顶人类8小时!OpenAI 新智元报道编辑,KingHZ英智,新智元导读,最近,OpenAI的研究团队在采访中表示,全新的DeepResearch功能,可以为你节省几个小时甚至几天的时间!DeepResearch,深度研究,是继... AI资讯# deep# isa# OpenAI 4周前01440
OpenAI最强模型惨遭剖脑 CoT写下作弊自白书!不写代码耍心机被当场抓包 新智元报道编辑,Aeneas英智,新智元导读,如今的前沿推理模型,学会出来的作弊手段可谓五花八门,比如放弃认真写代码,开始费劲心思钻系统漏洞!为此,OpenAI研究者开启了,CoT监控,大法,让它的小... AI资讯# cot# OpenAI# 云计算费用 3周前01400
全球首次!2B复现DeepSeek 新智元报道编辑,编辑部HNZ,新智元导读,由UCLA等机构共同组建的研究团队,全球首次在20亿参数非SFT模型上,成功实现了多模态推理的DeepSeek,R1,啊哈时刻,!就在刚刚,我们在未经监督微调... AI资讯# DeepSeek# rl# 云计算费用 4周前01400
智源BGE 新智元报道编辑,编辑部HYZ,新智元导读,智源联手多所顶尖高校发布的多模态向量模型BGE,VL,重塑了AI检索领域的游戏规则,它凭借独创的MegaPairs合成数据技术,在图文检索、组合图像检索等多项... AI资讯# vl# 云计算费用# 智源 4周前01300
成历史!AI初创全新Zep系统 知识图谱破解上下文诅咒 大模型 记忆断片 新智元报道编辑,peter东乔杨,新智元导读,Zep,一个为大模型智能体提供长期记忆的插件,能将智能体的记忆组织成情节,从这些情节中提取实体及其关系,并将它们存储在知识图谱中,从而让用户以低代码的方式... AI资讯# zep系统# 上下文# 云计算费用 4周前01280
R1 刚刚 3.7降世!最强编程大脑暴击DeepSeek 全球首个混合推理模型Claude 新智元报道编辑,编辑部JHNY,新智元导读,就在刚刚,Anthropic祭出首个混合推理Claude3.7Sonnet,堪称扩展思考模式的最强模型,在最新编码测试中,新模型暴击o3,mini、Deep... AI资讯# DeepSeek# 云计算费用# 数学 4周前01120