GPU也能跑DeepSeek同款GRPO!显存只需1 古董 新智元报道编辑,KingHZ,新智元导读,开源微调神器Unsloth带着黑科技又来了,短短两周后,再次优化DeepSeek,R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1,10!开源微... AI资讯# DeepSeek# gpu# 上下文 3周前03220
AI提速300% Dean对话Transformer作者 谷歌AI掌门人Jeff 1000万倍工程师要来了 新智元报道编辑,犀牛,新智元导读,谷歌首席科学家JeffDean与Transformer作者NoamShazeer在一场访谈中不仅揭秘了让模型速度提升三倍的低精度计算技术,分享了,猫神经元,等早期AI... AI资讯# jeff# 上下文# 大模型 4周前01280
Spotlight 2025 单提示生成 主体一致 且无需训练!已斩获ICLR 图像 新智元报道编辑,LRST,新智元导读,单提示单故事,1Prompt1Story,是一种无训练的文本到图像生成方法,通过整合多个提示为一个长句子,并结合奇异值重加权,SVR,和身份保持交叉注意力,IPC... AI资讯# 上下文# 主体一致 4周前01720
成历史!AI初创全新Zep系统 知识图谱破解上下文诅咒 大模型 记忆断片 新智元报道编辑,peter东乔杨,新智元导读,Zep,一个为大模型智能体提供长期记忆的插件,能将智能体的记忆组织成情节,从这些情节中提取实体及其关系,并将它们存储在知识图谱中,从而让用户以低代码的方式... AI资讯# zep系统# 上下文# 云计算费用 4周前01180
全面增强LLM推理 新智元报道编辑,LRST,新智元导读,基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向,按照思考方法收集训练数据集,通过有监督学习微调大语言模型;训练一个一致性奖励模型,并将该模型用作... AI资讯# 上下文# 云计算费用# 北航 4周前01320