算法,2345AI导航，精选免费好用的人工智能工具箱。专注于全球优质AI产品、教程和资源分享。涵盖了AI绘画，AI游戏，AI视频，AI网址大全，AI工具软件，AI搜索、AI写作、AI剪辑、AI动画、AI3D、AI游戏、AI营销等等。持续关注技术及行业动态，优质内容持续更新。 | 第2页

新智元报道编辑，peter东乔杨，新智元导读，近日，Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法，拒绝指令偏好，RIP，，得到了YannLeCun的转赞，相比未经过滤的数据，使...

1个月前

02140

新智元报道编辑，LRST，新智元导读，哈尔滨工业大学团队提出HEROS，GAN技术，通过生成式深度学习将低成本加速度计信号转化为高精度信号，突破其精度与量程瓶颈，该技术利用最优传输监督和拉普拉斯能量调...

1个月前

01800

新智元报道编辑，编辑部，新智元导读，斯坦福和普林斯顿研究者发现，DeepSeek，R1生成的自定义CUDA内核，完爆了o1和Claude3.5Sonnet，拿下总排名第一，虽然目前只能在不到20%任务...

1个月前

02100

新智元报道编辑，KingHZ，新智元导读，DeepSeek和xAI相继用R1和Grok，3证明，预训练ScalingLaw不是OpenAI的护城河，将来95%的算力将用在推理，而不是现在的训练和推理各...

1个月前

01920

新智元报道编辑，LRST，新智元导读，基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向，按照思考方法收集训练数据集，通过有监督学习微调大语言模型；训练一个一致性奖励模型，并将该模型用作...

1个月前

01760

新智元报道编辑，编辑部HNZ，新智元导读，由UCLA等机构共同组建的研究团队，全球首次在20亿参数非SFT模型上，成功实现了多模态推理的DeepSeek，R1，啊哈时刻，！就在刚刚，我们在未经监督微调...

1个月前

01980

新智元报道编辑，好困犀牛，新智元导读，推理模型在复杂任务上表现惊艳，缺点是低下的token效率，UCSD清华等机构的研究人员发现，问题根源在于模型的，自我怀疑，！研究团队提出了Dynasor，CoT，...

1个月前

02000

新智元报道编辑，桃子好困，新智元导读，32B小模型在超硬核，时间线索，推理谜题中，一举击败了o1、o3，mini、DeepSeek，R1，核心秘密武器便是GRPO，最关键的是训练成本暴降100倍，用上...

1个月前

01920

新智元报道编辑，英智，新智元导读，AI研究智能体全新升级！Meta等推出MLGym，一个专门用于评估和开发LLM智能体的Gym环境，MLGym提供了标准化的基准测试，让LLM智能体在多任务挑战中展现真...

1个月前

01720

算法