GPU也能跑DeepSeek同款GRPO!显存只需1 古董 新智元报道编辑,KingHZ,新智元导读,开源微调神器Unsloth带着黑科技又来了,短短两周后,再次优化DeepSeek,R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1,10!开源微... AI资讯# DeepSeek# gpu# 上下文 4周前03940
DeepSeek开源放大招 FlashMLA让H800算力狂飙!曝光低成本秘笈 新智元报道编辑,编辑部HNYZ,新智元导读,DeepSeek开源周第一天就放大招!FlashMLA强势登场,这是专为英伟达HopperGPU打造MLA解码内核,注意,DeepSeek训练成本极低的两大... AI资讯# DeepSeek# 内存# 算法 1个月前01620
历时6个月 超大规模实战手册 Hugging Face开源LLM !200页3万字4000次训练 用微信扫码二维码分享至好友和朋友圈新智元报道编辑,Aeneas英智,新智元导读,HuggingFace发布了,超大规模实战手册,,在512个GPU上进行超过4000个scaling实验,联创兼CEOC... AI资讯# gpu# 内存# 实战手册 1个月前01700
Ultra首发逆天 桌面超算 在家跑DeepSeek 512GB 苹果最强M3 新智元报道编辑,桃子英智,新智元导读,有史以来,搭载最强M3Ultra和M4Max芯片的MacStudio来了,更惊艳的是,M3Ultra这颗终极引擎能够支持512GB统一内存,直接在本地运行6000... AI资讯# DeepSeek# gpu# mac 1个月前01360