Hugging Face 开源 DeepSeek-R1 复现: GRPO 训练链路从黑盒变成脚手架

Hugging Face 开源 DeepSeek-R1 复现: GRPO 训练链路从黑盒变成脚手架

1天前

6月11日,一条被 AI 开发者圈反复转发的项目链接——huggingface/open-r1,标题直白:&# […]

小米 MiMo Code 开源

小米 MiMo Code 开源

1天前

6月11日深夜,小米把 MiMo 系列中专门面向代码场景的 MiMo Code 模型与推理框架一并开源到 mi […]

腾讯混元把 AI Infra 拆出来开源: HPC-Ops 算子集到底卡谁

腾讯混元把 AI Infra 拆出来开源: HPC-Ops 算子集到底卡谁

2天前

据36 氪披露,腾讯混元 AI Infra 团队把 HPC-Ops 推理算子库做了一次「全面升级」开源:包含五大关键算子,有效缓解 Attention 长尾延迟、显存搬运开销、跨卡通信三大工程瓶颈。表...