6月11日深夜,小米把 MiMo 系列中专门面向代码场景的 MiMo Code 模型与推理框架一并开源到 mimo.xiaomi.com,社区当晚就把这条消息推上 Hacker News 首页。同步登场的实测稿件指出,MiMo Code 在吞吐端跑出每秒 1000+ Tokens 的成绩,所谓 Vibe Coding 任务七秒即可拿到首版交付,把“国产代码模型能不能上生产“这个老问题摆到台面上。

20260612083624706
小米 MiMo Code 开源 1

一、MiMo Code 是什么:1T 参数的代码专用模型

小米 MiMo 系列最早在 5 月底亮相,其中 MiMo-7B 是面向通用文本的小尺寸基座模型,主打“小而强“路线。6月11日放出的 MiMo Code,是这条产品线上第一个明确针对“代码生成“做后训练的版本,参数规模拉到 1T(1 万亿)级别,定位是“推理时算力可控、产出可投产”。

按官方说法,MiMo Code 不是单一权重文件,而是把基础模型、代码指令微调、推理加速脚手架打包在一起的工程集合。开发者拿到的不只是 checkpoint,还有完整的推理部署链路——这是小米在开源策略上和“只发权重“的几家国内厂商最大的差异。

二、HN 上发生了什么:米米开源瞬间冲上首页

6月11日 22:27,HN 用户 apeters 投递 “MiMo Code is now released and open-source” 一帖,几个小时内被顶到 350+ 分、190+ 评论,单帖讨论热度进入当日 HN Top 10。

社区讨论的焦点集中在三点:1T 参数在国产代码模型里属于什么水平;MIT/Apache 这类宽松协议对二次开发是否友好;以及小米是不是会跟进闭源版本。

评论区出现频率最高的两个关键词是 “Vibe Coding” 和 “Self-hosted”——前者指向 Anthropic 最近力推的“七秒交付“演示,后者指向企业用户对数据本地化的需求。MiMo Code 同时踩中这两个叙事,传播速度自然快。

三、量子位实测:1000+ Tokens/秒,七秒交付

6月11日 09:18,量子位放出的实测稿件标题直接点出三个数字——每秒 1000+ Tokens 吞吐、Vibe Coding 七秒交付、模型规模 1T。这是 MiMo Code 公开实测中第一份带“端到端延迟“和“持续吞吐“双指标的报告。

测试环境用的是消费级 GPU(具体型号稿件未披露),连续生成 30 分钟不掉速,对比 Anthropic Claude Fable 5 在同等任务上的吞吐数据后,给出“国产代码模型第一次把推理成本压到 Fable 5 Low 档之下“的判断。

需要注意,“七秒交付“对应的是单个中等长度函数的端到端时间,不包括多轮迭代。如果把“反复改需求“算进去,总交付时间会显著拉长——但作为单点演示,足够让市场重新评估国产代码模型的可用性。

四、为什么是小米:硬件 + 大模型 + 终端的闭环

把 MiMo Code 放到小米的整体战略里看,开源不是“为了开源而开源”,而是补齐硬件公司做大模型的最后一环。小米同时拥有终端(手机/IoT)、自研芯片、以及澎湃 OS 系统,每一环都需要 AI 能力下沉。

对小米而言,开源 MiMo Code 比闭源商业化更划算:闭源版本在 Anthropic/OpenAI 面前没有差异化优势,而开源能换来开发者社区的反馈、二次贡献、以及“小米的代码模型“这个长期品牌资产。

对社区而言,多一个 1T 级、面向代码、协议宽松的国产选项,意味着 Agent 工具链的国产替代有了真实可用的底座——不必再为“国产模型能不能跑 5 万行仓库“反复写评测。

五、MiMo Code 之后:国产代码模型的下一步

把视野从单点事件拉到行业,MiMo Code 是 6 月以来第三个“重量级“国产代码模型发布动作。前面有 DeepSeek-R1 的开源复现项目(huggingface/open-r1),后面还有多家厂商的代码后训练版本在路上。

短期的看点是“谁先跑到 100k star”——这是开源社区对“代码模型质量“最直接的投票。中期看,MiMo Code 的成败取决于是否真的有企业用户在生产环境里跑起来,而不只是写一篇 P5 级别体验稿。

更长期的判断是:国产代码模型第一次有“敢和 Claude Fable 5 Low 档对位“的产品力,这本身就是 2026 年上半年 AI 行业最值得记录的变化之一。


本文由 AI 协助撰写,最终内容由本站编辑团队审核。