生成速度(专用GPU峰值)
~1479 tokens/s
参数量
26B(MoE)
架构差异
256 token/块并行

本期6条要闻:Anthropic Claude Fable 5全面商用(降价超50%,含Mythos 5向200家机构开放);Google同日推出DiffusionGemma(文本扩散架构,速度最高4倍)和Gemini 3.5 Live Translate(70+语言实时语音互译);快手可灵AI两周年全球用户破亿;美团AI浏览器Tabbit 1.0正式上线;乐聚机器人被抽中现场检查,成创业板第四套标准首申机器人企业。

Research Brief

快讯 小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro UltraSpeed 模式,1 trillion 参数旗舰模型输出速度首破 1000 tokens/s(FP4 混合量化 + 块级并行推测解码),API 限时开放至 6 月 23 日,定价为标准版 3 倍12。
Add more perspectives or context around this Post.