1. 阿里巴巴通义实验室发布端到端语音识别大模型FunAudio-ASR,提升高噪声环境识别准确率,降低幻觉。

2. 腾讯正式发布混元3D 3.0模型,建模精度提升3倍,几何分辨率达1536³,支持36亿体素超高清建模。

3. 字节跳动与香港大学联合推出开源视觉推理模型Mini-o3,支持多轮对话推理,在视觉搜索基准表现优异。

4. 谷歌DeepMind推出开源新型语言模型VaultGemma,通过在训练中添加可控噪声,使模型无法记忆或泄露训练数据中的敏感信息。

5. Meta AI发布MobileLLM-R1系列轻量级边缘推理模型,参数范围140M至950M,专注于数学、编码和科学推理。