1. 谷歌推出视频生成模型Veo 3.1,提升音频输出、编辑控制和图像转视频效果,可在Gemini应用、Vertex AI等平台使用。

2. Anthropic发布小型AI模型Claude Haiku 4.5,以低成本提供强大性能,适合实时、低延迟任务,性能接近Sonnet 4。

3. 字节跳动发布FaceCLIP视觉-语言模型,专注于人脸理解和生成,通过文本和参考图像生成身份一致的人脸图像。

4. 巨人网络AI Lab与清华大学联合发布开源多方言语音合成大模型框架DiaMoE-TTS,解决方言TTS模型依赖专有数据的难题。

5. Meta超级智能实验室推出REFRAG技术,提升大型语言模型在RAG任务中的推理速度超过30倍,通过压缩上下文内容优化效率。