1. 谷歌推出视频生成模型Veo 3.1,提升音频输出、编辑控制和图像转视频效果,可在Gemini应用、Vertex AI等平台使用。
2. Anthropic发布小型AI模型Claude Haiku 4.5,以低成本提供强大性能,适合实时、低延迟任务,性能接近Sonnet 4。
3. 字节跳动发布FaceCLIP视觉-语言模型,专注于人脸理解和生成,通过文本和参考图像生成身份一致的人脸图像。
4. 巨人网络AI Lab与清华大学联合发布开源多方言语音合成大模型框架DiaMoE-TTS,解决方言TTS模型依赖专有数据的难题。
5. Meta超级智能实验室推出REFRAG技术,提升大型语言模型在RAG任务中的推理速度超过30倍,通过压缩上下文内容优化效率。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。


