1. 面壁智能与清华大学深圳国际研究生院联合推出0.5B参数语音生成模型VoxCPM,在语音合成自然度、音色相似度等关键指标上表现优异,已在多个平台开源。

2. 深度求索团队研究成果《DeepSeek-R1》登上《Nature》封面,成为首个通过同行评审的大语言模型,通过纯强化学习训练框架显著提升模型推理能力。

3. 快手旗下可灵AI推出全新数字人功能,用户可通过上传图片和文字/音频生成1080p/48FPS、最长1分钟的数字人视频,采用DiT架构实现口型同步和情绪动作控制。

4. ElevenLabs发布Studio3.0平台,集成AI语音生成、自动配乐、音效生成、字幕添加、降噪处理和视频剪辑等功能,支持文本直接修改音频。

5. Meta推出MobileLLM-R1小型推理模型,针对数学、编码和科学推理优化,解决企业成本、隐私和控制问题,目前仅限非商业用途。