1. 面壁智能与清华大学深圳国际研究生院联合推出0.5B参数语音生成模型VoxCPM,在语音合成自然度、音色相似度等关键指标上表现优异,已在多个平台开源。
2. 深度求索团队研究成果《DeepSeek-R1》登上《Nature》封面,成为首个通过同行评审的大语言模型,通过纯强化学习训练框架显著提升模型推理能力。
3. 快手旗下可灵AI推出全新数字人功能,用户可通过上传图片和文字/音频生成1080p/48FPS、最长1分钟的数字人视频,采用DiT架构实现口型同步和情绪动作控制。
4. ElevenLabs发布Studio3.0平台,集成AI语音生成、自动配乐、音效生成、字幕添加、降噪处理和视频剪辑等功能,支持文本直接修改音频。
5. Meta推出MobileLLM-R1小型推理模型,针对数学、编码和科学推理优化,解决企业成本、隐私和控制问题,目前仅限非商业用途。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。