Wan2.5(通义万相2.5)是阿里巴巴于2025年9月24日在杭州云栖大会发布的最新AI多模态生成模型,属于通义万相系列的重要升级版本。

该模型聚焦于视频与图像生成领域,核心突破在于音画同步生成能力和4K超高清输出,显著降低了专业级视频创作的门槛。

Wan2.5的发布标志着国产AI视频生成技术进入“电影级”阶段,其音画同步能力甚至超越了部分国际竞品(如Veo3)。

所以,接下来,我们就来测试一下Wan2.5的文生图和视频生成功能吧!

对了,忘了把通义万相的官网地址给大家了。

通义万相网址:https://tongyi.aliyun.com/wan/

一、AI图片生成功能测试

我们从以下几个方面来测试wan2.5(当然它有更多的效果,在这里就不全测了,要不然都可以再写一篇能义万相wan2.5图片生成测试篇了)。

1、材质与细节极限测试

提示词:超写实玻璃雕塑《融化的时钟》,表面有水滴滑落的痕迹,背景为文艺复兴风格图书馆,8K细节。

生成的图片如下:

大家可以对照下面这几点来看看它生成的效果:

1)玻璃材质的光影折射物理准确性;

2)水滴动态痕迹的静态捕捉能力;

3)复杂背景(书籍纹理)与主体的层次分离。

2、文化符号融合程度测试

提示词:赛博朋克版《清明上河图》,霓虹灯牌显示篆体汉字,机械骆驼商队穿梭全息水墨街道。

大家可以对照下面几点来查看图片的生成效果:

1)传统水墨与赛博元素的风格融合;

2)中文篆体字的生成准确性。

3、半透明材质效果测试

提示词:梦幻风格精灵肖像,银白色长发,半透明翅膀,在花丛中飞翔。

主要测试的就是Wan2.5对于半透明材质的层次表现。

二、AI视频生成功能测试

1、音画同步专项测试

提示词:

“全景镜头:京剧演员在数字戏台表演《霸王别姬》,唱段音频同步生成,水袖舞动带动粒子特效,4K高清。”

生成的视频如下:

测试重点:

1)口型与京剧唱段的精准匹配;

2)动作(水袖)与粒子特效的物理交互。

2、长镜头叙事测试

提示词:

“10秒连续镜头:无人机从城市夜景俯冲穿过玻璃幕墙,进入会议室后聚焦演讲者的全息PPT,背景音乐渐变为科技感BGM”。

测试重点:

1)10秒时长内的镜头连贯性;

2)场景过渡(户外→室内)的自然度;

3)音乐随场景的情绪转换。