自从可灵AI视频生成模型2.0上线以来,就拉高了我们对于AI视频生成高质量的期待。
但是可灵AI视频生成2.0模型不仅需要会员才可以使用,而且即使是会员,也需要100灵感值生成一个5秒的视频,而黄金会员一个月只有660灵感值,只能生成6个2.0模型视频。
所以,即使可灵AI的视频生成模型2.0效果很好,但是并不适合我们普通大众使用。
就在我们期待可以出现与可灵AI2.0模型相媲美的且免费或价格不要那么贵的视频生成工具出现的时候,即梦AI在图片生成3.0模型上线后不久,又悄悄的上线了视频生成3.0模型。
用3.0模型生成一个5秒的视频只需要10积分。而即梦AI每天登录会送66-120积分不等。也就是说我们每天都可以免费生成最少6个视频,而如果你有多个抖音账号的话,免费可以生成的视频就更多了。
注:即梦AI图片生成3.0模型我也发布过测试文章,没看过的,可以点击查看:即梦AI图片生成3.0模型全方位测试,效果是这样的…
由于,我对视频生成模型的质量并没有什么期待感。所以,当即梦AI3.0上线后,我随便生成了几张图片,然后测试了一下3.0模型的图生视频功能,下面就是随便测试的结果:
图片:


视频1:比心
真的没想到,3.0模型的图生视频功能还是很可以的。完全出乎了我的意料。这不由的引起了我的重视。(备注:视频不清晰的原因不是视频生成的原因,是上传到网站是被压缩了,高清原视频请去“阿奇谈AI”公众号查看。)
因为上面只是图生视频的测试。
所以,接下来我就再来测试一下3.0模型的文生视频功能效果。
从语义的响应、视频动态质量、视频画面质量这3个方面来进行测试:
一、语义响应测试
(备注:为测试实际的效果,没有抽卡,视频均为一次生成)。
1、“复杂场景元素关联性、抽象情感与具象画面的匹配度”测试
提示词:请生成一位戴草帽的渔夫在黄昏的海边撒网,网落水时惊起一群海鸥,远处有渔船缓缓驶向被晚霞染成紫红色的天际线,要求呈现孤独与收获的双重意境。

生成的视频如下:
测试结果:正确的响应了提示词的语义,各种画面细节都有展示,而且对于视频画面的意境也能正确生成。
2、“时间线逻辑理解、科学概念的视觉化能力”测试
提示词:展示实验室玻璃器皿中发光液体从沸腾到冷却的全过程,伴随试管口飘出渐变色的烟雾,最终在桌面上凝结成水晶状物质,要求精准呈现能量转化的科技叙事。
测试结果:提示词语义响应是可以的。唯一的缺点是烟竟然从玻璃杯的中间部分冒出,不符合常理。
二、视频动态质量
1、“运动幅度细节展示”测试
提示词:一只体型巨大的巨猿,以震撼的姿态正奋力捶胸咆哮,肩部肌肉极度拉伸,呈现出夸张的形态,肩部皮肤紧绷,青筋暴起 。整体画面色调偏暗黄与棕褐,营造出力量感和原始氛围,背景是荒野,凸显巨猿的强大与孤独,增强画面所传达的力量感。
测试结果:运动幅度明显不是很好,没有表现出巨猿奋力捶胸咆哮的那种力量感。另外,测试时,我还让巨猿打击地面,然后碎石以慢动作飞溅四散,但效果比这个更差,都是力量感严重不足,不能够表现巨猿的力量。
2、“多物体运动协调性、高速动作的物理模拟”测试
提示词:生成身着汉服的舞者在竹林间360度旋转跳跃,要求衣袖飘动轨迹自然连贯,竹叶下落速度与舞者动作形成力学呼应,慢镜头呈现发丝与衣带同步飞扬的细节
测试结果:动作要求都能做到,多个物体间的运动协调性也很好。我认为的缺点是生成的汉服不好看,而且舞者也不够漂亮。不过所说的缺点只是我个人的看法,不代表任何人。
三、视频画面质量
1、测试:高分辨率细节呈现、复杂光影材质处理
提示词:生成4K级赛博朋克街道:要求霓虹广告牌文字锐利无锯齿,潮湿路面精准反射全息投影,机械义眼瞳孔中的电路纹路在特写镜头下保持清晰
2、测试:时代感电影质感画面
提示词:身着白底蓝花布衫的少女静坐于知青宿舍木床,老旧搪瓷杯在窗台泛着微光,两束麻花辫垂落胸前随呼吸轻轻起伏,阳光穿过木格窗在她长睫毛上投下细碎金斑,发梢随穿堂风扬起细小弧度。
测试出来的视频画面质量怎么样,大家可以看得出来,就不必多说了。