在AI视频领域,可灵AI凭借其不断的技术创新和卓越的性能,一次又一次地刷新了行业的标杆。
近日,可灵AI视频生成新模型1.6正式上线,再次引起了业界的广泛关注。本次升级虽然只是在1.5的基础上升级了0.1,但却是一个巨大的飞跃,在物理规律真实感、人物运动表演和语义理解上有了显著的提升。我认为说是2.0都不为过。
下面,我就来对可灵AI 1.6模型进行详细的测试和分析。因为这次升级主要表现在图生视频上,所以,我就以可灵AI图片视频1.6模型来测试,测试结果只对标可灵AI1.5,不涉及其他视频生成工具,望周知。
一、语义理解加强
可灵AI 1.6在语义理解方面也取得了显著的进步。它能够更加准确地理解用户输入的提示词和画面内容,生成出更加符合用户需求的视频。
例如,在连续动作测试中,1.6版本能够准确地识别出画面中的主体和动作顺序,生成出连贯且自然的视频。此外,在识别画面左右等空间关系时,1.6版本也表现出了出色的能力。
比如,我需要生成下面这张图片的视频,提示词是:画面中的金毛犬站在落叶覆盖的道路上,望着画面右边一辆行驶过来的小轿车,忽然背景中的石桥从中断裂倒塌,尘土飞扬。
这里有3个动作,比较复杂。我用可灵AI1.5版生成视频,但是没有能理解3个动作的语义,没能做出我想要的视频画面。现在,我们来看看可灵1.6怎么样吧。
看看可灵AI生成的视频如何?生成的视频如下:
0/0
继续观看
可灵AI视频生成新模型1.6上线,一次跨越性的升级
优点:语义理解能力大幅提升,能够更好地满足用户的个性化需求。对画面内容的理解更加准确和深入,提高了视频生成的准确性和相关性。
缺点:在某些复杂场景下,如上例中,其实在测试的时候,我提示词后面还有一步,但没能生成效果。只有前3个动作才能生成,所以,我把第4个动作删除了。也就是说可灵AI对语义再解方面仍有待进一步优化和完善的空间。
二、人物运动表演加强
可灵AI 1.6在人物运动表演方面也有了显著的进步。无论是表情的细腻变化还是肢体动作的流畅度,都展现出了更加自然和真实的表现。
比如,我需要让下图中这个女孩做出跳舞的动作。提示词:图中的女孩在梦幻般的背景中旋转,镜头紧随她的动作,周围飘落着粉色花瓣和闪烁的星星。
可灵AI生成的视频如下:
优点:人物神态和肢体动作的表现更加自然和真实,增强了视频的代入感和感染力。对舞蹈等复杂动作的处理能力显著提升,拓展了视频生成的应用场景。
缺点:在人物做出的剧烈动作下,手部等细节部分的处理仍有待加强,偶尔会出现BUG。
三、更具真实的物理规律
可灵AI 1.6在物理规律的表现上实现了超进化。无论是切菜、倒茶还是人与物理的交互,都展现出了极高的真实感。
比如,下图中,我要让图片中的女孩拿起茶壶倒茶。提示词:图中的女孩将手中的茶杯轻轻放在桌子上,然后一只手拿起茶壶,缓缓倒茶入杯,营造出宁静和谐的氛围。
生成的视频如下:
优点:物理规律真实感大幅提升,可以看到茶水能够从茶壶中倒入到杯子中,稳定性和准确性显著提高,减少了生成视频中的错误和异常。
但是缺点也很明显:在这种复杂场景下,生成的错误概率还是很大的,对于图片中茶壶的构造明显它还不理解,视频中就出现了无中生有,另外生成了茶壶嘴。
四、总结
可灵AI视频生成新模型1.6在物理规律真实感、人物运动表演和语义理解方面都取得了显著的进步。它不仅为用户提供了更加逼真和自然的视频生成体验,还进一步拓展了视频生成的应用场景和可能性。
虽然在一些细节方面仍有待加强和完善,但整体而言,可灵AI 1.6无疑是一次跨越性的升级。我们期待可灵AI在未来能够继续引领AI视频领域的发展潮流,为用户带来更多惊喜和便利。