可灵AI视频生成新模型1.6上线，一次跨越性的升级

在AI视频领域，可灵AI凭借其不断的技术创新和卓越的性能，一次又一次地刷新了行业的标杆。

近日，可灵AI视频生成新模型1.6正式上线，再次引起了业界的广泛关注。本次升级虽然只是在1.5的基础上升级了0.1，但却是一个巨大的飞跃，在物理规律真实感、人物运动表演和语义理解上有了显著的提升。我认为说是2.0都不为过。

下面，我就来对可灵AI 1.6模型进行详细的测试和分析。因为这次升级主要表现在图生视频上，所以，我就以可灵AI图片视频1.6模型来测试，测试结果只对标可灵AI1.5，不涉及其他视频生成工具，望周知。

一、语义理解加强

可灵AI 1.6在语义理解方面也取得了显著的进步。它能够更加准确地理解用户输入的提示词和画面内容，生成出更加符合用户需求的视频。

例如，在连续动作测试中，1.6版本能够准确地识别出画面中的主体和动作顺序，生成出连贯且自然的视频。此外，在识别画面左右等空间关系时，1.6版本也表现出了出色的能力。

比如，我需要生成下面这张图片的视频，

提示词是：画面中的金毛犬站在落叶覆盖的道路上，望着画面右边一辆行驶过来的小轿车，忽然背景中的石桥从中断裂倒塌，尘土飞扬。

这里有3个动作，比较复杂。我用可灵AI1.5版生成视频，但是没有能理解3个动作的语义，没能做出我想要的视频画面。现在，我们来看看可灵1.6怎么样吧。

看看可灵AI生成的视频如何？生成的视频如下：

优点：语义理解能力大幅提升，能够更好地满足用户的个性化需求。对画面内容的理解更加准确和深入，提高了视频生成的准确性和相关性。

缺点：在某些复杂场景下，如上例中，其实在测试的时候，我提示词后面还有一步，但没能生成效果。只有前3个动作才能生成，所以，我把第4个动作删除了。也就是说可灵AI对语义再解方面仍有待进一步优化和完善的空间。

二、人物运动表演加强

可灵AI 1.6在人物运动表演方面也有了显著的进步。无论是表情的细腻变化还是肢体动作的流畅度，都展现出了更加自然和真实的表现。

比如，我需要让下图中这个女孩做出跳舞的动作。

提示词：图中的女孩在梦幻般的背景中旋转，镜头紧随她的动作，周围飘落着粉色花瓣和闪烁的星星。

可灵AI生成的视频如下：

优点：人物神态和肢体动作的表现更加自然和真实，增强了视频的代入感和感染力。对舞蹈等复杂动作的处理能力显著提升，拓展了视频生成的应用场景。

缺点：在人物做出的剧烈动作下，手部等细节部分的处理仍有待加强，偶尔会出现BUG。

三、更具真实的物理规律

可灵AI 1.6在物理规律的表现上实现了超进化。无论是切菜、倒茶还是人与物理的交互，都展现出了极高的真实感。

比如，下图中，我要让图片中的女孩拿起茶壶倒茶。

提示词：图中的女孩将手中的茶杯轻轻放在桌子上，然后一只手拿起茶壶，缓缓倒茶入杯，营造出宁静和谐的氛围。

生成的视频如下：

优点：物理规律真实感大幅提升，可以看到茶水能够从茶壶中倒入到杯子中，稳定性和准确性显著提高，减少了生成视频中的错误和异常。

但是缺点也很明显：在这种复杂场景下，生成的错误概率还是很大的，对于图片中茶壶的构造明显它还不理解，视频中就出现了无中生有，另外生成了茶壶嘴。

四、总结

可灵AI视频生成新模型1.6在物理规律真实感、人物运动表演和语义理解方面都取得了显著的进步。它不仅为用户提供了更加逼真和自然的视频生成体验，还进一步拓展了视频生成的应用场景和可能性。

虽然在一些细节方面仍有待加强和完善，但整体而言，可灵AI 1.6无疑是一次跨越性的升级。我们期待可灵AI在未来能够继续引领AI视频领域的发展潮流，为用户带来更多惊喜和便利。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。