在AI视频领域的竞技场上,一场无声的变革正在悄然上演。曾经,Sora作为该领域的佼佼者,被众多玩家视为对标的目标,其发布后的一年多时间里,一张流传于社交媒体上的梗图生动描绘了Sora坐在王座上,周围是众多膜拜者的场景,其中包括Runway、Pika、PixVerse等十多个竞争对手。
然而,时过境迁,随着可灵、即梦等中国玩家的崛起,Sora的光芒似乎已不再那么耀眼。一位AI视频从业者透露,现在的关注点已不再是简单地对标Sora,而是如何加快缩短AI视频生产和消费之间的鸿沟。在各大AI论坛的现场,讨论DeepSeek的声音逐渐盖过了Sora,这背后折射出业界对AI视频加速商业化和普及的迫切期待。
进入2025年,AI视频领域的战火愈烧愈烈。不到半年的时间里,众多玩家纷纷发布最新的视频生成模型和产品更新,竞争态势愈发激烈。从解决视频生成的一致性和可控性,到降低产品门槛、增强可编辑能力,再到融入工作流,让产品更加易用,行业玩家以一个月,甚至是半个月一次的迭代速度加速AI视频的落地。然而,新的问题也随之浮现。
多位中腰部AIGC创业者表达了他们的焦虑。从商用角度来看,当前AI视频落地仍存在诸多困难。商单报价持续走低,抽卡不稳定,制作成本仍然偏高。就现有产品功能而言,多数AI视频产品正趋于同质化。除了创意特效外,大多数AI视频产品都支持主体参考、音效生成、多模态编辑等功能。随着功能的丰富和选择的增多,赛道玩家间在视频生成的质量、成本和交互形式等方面的竞争也日益激烈。
在这样的背景下,不提Sora的AI视频玩家开始将竞争焦点放在了三个维度上:卷一致性、卷可用性和卷可玩性。所谓“一致性”,指的是视频生成过程中帧与帧之间的过渡性、动作的连续性和场景的真实性。为了提升一致性,AI视频玩家在输入端加强了控制力,比如提升图生视频能力,增加首尾帧、笔刷工具和多图参考等,让用户能够自定义视频的开头和结尾,同时保证生成内容中的一致性。多模态融合也是提升一致性的重要手段之一。
在卷“可用性”方面,AI视频玩家致力于完善创作者工作流相关配套工具。AIGC从业者可可观察到,创作者主要关注三个核心问题:动态编辑能力、镜头运动能力和端到端能力。针对这些需求,AI视频玩家纷纷推出了相应的解决方案,比如可灵等玩家支持多模态编辑,给视频替换、添加或删减元素;即梦的“故事创作”模式可批量生成分镜;Runway也上线了视频编辑器。
而在卷“可玩性”方面,通过创意特效和模版吸引用户则是不少玩家引流的关键手段。Pika凭借Pikaffects、Pikadditions走红互联网;PixVerse靠着毒液效果走红;Vidu则承接了GPT-4吉卜力风流量外溢。这些创意特效和模版不仅丰富了AI视频产品的功能,也为用户带来了更多的乐趣和选择。
然而,尽管AI视频产品功能日益丰富,但创作者们却感到越来越焦虑。随着AI视频玩家加速迭代模型和产品,制作成本居高不下,而客户对AI视频的降本需求却在不断增加。以可灵2.0为例,生成一条5秒钟的视频需要100灵感值,黄金会员月费58元可获得660灵感值,能抽卡6次,一次生成约为10元。如果对画质要求低,单个镜头(一般1-5s)需要抽卡5次左右,意味着生成一个镜头就需要50元。如果涉及更复杂的场景和效果抽卡次数可能高达数十次,单个镜头成本可高达数百元。因此,一个三分钟的AI短片在不算人力成本的情况下保守估计就要数万元,这对于许多创作者来说是不划算的。
在商业化方面,AI视频大模型的价格下降趋势并不明显。C端目前采取的阶梯付费订阅模式国内对比国外玩家价格优势明显,但在最先进模型上头部厂商的定价并未松动。而在B端API上国内厂商的价格优势则明显高于国外厂商。一位行业人士预测短期内视频大模型的定价不会出现激烈的变化。一方面从现有产品层看尽管开源视频生成模型中不乏如阿里通义万相Wan2.1等玩家但取得身位领先的依旧是闭源大模型;另一方面降价本质上也是一种定价营销策略目的是让更多人将AI视频用起来但前提是产品形态和交互已经ready而现阶段各大厂商还在探索产品形态不断完善AI视频生产环节。
尽管AI视频领域的竞争日益激烈但初创公司仍需保证自己在牌桌上。牌桌上的分化已经开始显现。一类大厂和初创企业选择的是“模型+产品”两步走这之中又可以分为“AGI派”和“平台派”。海外如谷歌DeepMind和OpenAI是典型的“AGI派”他们的方向更偏向于构建通往AGI的世界模型;而“平台派”则是从一家AI视频企业转型为集合内容和生产消费为一体的平台型公司。另一类则偏向于产品驱动快速迭代比如聚焦在AI特效爆款迭代的Pika以视频编辑生产力出圈的OpusClip和Capsule等。