前谷歌X团队靠AI电影锁定戛纳!创立AI原生版皮克斯

前谷歌X团队靠AI电影锁定戛纳!创立AI原生版皮克斯

文章图片

前谷歌X团队靠AI电影锁定戛纳!创立AI原生版皮克斯

文章图片

前谷歌X团队靠AI电影锁定戛纳!创立AI原生版皮克斯

文章图片


允中 发自 凹非寺
量子位 | 公众号 QbitAI
全球首家AI原生影视工作室横空出世 , 项目收入竟已高达1.1亿美元!
名叫Utopai Studios 。

当前AI热度如日中天 , 以AI切入电影行业的力量主要分为两派:
一派是以Runway、Pika为代表的“工具派” , 聚焦AI的工具属性 , 核心发力点在于提升影视制作环节的效率 。
另一派则是“内容+AI”公司 , 其主要在内容的叙事创新与产业化层面推动AI的应用和发行 , 相当于是把手伸进了影视业最肥沃的利润区“内容生产+产业落地” 。
这两类公司的定位 , 决定了其不同的天花板 。
前者更偏向于工具层的效率提升 , 其特点是 , 技术门槛高 , 能不断迭代生成模型的能力 , 但商业模式也往往会受限于工具类SaaS的逻辑(即订阅费、API调用费、B端授权费) , 最后很可能会成为影视业的“基础设施型公司” , 或容易被后续更强大的通用模型所取代 。
后者定位于创造新叙事形式和发行 , 这让其有机会直接切入到包括IP、版权、分发渠道 , 形成“内容+渠道+AI技术”三位一体的护城河 。 如若能够成功突破 , 天花板将远远高于纯工具派 , 因为其有机会改变整个影视业的产业链模式 , 而不仅仅是进行局部的效率提升 。
有意思的是 , Utopai Studios正是第二类公司 。
在Utopai入场之前 , 该领域几乎是一片空白 , 几乎没有公司尝试把AI技术范式与影视内容和产业运作相结合 。
而Utopai不仅率先切入了 , 甚至已经在市场验证方面跑通了模式 , 其即将推出的两个电影项目已经带来了1.1亿美元的收入 。

所以 , 这样一家公司 , 到底是什么来头?
说它“横空出世” , 其实并不完全准确 。 该公司实际上创立于2022年 , 前身为3D生成AI公司Cybever , 早前在硅谷凭借“用AI生成高精度3D虚拟环境”技术就有了一定名气 。
而恰恰是从AI+3D这一起点出发 , 让他们看清了更大的愿景:不再只满足于做技术供应商 , 而是要转身直面内容 , 用AI为传统影视行业探索新的可能 。
转型Utopai由两位谷歌系的华裔创始人创立:
联合创始人兼首席执行官Cecilia Shen , 是标准的00后 , 孩提时就沉迷于机器人实验 , 少年就读于加拿大滑铁卢大学 , 主修数学 。 大学二年级 , 进入了谷歌最神秘部门Google X实验室 , 参与Moonshot项目 。 在这里 , 他遇到了Cybever的另一位联合创始人Jie Yang 。
联合创始人兼首席技术官Jie Yang , 曾任Google Research科学家 , 后加入Alphabet旗下公司任Head of Research 。 在AI图像建模与生成技术领域有深厚的积累 , 他也是Cybever早期3D引擎架构的主要推动者 。
当2022年Cybever刚起步时 , 团队的愿景是解决专业3D中长期存在的效率瓶颈问题 , 而由于3D行业大部分客户来自影视游戏行业 , Cybever主要专注高精度3D虚拟环境的生成 , 为游戏和影视行业提供场景“地基” 。
但是很快 , Cecilia就意识到了“视觉特效”类公司的局限性——利润非常非常低 , Cecilia意识到公司必须往产业链的上游走 , 这样才能拥有定价权和高利润的商业模式 。
换句话说 , Cecilia试图跳过Runway、Luma等AI工具公司的常规路径 , 而选择直接投身于影视娱乐内容的生产和全球发行 , 成为AI时代的内容所有者 。
接下来发生的故事 , 与多数速生速死的AI项目不同 , Utopai走出了一条极为罕见的、系统性的进化路径——在从2022-2025年的三年间 , 两位创始人用四个阶段构建起了AI驱动内容生产的结构性语法 , 将自己精准卡位在了AI与内容的价值交叉点:
其阶段1是:从空间语法迈进“内容永动机” 。
由于Cybever在创立初的架构选择方面就走了一条不同于同期热门模型公司如NeRF、3DGS的路 , 而是选择了以程序化内容(Procedural Content GenerationPCG)的生成方式 , 这一策略性的选择 , 最终为Utopai奠定了关键的基础 , 成为了Utopai稳固的底层资产生成能力 。
因为PCG的优势不在于生成力 , 而在于质量控制、拓扑完整性和工业兼容性 。 目前 , Utopai的系统已经可以自动生成成千上万个高精度3D资产 , 并匹配不同光照(晨曦、黄昏、阴影)、相机参数(广角、长焦)和天气条件(晴天、雨夜、雾霾);每个组合都具备了“绝对真值” , 将几何信息与2D视觉数据紧密绑定 , 为后续AI理解与生成提供了标准化的输入空间 。
而阶段2是指:将“空间智能”编码为“语法规则” 。
由于PCG模式擅长物体的随机摆放 , 但弱点是:当生成对象变成如城市街区或室内空间这样来自于功能逻辑与空间秩序的空间时 , 会发生问题 。
这让Cecilia意识到 , 必须让AI模型构建起一种“结构性”的能力 , 也就是“空间语法” 。 在这个阶段 , 通过持续的训练与场景建模 , 其AI模型开始理解空间中的隐性规则 , 因为AI不仅能生成 , 还能思考 , 这使其不仅能够还原真实世界的视觉逻辑 , 更能模拟人类在空间中的行为预期 。 而该能力 , 也让Utopai在生成内容方面具备了前所未有的结构美感和功能的合理性 。
而到了阶段3 , AI Agent上场了 。 在这个阶段 , Utopai进一步开发了AI Agent系统 。
这是一位具备设计直觉的AI创意总监 , 可以说 , 该Agent系统不再仅仅响应关键词命令 , 而是能够理解模糊、抽象、充满情绪色彩的创作指令 。
例如 , 当创作者输入“我想要一条雨夜中的东方小巷 , 带点赛博朋克风 , 像侦探电影那种孤独感”时 , Agent不会停留在风格滤镜的理解上 , 而是能生成一个“具备意图的世界” 。 如:墙上的剥落中文海报、水洼中倒映的霓虹、缭绕在空气中的湿气——而这些 , 都是从未被直接要求的细节 。
而更加重要的是 , 由该Agent这一过程输出的并非是灵感草图 , 而是完整的3D预览资产(Pre-viz) , 这为影视制作直接节省了数十小时乃至数万元的人力与渲染成本 。
而到了阶段4 , 也就是今年上半年 , 就是Utopai从工具型公司到商业闭环的关键一跃了 。
在这个阶段 , Utopai完成了Previz-to-Video的工业闭环 。
简单讲 , Utopai将以上四阶段的能力 , 全部汇聚成了一个完整的视频制作工作流——“Previz-to-Video Pipeline” , 并最终破解了当下AI生成视频方面最大的三大难题:一致性、可控性与叙事延续性 。
也就是说 , 以后导演们就不再需要等待数日 , 而只需几分钟就可以预览接近成片质量的镜头 , 甚至可以实现“即兴拍摄式”创作迭代 。 这绝不仅仅是一次效率革命 , 更是内容实验能力的质变 。
梦想和底气那么 , 到底Utopai是如何破解目前AI视频生成领域的“一致性”、“可控性”和”叙事延续性”这三大技术难题的呢?
这个问题很重要 , 是因为目前AI视频生成虽已能做出惊艳的画面 , 但要真正进入电影、电视剧等工业化场景 , 提供这三大难题的解决方案绕不过去 。
首先 , 在近期的采访中 , Cecilia就一针见血地指出了目前AI通用模型的最大问题 。 她指出:
现阶段 , 通用视频模型都是为服务大众 , 核心目标之一是优化效率 , 让大众用户能以最快速度获得“足够好”的结果 , 这不仅限于影视 。 但这往往是以牺牲画面质量为代价 。
而也正因为这个原因 , Utopai在模型这一关键问题上 , Cecilia是这么回答的:
简单讲 , Utopai的模型只是为了那些对质量有极致追求的专业影视创作者服务 , 这个群体愿意为更好的效果等待更长的时间 。 而由于有这种明确定位 , 也让Utopai摆脱了效率上的束缚 , 可以在训练模型时减少压缩比例 , 增加特定方向的训练数据 , 采用更多更强的注意力编码机制 , 训练出更大、更好、更专注的模型 , 将所有算力资源都投入到了对影像质量的打磨上 , 确保每一帧都经得起大银幕的考验 。
其次 , 困扰AI视频生成领域的所谓“一致性”问题是指:生成视频难以保证人物外貌、动作和场景元素在不同的镜头中保持一致 , 会导致角色与环境出现“漂移”的情况 。
例如Veo3、Runway等在逐帧生成时易出现人脸、服装、光线甚至环境细节的“漂移” , 比方说主角第一秒时还戴着眼镜 , 下一秒眼镜就没了 。
“这在复杂场景中是目前所有模型的噩梦”Cecilia说 。 例如当多个角色同时运动和互动、且镜头也在不停运动时 , 现有的模型普遍无法处理好 , 时常会出现角色互粘、合并 , 或是动作违背物理规律的幻觉 。
Cecilia指出:“我们认为这两个问题的根源 , 其实都在于模型对于三维世界的理解是缺失的 。 由于视频的本质是2D的 , 这就导致多数的模型只是在2D平面上对像素进行模仿和压缩 。 ”
而这也正是出身于高精尖3D的Utopai模型的特殊之处——由于Utopai在其模型的训练过程中 , 会将带有物理规律的3D数据注入 , 让模型不再是学习2D画面的表象 , 这从根本上提升了模型对空间、遮挡、碰撞的认知 , 避免了产生与物理世界不一致的幻觉问题 。 “因为我们做了很久的AI生成高精3D环境 , 所以这一块其实是我们的DNA”Cecilia说 。

就是所谓的“可控性” 。 这一难题是指:用户能否像导演一样 , 精确地控制生成结果 , 如角色的表情、动作路径、镜头角度、节奏等 。
由于目前AI视频生成大多依赖于“Prompt+随机采样” , 所以具有一定的随机性 。 这方面 , 用户可以输入“大方向” , 但要控制微观细节(如让角色转头45度、走到某个位置)非常难 。 而缺乏可控性 , 就意味着创作者很难把AI视频当作是“可预测的生产工具” , 只能作为“灵感生成器” 。
Cecilia指出了这个问题与工作流的相关性 , “目前 , 行业普遍的创作流程都依赖大量的‘抽卡’ , 即反复生成海量内容 , 然后从中选出少数接近创意的结果 。 但这在专业制作中是不可接受的 , 因为导演对每个画面都有像素级的精确要求 , 从广场布局到水杯的位置 , 从光线强弱到角色眼神的角度 。 而在“抽卡”的模式下 , 往往是镜头里这个元素符合了 , 另一个又偏离了 , 创作过程充满了随机性和挫败感” 。
针对于此 , Utopai的解法是:用确定地执行导演的意图 , 来取代随机生成加挑选 。
据Cecilia介绍 , Utopai工作流允许导演先通过故事板、3DPreviz等方式来快速准确地描绘出一个清晰的草稿 。 这一草稿不仅是视觉参考 , 更包含了导演核心意图的结构化指令 。 随后 , Utopai的模型与工作流会准确地理解该意图 , 并结合影片整体的艺术风格 , 自动、有方向性地朝着最终目标进行尝试和调整 。 这恰恰是强化学习和智能Agent等技术擅长的地方 。
这或许也正是Utopai与其他许多“技术颠覆论”者最根本的区别 , 因为其系统设计的核心不是要取代导演和艺术家 。 恰恰相反 , 其系统的核心是要将导演和艺术家们从工业的枷锁中解放出来 , 让他们回归到创意王座 。
而这也代表了Cecilia很强的审美倾向 。 Cecilia表示 , AI可以生成无穷选项 , 但定义品味的永远是会讲故事和有艺术审美的人 。 Utopai更深远的意义在于 , 其系统设计追求的是人与AI之间形成一种共生进化的关系 。
为此 , Cecilia设定了Utopai的北极星 , 那就是:要做一个个性化的、端到端的影视制作AI架构 。 通过其高度整合的AI模型与自动化工作流 , 将电影和内容的制作成本大幅降低 , 从而将成千上万的电影人从“预算”的枷锁中解放 , 让他们能够以前所未有的速度和极低成本 , 将剧本中的故事变为高质量的影像作品 。 并且 , 这一切都不以牺牲质量为代价 。
而从公司内部而言 , 那就是 , 构建起一个数据、模型与工作流的“软硬一体”的架构 。
Cecilia指出 , 现在AI影视的一个普遍问题是 , 模型与工作流被视为两个独立环节 , 彼此割裂 。 一方面 , 模型公司负责提升算法 , 另一方面 , 制作公司只关注流程优化 , 两者缺乏深度的协同进化 。
与此同时 , Cecilia还强调了内容质量的重要意义 。 她认为 , 质量一定是优先的 。
观众的眼睛就是尺子 。 有时 , 人们低估了细节带来的影响 。 其实我们发现 , 每一个艺术家或创造者都像孩子一样 , 他们并不是抵触技术 。 一个例子是:1995年上映的《玩具总动员》 , 这是世界上首部数字制作的动画长片 , 无论在创意还是技术上 , 都是一次影响深远的跃进 , 并且在全球斩获了近4亿美元的票房收入 。 那么 , 所谓的AI被抵触是否是因为我们用AI的方式错了?
而这就又回到了细节和质量的问题 , 科技为打造更高质量的产品创造条件 , 而消费者 , 并不会因为AI就愿意降低对质量和故事的追求 。
优势最后一个问题是:那么 , 到底Utopai要实现这一北极星有什么优势呢?
首先 , Utopai已经创收1.1亿美元 , 就是其具有优势的一个明证 , 因为这在公司战略上说明了Utopai已经打通好莱坞的内容与生态链 。
为做到这一点 , 首先 , Utopai甩出了是两张影视界王牌:
一张是被好莱坞称为“史上最难拍史诗巨作”、素来是好莱坞呼声最高、但一直排名未拍摄电影前10的《科尔特斯》(Cortés) 。 这部电影之所以难拍 , 是因为它用传统电影制作的方式成本太高太高 , 但手握技术并不惧怕的Utopai为其邀请来了奥斯卡提名编剧Nicholas Kazan执笔 , 并邀请了好莱坞名列49的概念设计师Kirk Petruccelli来执导 。

另一张王牌 , 则是被普遍形容为是“当《壮志凌云》遇见《世界大战》 ”的八集科幻剧集《太空计划》(Project Space) 。 这同样是大手笔 , Utopai为其邀请来了著名编剧Vanessa Coifman和Martin Weisz执笔、并请了Martin Weisz来执导 。 该剧目前已经成功预售欧洲市场 。

“在好莱坞要做AI原生影视 , 起点就一定要高 , 手段一定要新”Cecilia说 。
此外 , 为了发行该项目 , Utopai还与《与狼共舞》及《地平线:美国传奇》的销售公司K5 International成立了一家合资公司 。 后者将于今年秋季在MIPCOM和AFM上代理所有Utopai的项目 。 Utopai还与以《权力的游戏》和《美国队长》闻名的可视化公司OPSIS合作 , 将其流程整合到电影制作人友好的工作流程中 。
需要注意的是 , 这两部剧为Utopai在全球创造了约1.1亿美元的收入 。 而这一数字是其他AI工作室无法比拟的 , 并且也让Utopai一炮而红 , 在其首部电影上映前 , Utopai已跻身于好莱坞一线大制作的行列 。
此外 , 所有的GenAI公司都觊觎于好莱坞人脉 , 但至今没有公司宣布类似计划 。 如Aesteria(现已被Moonvalley AI收购)最近宣布将制作《恐怖谷》 , 或Runway和Luma也都大力宣传其好莱坞人脉 , 但在电影内容AI领域 , 尚无公司宣布类似计划 。
殊不知早在今年4月底 , Utopai的故事就被搬上了著名杂志《福布斯》 。 而刚《福布斯》在今年8月又独家报道了他们的故事 , 并称其道:“Utopai的故事 , 标志着AI公司在媒体领域定位的转变 。 他们并不打算向工作室系统出售模型或API , 而认为真正的价值在创造和拥有知识产权 。 这种模式 , 与皮克斯曾经将其图形工具转变为叙事引擎的做法如出一辙 。 ”

当然 , Utopai的优势还包括:其自研的底层模型以及数据 。 但关于这两个问题 , Cecilia目前并不愿多说 。
Utopai正在做的 , 就是拆掉想象力的栅栏 , 将电影从“预算的暴政”中解救出来 。 这不仅仅是技术的升级 , 更是一场关于创作自由的革命 。 而这一切才刚刚开始 , 就让子弹再飞一会儿吧 。
— 完 —
量子位 QbitAI · 头条号签约
【前谷歌X团队靠AI电影锁定戛纳!创立AI原生版皮克斯】关注我们 , 第一时间获知前沿科技动态

    推荐阅读