制作门槛大幅降低，“深度伪造”引发担忧！Sora来了，视频业何去何从？

2024-02-24 02:25 由环球时报发表于 #国际

【环球时报记者丁雅栀环球时报驻美国特约记者冯亚仁】编者的话：美国人工智能公司OpenAI近日推出的生成式人工智能模型Sora一夜之间刷屏。扔进去一段文字，很快生成“大片”质量的视频，Sora带给人们的感受无疑是炸裂级的，与视频内容生产相关的行业为之震动，不少人认为视频生产领域即将迎来一场前所未有的颠覆，从业人员也因此感到焦虑。那么，Sora的到来可能为视频行业带来哪些颠覆？是否会有人因此失业？文生视频技术将进入爆发期吗？

大幅降低视频制作门槛

生成式人工智能模型Sora横空出世之后，一位国内导演在朋友圈调侃道，Sora能生成1分钟的视频，而导演写剧本的时候正好一场戏就是1分钟，用Sora制作视频，剪辑之后就能变成电影。这条朋友圈底下，很多影视业同行评论呼吁导演不要这样，“我们要失业啦！”

在Sora之前，Runway、Pika等文生视频模型已经掀起过一波AI视频应用热潮，但相比而言，Sora的效率和成片效果都更让人感到震撼：输入一段文本，Sora就能够根据文本提示创建逼真且富有想象力的场景，并生成具有多个角色、特定类型的运动，以及主体和背景细节准确的复杂场景的高清视频，时长可以达到1分钟。在这1分钟的视频里，Sora可以保持视频主体与背景的高度流畅性与稳定性，还可以自行分镜和切换景别，分镜切换符合逻辑且十分流畅。Sora对于光影反射、运动方式、镜头移动等细节也处理得十分优秀，极大地提升了真实感。

“刚开始几天，圈内弥漫着强烈的‘Sora焦虑’。”综艺节目导演王栗养告诉《环球时报》记者。分分钟生成媲美“大片”质量视频的Sora确实给一部分影视从业人员带来了危机感，不少人认为Sora的出现预示着影视失业潮的到来。

天风证券在研报中称，2000亿美元的短视频创作生态有望率先被颠覆，生成式AI在视频创作和世界模型的大踏步进步将实现对视频、3D、游戏等下游应用场景的渗透。

王栗养以汽车广告片段为例称，如果用传统的拍摄方式，广告特效需要耗费不少钱和时间，而一旦未来像Sora一样的技术在行业内广泛使用，就不需要去花大价钱做特效了，但这也意味着从组织模式到商业模式都需要重构。

“随着文生视频技术的日趋成熟和广泛应用，或将为当下热门的短剧市场带来变数。”国盛证券在研报中称。在影视行业从业多年的高萧楼告诉《环球时报》记者，当前影视行业的一些虚拟制作技术仍处于起步阶段，Sora有助于导演对电影剧本进行预演，为视频拍摄提供指导性意见。比如2023年上映的《流浪地球2》花了近半年的时间制作全片动画预演，通过Sora，动画预演所需的时间将被大大缩短。

而在长视频方面，尤其电影创作等，业内人士认为，Sora和其他视频大模型在某些方面仍然受到限制，暂时无法用于电影制作。

“Sora是现实内容方向上的巨大成就，未来将在高端娱乐中发挥作用。”美国娱乐媒体《Variety》援引人工智能公司metaphytics首席执行官兼联合创始人汤姆·格雷厄姆的话表示，“当前电影行业的创作人员需要完全控制表演和场景中的内容，因此视频大模型距离制作好莱坞电影还有很长的路要走。”

一直关注AGI（通用人工智能）发展的360创始人、董事长周鸿祎也表达了类似的观点。他在社交媒体平台发布一段视频，称机器能产生60秒的好片段，但是离一部电影仍有差距。一个完整的故事是由很多个60秒组成的，其中很多主题的设计、剧本的编写、脚本分镜头的策划、台词的配合都需要人的创意。Sora“与其说会颠覆传统影视业，不如说也会变成传统影视业有力的生产力工具，激发更多人的创造力。”

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林也相对乐观，他对《环球时报》记者表示，Sora并不是导致视频制作人员失业，而是降低了视频制作的门槛，让普通人可以借助AI完成高质量视频制作，这样就加大了视频供给，冲击了本来由专业技术人员把持的市场，这种冲击未来是一定会到来的。“当然，冲击来得并没有那么快，因为Sora只是做了下宣传，尚未真正落地应用。”

清华大学新闻学院教授、元宇宙文化实验室主任沈阳告诉《环球时报》记者，对于不太会制作视频的人来说，Sora的出现是一件好事儿，但是对原来以视频为生的人来说实际上工作难度加大了，这意味着他们需要比拼的不再是视频拍摄的技巧，而是想象力、审美，还有提示词的优化能力。沈阳认为，短视频平台可能会受到更大的冲击，当AI能够自由、自动地生成各类短视频的时候，观众只需要有一个智能体，他想看什么，用智能体自动推送若干条就行。

“深度伪造”引发担忧

“颠覆性”“王炸”“炸裂”“里程碑式”，各大媒体用以上词汇来形容Sora带来的震撼感受。在走向由数据和算法编织的未来的过程中，Sora正以其独特的方式，将人们的想象力转化为生动画面。周鸿祎更是直接断言，Sora的出现，意味着AGI的实现将从10年缩短到两三年。

国泰君安也乐观地预测，Sora模型将推动AI多模态领域飞跃式发展，AI创作等相关领域将迎来深度变革，AI赋能范围进一步扩大，多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。

但作为人工智能新产品，Sora并非毫无弱点。OpenAI也在其官网上坦承，Sora可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系的具体实例。例如，一个人咬了一口饼干，但之后饼干可能没有咬痕。此外，该模型还可能混淆提示的空间细节，例如混淆左右，并且可能难以精确描述随着时间推移发生的事件，例如遵循特定的相机轨迹。

盘和林认为，Sora当前版本的不足是对人类社会物理现象的理解还不深刻，比如吹蜡烛的时候蜡烛没有熄灭，可以说是一些细节问题，但随着技术进步，通过数据学习这些问题是可以解决的，由于Sora底层还是Transformer，所以其演进过程非常类似于GPT，最终数据积累一定量之后，会“大力出奇迹”。

与此同时，Sora的发布也引发了人们对滥用视频生成技术的担忧。学术界、商界、政府以及AI专家都很担心，AI生成的“深度伪造”内容可能会造成虚假和错误信息的广泛传播，甚至影响政治选举。对此，OpenAI称，在将Sora应用于OpenAI的产品之前，将采取几个重要的安全措施。例如，该公司已使用了自动化流程，旨在防止其商业AI模型生成针对政客和名人的虚假内容，并开发一些工具来帮助检测误导性内容，例如检测分类器，它可以分辨出视频是由Sora生成的。

同时，OpenAI还表示，并未向外正式开放Sora的使用，而是精心挑选了一批相关领域专家对模型进行对抗性测试。值得注意的是，OpenAI去年就曾发布公告，宣布启动全球招募“红队”网络成员，旨在引入外部力量，提前挖掘出AI系统存在的缺陷和风险。OpenAI针对Sora开展的“红队”演习中，专家们试图破坏AI模型的保护措施，以评估其被滥用的可能性。

中国公司距离Sora有多远

2022年底ChatGPT出现之后，百度、阿里、华为、腾讯、360、商汤、京东、科大讯飞、字节跳动等巨头厂商迅速结合自身业务及战略布局，陆续宣布研发或发布大语言模型产品。2023年很多国产“类ChatGPT”大语言模型已经向公众开放使用，走进商业场景。那么，这次Sora出现后，国内相关市场是否会出现相同的热潮？

记者注意到，Sora发布后，中文在线、易点天下、果麦文化、因赛集团、万兴科技、丝路视觉等多只Sora概念股持续走高。

以网络游戏为主业的巨人网络科技公司表示，关注到Sora在视频生成领域取得的突破性进展，公司已将自研AI视频风格迁移技术广泛应用于研运环节，赋能内容创意表达。外向型纸品企业创源股份也表示，公司已经组建了AIGC创新应用团队，目前主要围绕研发设计领域进行一些尝试。

但文生视频对科技巨头来说也是巨大的考验，要实现技术的跃升仍需时间和努力。20日，字节跳动方面表示，该公司的视频生成领域控制对象运动的技术方法研究项目Boximator，目前还无法作为完善的产品落地，距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。目前这款模型仍然处于研发阶段，预计将在2—3个月内发布测试网站。

盘和林表示，Sora的难点不在算法，但国内算力和数据方面存在瓶颈，美国对中国封锁算力。要知道文生视频对算力有更高要求。OpenAI现在推出这个应用，还是因为算力降价使得文生视频有足够支撑，而算力芯片领域国内存在短板，虽然当前有国产替代，但先进制程芯片和算力软件是绕不过去的坎。数据方面，未来可能还是要促进数据要素流通，在数据要素市场繁荣和数据安全之间找平衡。