字节回应“中文版Sora”:目前无法作为完善产品落地
澎湃新闻报道,近日有传言称,字节跳动在Sora引爆文生视频赛道之前,已经在研发“中文版Sora”:一款名为Boximator的创新性视频模型。
2月20日,字节跳动相关人士告诉澎湃新闻记者,Boximator是视频生成领域控制对象运动的技术方法研究项目。目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。
这款视频模型的特点是什么?与Runway推出的Gen-2、Pinka等市面上主流模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。Boximator的数据来源是WebVid-10M数据集,研究人员从中过滤出110万段动态明显的视频片段,并为其注释220万个对象的边界框,在PixelDance和ModelScope这两个模型上训练了Boximator。
字节跳动的研究人员表示,目前这款模型仍然处于研发阶段,预计将在2-3个月内发布测试网站。