AI事件点评:OpenAI发布文生视频模型Sora,赋能内容创作与社交平台 国信证券 2024-02-27(7页) 附下载
发布机构:国信证券发布时间:2024-02-27大小:650.01 KB页数:共7页上传日期:2024-02-28语言:中文简体

AI事件点评:OpenAI发布文生视频模型Sora,赋能内容创作与社交平台国信证券2024-02-27.pdf

摘要:事项:2024年2月16日,OpenAI推出全新文生视频模型“Sora”,宣称为可以理解真实世界规则的世界模拟器。用户可以输入提示词,生成最长为六十秒的模拟真实世界的视频。相比此前Pika、Runway等工具,Sora具备向前扩展视频,视频拼接、多镜头视频生成等新能力,在视频时长,拟真度与一致性等方面也大幅领先。考虑到技术还不成熟以及安全伦理风险,Sora目前仅提供给内测用户使用,未向公众开放。国信互联网观点:1)Sora作为新一代AI文生视频模型,能力提升显著:2023年,文生视频模型开始陆续发布。大多产品处于早期阶段,生成视频时长少于5秒且风格单一、逻辑错误较多。科技大厂在这一领域的代表产品有Meta的EmuVideo、谷歌的W.A.L.T和Lumiere、字节跳动的MagicVideo等。其它初创团队如Runway、StabilityAI、PikaLabs也开发了当前代表性的文生视频模型Gen-2、StableAnimation、pika1.0。新发布的Sora采用创新性技术,不仅拥有视频拼接、多镜头视频生成等新能力,更在视频时长,拟真度与一致性等方面大幅领先;2)2024年文生视频大模型领域竞争加剧,各大厂商加快开发节奏:2024年1月2日,文生图著名初创公司Midjourney宣布加快训练文生视频模型。Runway开发的Gen-2模型也进行了快速更新,视频质量大幅提升,视频时长提高至18秒。国内大厂字节跳动与腾讯在1月公布了MagicVideoV2与VideoCrafter2;3)Sora的领先优势较难打破,促使社交及内容平台等科技大厂与OpenAI更紧密的合作:虽然Sora技术报告并未展示出突破性的创新,其视频转化成基本视觉单元、降维等技术手段在计算机视觉领域并非特别复杂。但是Sora模型的成功不仅仅依赖于公开的技术路径,更多来自于未公开的技术细节,如训练数据的来源与处理、模型的技术细节(如优化器、迭代训练轮次、迭代补偿、收敛标准等)以及对算力和资源的需求。考虑到Sora模型的目前先进程度和实际效果,在OpenAI算力与资源都领先的情况下,Runway等初创企业以及科技大厂追赶的难度较大。虽然在模型层面科技公司不一定能够追赶上OpenAI的领先技术,但YouTube、Facebook、Tiktok等视频及社交平台本身具有除了技术优势之外的高护城河,平台公司可以利用Sora技术进一步增强用户体验和内容质量、降低内容创作的成本,OpenAI和社交及内容平台之间的合作关系可能会更加紧密。

免责声明:
1.本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。
2.如发布机构认为违背了您的权益,请与我们联系,我们将对相关资料予以删除。
3.资源付费,仅为我们搜集整理和运营维护费用,感谢您的支持!

合集服务:
单个细分行业的合集获取请联系行研君:hanyanjun830

关于上传者

文档

227

粉丝

0

关注

0
相关内容
加入星球
开通VIP,可免费下载 立即开通
开通VIP
联系客服 扫一扫

扫一扫
联系在线客服

公众号

扫一扫
关注我们的公众号

在线反馈
返回顶部