计算机:OpenAI Sora模型发布,视频生成技术迎来突破性升级 信达证券 2024-03-12(6页) 附下载
发布机构:信达证券发布时间:2024-03-12大小:641.94 KB页数:共6页上传日期:2024-03-13语言:中文简体

计算机:OpenAISora模型发布,视频生成技术迎来突破性升级信达证券2024-03-12.pdf

摘要:事件:2月15日,OpenAI发布SoraAI视频生成模型,文本生成视频模型迎来重大突破。此次发布的Sora模型能够根据用户的文本描述生成长达60秒、1080P高质量视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。模型亮点:1)视频生成时间长达1分钟,大幅领先其他AI视频生成模型。2)单视频多角度镜头。3)3D一致性:Sora可以生成摄像机动态运动的视频。随着摄像机的移动和旋转,人物和场景元素在3D空间中的移动会保持一致。4)Sora可以向前向后拓展视频,连接视频。5)模拟数字世界:Sora还能够模拟人工过程,例如视频游戏。Sora模型的技术实现特点:Sora基于扩散模型,并且在其中使用了Transformer架构,将视频和图像分解为Patch小数据单元,这些Patch类似于GPT中的Token,用于在Transformer模型中进行训练和生成;同时OpenAI将DALL·E3引入到Sora里,使得Sora能够精准地还原用户的文本提示,生成高质量的长视频。应用展望:随着文生图、图片对话技术的成熟,文生视频可能成为多模态大模型下一步发展的方向。该技术有望极大地降低短剧制作的成本,并且会进一步向影视、自媒体、游戏等领域渗透,提高视频创作效率等。风险提示:行业竞争加剧、金融科技发展不及预期。

免责声明:
1.本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。
2.如发布机构认为违背了您的权益,请与我们联系,我们将对相关资料予以删除。
3.资源付费,仅为我们搜集整理和运营维护费用,感谢您的支持!

合集服务:
单个细分行业的合集获取请联系行研君:hanyanjun830

关于上传者

文档

499

粉丝

0

关注

0
相关内容
加入星球
开通VIP,可免费下载 立即开通
开通VIP
联系客服 扫一扫

扫一扫
联系在线客服

公众号

扫一扫
关注我们的公众号

在线反馈
返回顶部