计算机:AI:多模态加速,视频类惊艳,生态重要性凸显 中航证券 2023-12-11(5页) 附下载
发布机构:中航证券发布时间:2023-12-11大小:1.2 MB页数:共5页上传日期:2023-12-12语言:中文简体

计算机:AI:多模态加速,视频类惊艳,生态重要性凸显中航证券2023-12-11.pdf

摘要:谷歌Gemini性能测试完胜GPT-4,大模型多模态应用加速根据澎湃新闻,当地时间12月6日,谷歌公司宣布推出据称“最大、最强、最通用”的新大型语言模型Gemini。谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。MMLU(大规模多任务语言理解)是测试AI模型知识和问题解决能力的最流行方法之一,而Gemini首次在MMLU的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,性能优于GPT-3.5,可扩展多种任务;Gemini Nano用于特定任务和移动设备。除了文字之外,Gemini还可以理解多种形式的输入和输出,包括文字、代码、音频、图片和视频。Gemini能很好地理解具有细微差别的信息,回答与复杂主题相关的问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地图设计智力问答、和Gemini玩杯子游戏和推理小游戏等等。在整个过程中,Gemini的反应速度都非常快,还会生成音频和图片来辅助回答,并可以用上一些口语化乃至幽默化的表达。我们认为,当前大模型应用仍处于技术不断迭代的快速成长初期阶段。未来,各类大模型将具备更强的多模态能力,有效解决不同场景下细分领域、更加复杂的应用,赋能千行百业提质增效。AI大模型多模态应用有加速落地趋势。AI视频软件“Pika”表现惊艳,文生视频类应用或催化传媒、游戏类行业创作生产及运营效率提升稍早,初创企业Pika Labs宣布推出旗下首个AI视频软件Pika1.0,迅速在各大社交媒体上走红。根据相关资料,pika1.0包括新的人工智能模型,能够通过一句简洁的文字或是一张图片生成视频,还可以简单易用地生成和编辑各种风格的视频,如3D动画、动漫、卡通和电影。也可以通过简单的指令实现画布延展、局部修改、视频时长拓展等编辑。Pika社区已经发展到50万用户,每周生成数百万个视频。目前,成立于2023年4月、仅有四名成员的Pika Labs已经完成三轮合计5500万美元的融资,最新估值为2.5亿美元。此外,Runway最近推出了Runway Gen-2生成式AI模型新版本,能够生成图像、视频和带文本的视频。其“运动画笔”(Motion Brush)功能,可以让图片变成视频,迅速动起来。A股创业板企业万兴科技(300624),在公众号上线AI创作的短视频《女孩的一生》,展现了国内多媒体大模型的视频生成能力。AI类视频应用,还有Meta的Emu Video,以及字节跳动的Pixels Dance等等。我们认为,文生视频类AI大模型应用或催化传媒、游戏类行业创作生产及运营效率提升。准确把握产业发展趋势、拥有前瞻性技术布局的相关企业,可能较快取得市场先发优势。GPTs助力“普惠”AIGC,AI生态建设重要性凸显OpenAI首次开发者大会推出的简易定制GPT工具(GPTs)引发开发热潮,一周时间GPTs的数量就达到1.5万个。由于使用量过大,11月15日阿尔特曼宣布暂停ChatGPT Plus新用户注册。该功能是ChatGPT的付费版,月费20美元,付费开通才能开发定制GPTs和使用其他人开发的GPTs。自定义GPTs是OpenAI在开发者大会上推出的一项重磅功能,用户无需任何代码,全程支持可视化点击操作。只需要给ChatGPT对话指令、额外的知识数据,然后选择是否需要网络搜索、数据分析和图片生成等多模态功能,就能构建法律、写作、营销等特定领域的ChatGPT助手,发布到GPT Store,可赚取分成收益。百度创始人、董事长兼首席执行官李彦宏表示:“技术创新的最终目的是应用,人类进入AI时代的标志是出现大量的AI原生应用,而不是出现大量的大模型”。我们认为,数据、算法、算力、应用导向、工程化能力等均是AI落地开花,以及进一步普惠化应用的必要条件。而构建起创新开放、弹性包容、全链贯通、功能完备的产业生态,更是保障产业长期健康、稳健发展的充分且必要条件。投资建议:我们认为,大模型多模态应用有加速落地趋势,或催化千行百业数智化、普惠化创新发展。建议关注:1、基础算力:软通动力(拟收购同方计算机)、神州数码、中科曙光、浪潮信息;2、大模型:中科创达、科大讯飞;3、视频、游戏应用:万兴科技、昆仑万维、盛天网络、当虹科技;4、AI硬件终端:大华股份、漫步者、萤石网络;5、文本办公:福昕软件、金山办公。风险提示:需求释放不及预期;竞争加剧;技术进展不及预期。

免责声明:
1.本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。
2.如发布机构认为违背了您的权益,请与我们联系,我们将对相关资料予以删除。
3.资源付费,仅为我们搜集整理和运营维护费用,感谢您的支持!

合集服务:
单个细分行业的合集获取请联系行研君:hanyanjun830

关于上传者

文档

522

粉丝

0

关注

0
相关内容
加入星球
开通VIP,可免费下载 立即开通
开通VIP
联系客服 扫一扫

扫一扫
联系在线客服

公众号

扫一扫
关注我们的公众号

在线反馈
返回顶部