计算机行业周报:谷歌Gemini+TPU体系的创新之处 华福证券 2023-12-11(7页) 附下载
发布机构:华福证券发布时间:2023-12-11大小:920.82 KB页数:共7页上传日期:2023-12-12语言:中文简体

计算机行业周报:谷歌Gemini+TPU体系的创新之处华福证券2023-12-11.pdf

摘要:大模型创新之处:谷歌重磅发布Gemini,多模态应用超预期。 12月6日,谷歌正式发布Gemini大语言模型,这是一个多模态大模型,能同时识别文本、图像、音频、视频和代码。 Gemini支持自然交错输入,用户可以结合语言、图像、文本和短视频进行交互。发布的三个版本分别为Ultra、 Pro和Nano, Ultra最强大,能处理复杂任务, Pro适用于多任务处理, Nano注重端侧处理。 Gemini Ultra在大规模多任务语言理解数据集(MMLU)中获得高达90.0%的得分率,首次超越人类专家。该模型可以综合运用数学、物理、历史、法律、医学和伦理学等57个科目,展现了卓越的世界知识和问题解决能力。此外, Gemini具备处理图像、视频和音频的能力,甚至更像机器人,具备动作和触摸等功能。在对比Gemini和GPT-4的基准测试中, Gemini最明显的优势来自于它理解视频和音频并与之交互的能力, 从测评数据来看,其在多模态任务上全面超越GPT-4V, 在最常规的文本基准测试中, Gemini与其他大模型的差距并不大。 Gemini 1.0的发布展示其面对多模态任务的超强推理能力且在特定任务领先GPT-4v,我们认为,多模态AI将是未来大模型的重要落地场景之一。算力创新之处:谷歌推出内部设计TPU,有望改变大模型训练、推理生态。 当谷歌推出Gemini大语言模型的同一天,新版本TPU芯片TPU v5p也亮相。 TPU v5p是迄今为止谷歌最强大的版本,提供459 teraFLOPS的bfloat16性能或918 teraOPS的Int8性能,支持95GB高带宽内存,数据传输速度高达2.76 TB/s。相较于TPU v4, TPU v5p的浮点运算性能提高了2倍,高带宽内存性能提高了3倍。 其中较为亮眼的是,每个 TPU v5p Pod由多达 8,960 个芯片组成,使用最高带宽的芯片间连接(每芯片 4,800Gbps)进行互连,确保快速传输速度和最佳性能。我们认为, TPU v5p 的推出,或存在削弱例如英伟达、 AMD等芯片巨头对于训练、推理市场的垄断等情况,进一步优化算力芯片市场的竞争格局。投资建议: 建议关注1) AI多模态: 中科创达、虹软科技、当虹科技、大华股份、海康威视、漫步者、萤石网络、汉仪股份、美图公司、云从科技等; 2) AI算力: 海光信息、寒武纪、景嘉微、中科曙光、浪潮信息、拓维信息、四川长虹、工业富联、神州数码、恒为科技等; 3) AI大模型: 科大讯飞、拓尔思、三六零、昆仑万维、商汤科技、云从科技等。风险提示: 技术发展不及预期;产品落地不及预期;芯片产量不及预期

免责声明:
1.本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。
2.如发布机构认为违背了您的权益,请与我们联系,我们将对相关资料予以删除。
3.资源付费,仅为我们搜集整理和运营维护费用,感谢您的支持!

合集服务:
单个细分行业的合集获取请联系行研君:hanyanjun830

关于上传者

文档

522

粉丝

0

关注

0
相关内容
加入星球
开通VIP,可免费下载 立即开通
开通VIP
联系客服 扫一扫

扫一扫
联系在线客服

公众号

扫一扫
关注我们的公众号

在线反馈
返回顶部