金融行业迎来大模型时代存算基建成决胜关键

分类

金融行业迎来大模型时代存算基建成决胜关键2023-09-25 11:53:29

　　近期，各行各业纷纷投身大模型研发竞赛，掀起新一轮技术创新热潮，如何构筑面向大模型时代的新型算力和存力基础设施，实现大模型能力向金融领域的迁移，成为金融机构热议的话题。

　　在前台，智能客服，是AI在金融领域最常见的应用方向之一。还记得钢铁侠电影里的AI管家贾维斯(Jarvis)吗？金融大模型将大幅提升客户经理的专业水平和服务能力，大幅降低客户经理的运营成本，让每个人都拥有类似Jarvis的24小时在线的专业客户经理。

　　在中台，AI大模型有机会改变金融机构内知识获取、内容创作、会议与沟通、代码开发与测试的方式，提升内部办公效率，甚至引发研发测试模式变革，全方位提升金融机构内部运营效率。

　　在后台，大模型将成为智能科技底座的标配，大幅降低智能技术应用的门槛，只需少量标注数据就可以让智能技术覆盖广泛的场景。

　　总之，AI大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力，在金融行业有广泛的应用前景。

　　一方面，算力是大模型的引擎。语言类、视觉类模型容量和相应的算力需求都在快速扩大，金融大模型发展的背后是庞大的算力支撑。如果用“算力当量”（PetaFlops/s-day，PD），即每秒千万亿次的计算机完整运行一天消耗的算力总量，来对人工智能任务所需算力总量进行度量，大模型训练需要几百甚至几千PD的算力支持，也意味着需要巨大的算力成本。

　　例如，OpenAI 在2020年推出的 GPT-3，对算力的需求至少要上万颗A100 GPU，一次模型训练总算力消耗约3，640PD的算力。又如，浪潮信息推出的“源”中文语言大模型有近2500亿个模型参数，算力消耗达4000PD。再如，当前GPT-4和PaLM-2的算力当量已经达到GPT-3的数十倍。这还不算，谷歌正在开发的下一代多模态大模型Gemini，其训练量碾压GPT-4，达到后者5倍。

　　快速攀升的AI算力消耗，有限的IT预算，让大多数金融机构陷入两难境地：想做大模型，但资源匮乏、成本压力大、人才稀缺；不做大模型，又只能坐看机会错失。

　　对此，分而治之或许是一种可行的办法。所谓分，就是把大模型分为通用大模型和行业大模型。金融机构不用自己打造通用大模型，而是基于第三方的通用大模型，在此基础上专注打造行业大模型。根据信通院发布的《行业大模型标准体系及能力架构研究报告》，通用大模型缺乏专业知识和行业数据，而且构建和训练成本很高，难以实现商用。为更好解决特定行业为题，行业大模型应运而生。行业大模型可以满足特定场景需求，更好地为行业提供优质的服务，促进行业智能化转型升级。

　　浪潮信息AI服务器产品专家郭磊表示，“金融机构可以集中资源在行业大模型上，不是‘在一千米的地上挖一米深的沟’，而是‘在一米的地方挖一千米深’”。

　　具体来看，大模型训练的第一阶段是无监督预训练阶段，训练周期往往持续数十天到数月，需要数千张GPU卡同时计算，算力消耗巨大，训练时间非常长，训练出来的模型是基础语言模型。金融机构可以通过使用开源平台或者第三方合作（如浪潮信息的“源”大模型），获得基础语言能力。第二到第四阶段是有监督精调阶段、奖励模型训练和强化学习，这3个阶段需要数十张乃至上百张GPU卡同时计算，算力消耗的规模和训练时长相比第一阶段都有明显下降，所以金融机构可以在这三个阶段进行训练，打造有金融行业优势的大模型。

金融行业迎来大模型时代存算基建成决胜关键(图1)

　　近几年，通用大模型的参数量快速增长。2016年OpenAI发布Gym强化学习平台，2018年GPT-1问世，模型参数为1.17亿，经过不断迭代，GPT-4参数规模达到1.76万亿。Google从2017年发布Transformer（6500万参数）架构以来，陆续发布BERT（2018年，3亿参数）、T5（2019年，110亿参数），参数规模逐步提高。近期，Google发布通才模型PaLM-E，这是迄今为止全球最大的视觉语言模型，包含5620亿参数。

　　在垂直行业，金融大模型的数据集在通用大模型基础上还需包含诸如金融研报、股票、基金、银行、保险等方向的专业知识，通过在训练过程中加入大量金融对话数据并针对金融领域进行特定的预训练调优，提升其在金融垂直领域的表现。

　　同时，多模态、跨模态成为常态，金融大模型的数据类型变得更加丰富。其中无监督数据，即原始数据，数据格式可以是网页、文本或语音数据；有监督数据，即经过标注的数据，格式可以为json或Query。此外，为了给投资者提供实时市场舆情和风险预测等服务，金融机构还要高效处理金融行业新闻、股票交易，乃至社交评论等金融数据。这些巨量、多模态、实时的金融数据新需求、新特征，传统集中式存储难以应对，需要弹性、灵活的新型分布式存储架构来支撑。

　　由此可见，随着金融大模型的演进，整个数据中心的架构都会发生改变，从AI服务器、到存储、再到网络的全栈方案都需要适应大模型时代的需求。

　　只有数据“存得下”、算力“算得快”、网络“传得稳”，数字基础设施才能充分发挥数据要素价值，推动大模型应用落地，带动新业态繁荣发展。

　　对此，浪潮信息基于智慧计算战略，从算力、算法、数据、互联四方面推进产品创新，为大模型打造强大底座。

　　算力方面，浪潮信息通过千亿参数规模的大模型创新实践，已在算力集群构建、算力调度部署、算法模型开发等方面，构建起全栈领先的大模型算力系统解决方案，助力大模型训练开发。其中最新一代融合架构的 AI 训练服务器 NF5688G7 采用 Hopper 架构的 GPU, 较上代平台大模型实测性能提升近 7 倍，同时支持最新的液冷解决方案，可实现更低的集群能耗比与运行成本，PUE 小于 1.15, 以一个 4000 卡的智算中心为例，每年可节电 620 万度、降碳 1700 吨。

　　存储方面，浪潮信息生成式AI存储解决方案用一套AS13000融合存储支撑生成式AI的全阶段应用，提供全闪、混闪、带库、光盘四种介质，支持文件、对象、大数据、视频、块多种协议。结合AIGC数据处理的五个阶段：数据采集、准备、训练、推理和归档，浪潮信息由同一套存储提供端到端的数据流支持，满足文本、音频、图像、视频、代码等多模态数据的存储和处理需求。

　　在集群高速互联层面，浪潮信息基于原生 RDMA 实现整个集群的全线速组网，并对网络拓扑进行优化，可以有效消除混合计算的计算瓶颈，确保集群在大模型训练时始终处于最佳状态。

　　当前，国有大行、股份制银行以及部分城商行，均已经开展或计划开展金融大模型研发，AI算力和数据基建将迎来高速发展。根据IDC预测，未来5年中国智能算力规模的年复合增长率将达52%，分布式存储增速将达到中国市场增速的2倍。大模型时代，金融机构需要以AI的场景、架构为抓手，结合各行的数据特点，打造新一代智算基础设施。（朗文）

　　9月23日，秋分时节，清晨的杭州笼罩在蒙蒙烟雨中，别具江南韵味。但亚运气象台副台长郑沛群却无暇顾及，她的注意力全在精准预判当晚的天气变化，为杭州亚运会成功开幕提供气象保障。

　　2022年10月，团队成功研制出±500千伏/1200安培葛南直流输电改造工程可控换相换流阀产品，并一次性顺利通过48项电气型式试验、226项控制验证试验。

　　不久前，粟多武和他的同事们来到珠峰大本营。前方一块海拔5153.6米的高地，立着珠峰高程测量纪念碑。珠峰测高，正是从那里起算。

　　20世纪二三十年代，以顾颉刚为代表的禹贡学派开始了中国历史地理学的探索之路，在谭其骧、侯仁之、史念海等的共同努力之下，中国的历史地理学发展起来。

　　北京高压科学研究中心的星球撞击构造研究日前取得重要进展——在吉林省通化市发现了世界第一个位于高山上的类似冰斗状的陨石坑。

　　古有茶博士，今有茶院士。“茶院士”陈宗懋是我国当代茶学研究的领军人物。

　　9月20日，2023世界制造业大会在安徽省合肥市启幕。大会以“智造世界·创造美好”为主题，包括人工智能、机器人、元宇宙等在内的众多前沿产品让参展者感受“智”造魅力。

　　首创“1+6”一体化数字办赛服务平台、首条5G-Advanced万兆网络走进现实、境外“电子钱包”首次在境内“无缝对接”……即将开幕的杭州第19届亚运会，是史上首届提出智能办赛理念的亚运会，“智能亚运”成为中国尖端数字技术发展的展示窗口。

　　为让更多好项目走出“深巷”，参展高校与各行业企业融合联动，打通基础研究、应用开发、成果转化和产业化链条，为专利成果转化按下加速键。

　　今年峰会主题为“建设包容、普惠、有韧性的数字世界——携手构建网络空间命运共同体”，将围绕全球发展倡议、数字化绿色化协同转型、人工智能、算力网络、网络安全、数据治理、数字减贫、未成年人网络保护等议题举办20场分论坛。

　　“天宫课堂”是一扇连接地球与太空的奇妙之门。这是中国航天员首次在梦天实验舱内进行授课。记者专程来到位于北京航空航天大学的地面课堂，在这里与同学们一起跟随航天员穿越波澜壮阔的星空，展开一场关于宇宙的美妙旅程。

　　聚力科技创新深耕细分领域为推进科技自立自强稳定产业链供应链发挥更大作用

　　中央、国务院总理李强9月21日在北京市调研专精特新企业发展情况。他强调，要深入贯彻落实习重要指示精神，进一步坚定信心、保持定力，支持广大专精特新企业聚力科技创新、深耕细分领域，为推进科技自立自强、稳定产业链供应链发挥更大作用。

　　党的十八大以来，我国将推进新型工业化作为全面建成社会主义现代化强国的关键支撑。做强做优做大实体经济，加快构建以先进制造业为骨干的现代化产业体系。

　　《地球大数据支撑可持续发展目标报告（2023）》显示：我国生态恢复成效明显

　　报告围绕7个可持续发展目标，提供了全球与中国尺度的数据产品32套，弥补了指标监测的数据空缺，提升了指标监测与评估的空间精细度，揭示中国和全球环境变化新动态。

　　人力资源和社会保障部职业能力建设司副司长王晓君认为，本届大赛为广大技能人才提供了展示精湛技能的舞台，搭建了相互切磋技艺的平台。

　　本届工博会高校展区共815项参展项目，集中展示了高校创新科技成果，体现了高校在服务国家战略及加快实现高水平科技自立自强的担当作为。

　　中国企业联合会、中国企业家协会20日在安徽合肥发布了2023中国企业500强榜单。其中申报发明专利74.34万件，比上年“500强”增长了10.48%，泛亚电竞平台发明专利数量连续5年持续增长，占专利数比重为39.43%。

　　研究人员发现了一种模式，在该模式下，钻石会像火山岩浆一样从地球深处喷涌而出。这种美丽而奇异的现象吸引了诸多学者的目光。研究人员调查发现，这些钻石形成于地壳深处约145公里处，以每小时18—132公里的速度喷发到地表。

　　瑞士素有冰雪王国之称，畅享冰雪运动成为全球游客选择前往当地度假的重要原因之一。适宜的自然环境促使冰雪运动成为瑞士的国动，几乎每个瑞士人都会滑雪。

　　2017年正式通车的蒙内铁路穿越内罗毕国家公园、察沃国家公园等野生动植物保护区。因此，未来应以落深落实《关于推进共建“一带一路”绿色发展的意见》为抓手，高质量持续推进绿色“一带一路”建设。

分享到：

上一篇：“共启价值新空间共享城市新机遇”——泉州市金融产业大会侧记

下一篇：金融行业到底有多香？薪资待遇到底是个什么水平？

快速导航×

泛亚电竞

泛亚电竞