AI直面算力难题:在麋集公布大模子之外,我们离
2023-04-24 

导读

壹  ||之以是海内一众大模子的体验效果要逊色于ChatGPT,除了算法及数据方面的差距外,算力投入也是一个绕不开的缘故原由。

贰  ||海内一众大模子“卷”于公布的当下,作为行业底座的算力却先遇到了瓶颈。

叁  ||  除了国家计划外,中东部各经济蓬勃地市也都在算力领域掀起“大干快上”的浪潮。

在4月中旬举行的香港国际创科展上,华为搭建了席卷七大主题的面积约600平方米的“豪华展区”。

从智慧都会、行业数字化转型甚至新型储能,华为依托自身端、管、云协同的基础设施优势,眼下正在不停加速向各行各业拓展界线。而在涵盖30余种解决方案的展区中,AI盘算相关产物吸引了不少来往展商与观众。“我之前都不知道,华为也有AI训练卡吗?你们的盘古大模子是用自己的产物训练出来的吗?”在华为AI盘算的展区内,记者看到有观众如是询问现场的事情职员。

自ChatGPT的爆火掀起天生式AI的浪潮以来,种种大模子如雨后春笋般冒出,面临正在舞台上认真演出的“角儿”们,真正搭台的AI算力产业反倒显得不那么引人注目。

“人工智能的焦点提及来就三个点:大数据、大模子、大算力,现在海内的算力市场异常火热,像我们合肥(超算)中央的算力已经被海内一家着名智能语音企业所有定下来了,而且客户还要求我们尽快做下一步扩容。”华为展区内一位专家向经济考察报记者先容。

若是将2023年视为中国人工智能大模子应用元年,那么在大规模的前端产物落地后,算力建设能否实时跟上,便成了大模子向各领域进一步渗透的要害因素。但在部门业内人士看来,眼下海内算力供应已成为制约大模子生长的瓶颈之一。

4月19日,一位来自上海的云盘算厂商的产物司理李着实交流时就告诉记者:“现在AI对算力需求增进的速率要快于算力供应增进的速率,AI芯片的迭代也有点跟不上模子训练及迭代所需。”

01 算力的需求

OpenAI自觉布ChatGPT以来,月活用户已在年头突破一亿,成为历史上用户增进最快的应用程序,而在Chat-GPT面世后,与曾经泛起的造手机、造汽车的浪潮一样,海内一众互联网产业链上的厂商最先扎堆“造模子”。

先是百度于3月16日官宣公布基于百度飞桨深度学习平台和文心知识增壮大模子打造的——文心一言,随后4月9日至11日延续三天,三六零(601360.SH)、商汤、阿里又划分公布了“360智脑”“日日新”“通义千问”三个大模子。此外,腾讯、华为、知乎、京东、昆仑万维也纷纷携带各自的大模子产物加入混战。

但在李实看来,国产大模子的麋集公布宣传意义更大,而现在现实落地的使用效果和市场期待尚有一定差距。好比,此前文心一言饱受讥讽的作图功效就很能说明一些问题:让其画妻子饼效果真画出来一个妻子婆,画红烧狮子头效果画出来一幅红色的狮子头。

“通用大模子的看点,主要在于未来与差异行业连系后,对种种产物的赋能和提升,好比搜索引擎和大模子的连系,就让这类早已成型的应用又降生出了想象空间,又或者类似苹果Siri这类语音助手,和大模子连系后带来的陶醉式交互体验是亘古未有的。可以说大模子的泛起,给许多早已一潭死水的TMT产业带来新的增量空间。”李实说。

在4月18日举行的2023年中国ICT市场趋势论坛上,IDC中国研究总监卢言霞亦称,凭证斯坦福大学2022年公布的人工智能指数讲述,大模子文生图的准确率仅为25%,而现在文生图、文生文可以落地的一些应用,主要集中在互娱和游戏场景当中,包罗影视渲染、美术设计等,真正到工业环境中,市场对于哪些应用场景能够落地,现在还对照疑心。

之以是海内一众大模子的体验效果要逊色于ChatGPT,除了算法及数据方面的差距外,算力投入也是一个绕不开的缘故原由。

CIC灼识咨询合资人赵晓马向记者示意,人工智能的生长趋势是大数据、大模子,“鼎力出事业”。“已往几十年人工智能的生长无不说明晰这一点,每一次数据量级、模子规模的突破,都带来了人工智能手艺的突出功效。而这背后,正是AI训练的算力指数级增进。从2010年深度学习泛起以来,用于AI训练的算力以每6个月翻一倍的速率增进,2015年前后,大规模模子泛起至今,其训练算力都是原来的10倍到100倍。”赵晓马指出。

算力的飙升自然也带来了成本增进,凭证国盛证券在今年2月12日揭晓的一份研报中的测算,在初始算力投入上,为知足ChatGPT当前万万级用户的咨询量,投入成本约为8亿美元,对应约4000台服务器;在单日运行电费上,参考美国平均0.08美元/kwh工业电价,逐日电费约为5万美元。此外,基于参数数目和token(字符串)数目估算,GPT-3训练一次的成本约为140万美元。

4月8日,浙江大学人工智能研究所所长吴飞在“人工智能大模子手艺岑岭论坛”上指出,ChaGPT在训练中使用了45TB数据、近1万亿个单词(约1351万本牛津词典所包罗单词数目)以及数十亿行源代码,其模子包罗了1750亿参数,将这些参数所有打印在A4纸张上,一张一张叠加后,叠加高度将跨越上海中央大厦632米高度,其训练门槛是1万张英伟达V100芯片、约10亿人民币,模子训练算力开销是每秒运算一万万亿次,需运行3640天。“(在人工智能的训练中)数据是燃料、模子是引擎、算力是加速器,据估量全球高质量文本数据的总存量在5万亿token(字符串)左右,人工智能算法可能在一个数目级内,耗尽天下上所有有用的语言训练数据供应。”吴飞称。

重大的算力需求为AI算力产业带来了广漠的市场空间,凭证 IDC数据与展望,2021年中国智能算力规模到达155.2EFLOPS(每秒一百亿亿次的浮点运算)并在之后的几年始终保持稳健增进态势,预计到 2026年将突破进入每秒十万亿亿次浮点盘算级别,智能算力实现1271.4EFLOPS的重大规模,2021-2026年时代,预计年复合增进率到达 52.3%。

一位华为AI盘算领域的专家在创科展现场也告诉记者,现在市场对智能算力的需求异常火爆,公司基于升腾系列AI处置器已经修建起包罗Atlas系列模块、板卡、小站、服务器、集群等厚实的产物形态,笼罩深度学习领域推理和训练全流程,且在天下18座都会都已结构人工智能盘算中央,可用于各行业人工智能深度学习模子开发、训练和推理等应用场景。

02 底座的瓶颈

在李实看来,算力是人工智能领域的铲子,也可以称之为行业底座。

他告诉记者,根据对盘算精度要求的差异,算力通常分为通用算力、智能算力以及超算算力。其中,通用算力一样平常就是基于通俗CPU芯片集成的服务器所能提供的算力,用于一些基础的盘算场景,而智能算力则是基于GPU、GPGPU及AISC等AI芯片所提供的算力,主要用于人工智能的训练和推理。

一位上海的AI芯片初创企业项目司理唐坤向记者先容称,当下市场主流的AI芯片均为GPGPU,属于GPU(图形处置器)的一种,它弱化了GPU关于图形处置的功效,来完成原本由CPU肩负的义务。

工业级3D相机厂商「深浅优视」完成数千万融资

“AI领域的盘算需求具有大运算量、高并发度、访存频仍的特点,GPGPU因其多内核多通道的设计,异常适合对大量数据举行并行盘算,从而在人工智能领域找到了应用场景。”唐坤示意。

凭证市场调研公司Tractica的研究讲述,到2025年,全球人工智能芯片的市场规模将到达726亿美元,年均复合增进率达46.14%。

“AI将成为未来高性能盘算领域的主要需求。”唐坤说。

但海内一众大模子“卷”于公布的当下,作为行业底座的算力却先遇到了瓶颈。

首先是关于产物自己,李实告诉记者,随着摩尔定律日渐趋近失效,在IC(集成电路)器件自己尺寸不停靠近物理极限的情形下,依赖提升晶体管密度从而带来性能提升的难度在不停提高,且AI算力的需求增速已经快于芯片算力的增速。

其次,由于AI模子参数目的不停扩大,AI芯片的内存增速也难以匹配,这导致了内存墙问题的泛起,即内存容量限制了芯片性能的施展。

“前段时间马斯克不是联名要求暂停训练AI嘛,但他不呼吁也没关系,OpenAI也需要暂停一下,等一等硬件迭代。”李实说。

在他看来,AI芯片的未来迭代偏向主要将围绕存算一体,即赋予存储器盘算能力,大幅降低功耗的同时,显著提高芯片的盘算能力。

除了硬件方面有待迭代外,当下的外部环境也为国产算力产业的生长带来了不少限制。

据唐坤先容,在高端GPU领域,英伟达占有着跨越90%的市场份额,ChatGPT即是用上万张英伟达A100芯片打造超算中央训练而出。凭证英伟达官网数据,A100的单精度峰值盘算性能达19.5TFLOPS(每秒一万亿次的浮点运算)。而一张40G显存的A100芯片,在京东平台上所标售价就达6.25万元。因此,A100芯片也一直被宽大科技发烧友戏称为“小金砖”。

另外,值得注重的是,在今年的3月21日,英伟达已经公布了最新一代的H100芯片,相较于前代产物,H100单精度峰值盘算性能达67TFLOPS,其双精度的每秒浮点运算(FLOPS)提升3倍,性能提高了约7倍,在动态编程算法上比仅使用传统双路CPU的服务器快40倍。

不外,凭证去年10月美国商务部公布的管制条例,A100、H100这类代表国际先进盘算水平的芯片已经被制止售往中国,而2017年公布的V100芯片,因其性能较低,则不在管控之内。“海内厂商尚有渠道能够购置英伟达的产物,但短期一定会对海内的算力产业形成压制。在这个领域,包罗寒武纪、海光、华为等企业也在快速生长,但距离实现算力的国产替换尚有一定距离。”李实告诉记者。

唐坤则示意,其在今年拓展项目时领会到,当前海内众多超算中央举行产物采购或招标时,都有响应的国产产物指标,而从硬件性能角度来看,岂论寒武纪、华为照样海光,均有盘算指标不弱于英伟达A100的产物。

凭证寒武纪2022年半年报披露,该公司第三代云端产物思元370,接纳台积电7nm先进制程工艺,也是*接纳Chiplet(芯粒)手艺的人工智能芯片。其单精度峰值盘算性能达18TFLOPS(每秒一万亿次的浮点运算)。

“AI芯片领域的国产替换是大趋势,但生态及厂商手艺还需要一个提升的历程,而且现在许多企业也在抓紧囤英伟达的相关产物,‘算力荒’的情形应该不会泛起。”唐坤说。

03 政策的扶持

4月19日,上海市经济信息化委印发《上海市推进算力资源统一调剂指导意见》。文件指出,算力是夯实科创都会基础、加速都会数字化转型、推动数字经济高质量生长的焦点生产力;增强全市算力资源统筹、调剂和共享,有助于提升算力资源行使率,加速数据要素流通,周全释放数据价值。

凭证文件要求,到2023年底,依托上海市人工智能公共算力服务平台,接入并调剂4个以上算力基础设施,可调剂智能算力到达1000PFLOPS(FP16半精度每秒一万万亿次的浮点运算)以上;到2025年,市人工智能公共算力服务平台能级跃升,完善算力生意机制,实现跨地域算力智能调剂,通过高效算力调剂,推动算力供需平衡,动员产业生长作用显著增强,该市数据中央算力跨越18000PFLOPS(FP32单精度每秒一万万亿次的浮点运算);新建数据中央绿色算力占比跨越10%(不含市电结构中的绿电);集聚区新建大型数据中央综合PUE降至1.25以内,绿色低碳品级到达4A级以上。

今年2月,成都市直接拿出了“真金白银”对算力产业举行扶持,凭证成都市新经济委、市经信局、市发改委、市科技局团结印发的《〈成都市围绕超算智算加速算力产业生长的政策措施〉实行细则(征求意见稿)》,成都市政府支持企事业单元、科研机构基于国家超算成都中央手艺框架开发通用适配硬软件,凭证使用量与频次综合排名,分级分类给予排名前10的单元最高100万元,每年累计不跨越500万元的一次性奖励。

文件中还要求开展云盘算中央优化行动,推动以存储为主的“老旧”数据中央向以存算为焦点的云盘算中央提档升级,推动“小散”数据中央融合、迁徙至新型数据中央,强化绿色节能和智能化运维,提升大规模数据“云端”剖析处置能力。对于刷新升级完成后盘算功效占比大于 70%且机架数不低于1000架、PUE低于1.25的云盘算中央,根据每个机架最高1000元,给予总额最高200万元的一次性刷新津贴。

现实上,早在2021年,国家发改委便提出了天下一体化算力网络国家枢纽节点建设计划,凭证发改委新闻谈话人孟玮在2021年6月17日的例行公布会上先容,国家生长改造委会同有关部门在京津冀、长三角、粤港澳大湾区、成渝、贵州、内蒙古、甘肃、宁夏等地结构建设天下一体化算力网络国家枢纽节点。

“这8个枢纽节点,将作为我国算力网络的主干毗邻点,统筹计划数据中央建设结构,生长数据中央集群,开展数据中央与网络、云盘算、大数据之间的协同建设,并作为国家‘东数西算’工程的战略支点,推动算力资源有序向西转移,促进解决器械部算力供需失衡问题。”孟玮示意。

据记者查询,包罗成渝、甘肃、宁夏等地的算力枢纽节点均已计划开工,而希望较快的如贵州,其一期基地装备已安装完毕,约莫56PFLOPS在4月尾就可实现交付。

除了国家计划外,中东部各经济蓬勃地市也都在算力领域掀起“大干快上”的浪潮,凭证民众号“宁波公布”的信息,今年1月10日,宁波市*人工智能超算中央项目(一期)正式上线,一期建成100PFLOPS(FP16半精度每秒一万万亿次的浮点运算)人工智能算力,加5PFLOPS(FP64双精度每秒一万万亿次的浮点运算)盘算算力。

记者领会到,停止4月20日,海内已建成并运营人工智能盘算中央的都会 共 有 7座 , 分 别 是 深 圳(1000PFLOPS 算 力 )、 武 汉(200PFLOPS算力)、西安(300PFLOPS算力)、成都(300PFLOPS算力)、许昌(100PFLOPS算力)、南京(40PFLOPS算力)、杭州(40PFLOPS算力)。

李实告诉记者,现在智算中央的门槛为100PFLOPS,结构方面以东部为主,但在“东数西算”的大战略下,未来西部也将成为主要的算力结构区域。

“人工智能将成为驱动各行各业生长的引擎,而算力就是这台引擎烧的油,只有油给够,引擎才气转得快不是?”他跟记者比喻说。

新华期货,为每一笔交易提供安全保障!