1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

爱特云翔智算中心完成基于国产GPU的百亿级参数AI大模型训练智算服务

1987web2023-08-16人工智能AI166
原标题:爱特云翔智算中心完成基于国产GPU的百亿级参数AI大模型训练智算服务

原标题:爱特云翔智算中心完成基于国产GPU的百亿级参数AI大模型训练智算服务

由北京智源人工智能研究院(智源研究院)主办的2023北京智源大会6月9日至10日在中关村举行。北京智源大会是人工智能领域综合性内行盛会,紧密围绕人工智能发展前沿与热点问题发表演讲、展开对话。多位图灵奖得主与200位顶尖专家出席,来自30多个国家和地区超过三万名人工智能领域的专业人士齐聚一堂,分享研究成果,交换实践经验,建立联系合作。在大会上,智源发布了包含「悟道・天鹰」(Aquila)语言大模型等完整的悟道 3.0 大模型系列,并进入到了全面开源的新阶段。

智源研究院、天数智芯与爱特云翔共同合作,联手开展基于国产自主通用GPU的大模型AquilaCode-7B项目,通过中文描述来生成可用的C、Java、Python代码以实现高效编码。智源研究院负责算法设计、训练框架开发、大模型的训练与调优,天数智芯负责提供天垓100加速卡、构建算力集群及全程技术支持,爱特云翔基于 齐云一号AIDC智算中心,提供算、存、网、安全等基础设施及智能化运维服务。

爱特云翔智算服务内容

爱特云翔智算中心根据本次大模型训练需求,进行软硬件配置选型,提供算力集群裸金属、操作系统、云原生环境及软件栈初始化部署,构建天垓100GPU算力服务集群;同时为算力服务集群提供最优收敛比1:1的InfiniBand高性能网络组网,搭建超低延迟分布式存储及对算力节点客户端进行优化;接入公网独享带宽,支持大模型训练所需的样本数据、checkpoint节点、原始中间数据等的海量数据传输;安全方面提供防火墙、操作审计、抗DDOS、终端保护、漏洞扫描、综合智能分析等安全防护;运维方面,基于爱特云翔算力感知平台,提供算、存、网的性能、故障、资源、操作等方面的智能化运维监控,定制化指标配置报警,实现移动端告警前传和故障根因快速定位及相应7*24小时运维保障服务。

本次基于智算中心天垓100加速卡算力集群训练的大模型CodeGen(代码生成)AIGC模型项目,成功完成了100B Tokens编程语料、70亿参数量的AquilaCode大模型参数优化工作,实现了87K Tokens/s训练速度,高达95%以上的集群线性加速比,稳定性优异。并且在HumanEval 基准数据集上,以Pass@1作为评估指标,测试结果达到相近参数级别大模型的SOAT水平,训练出来的模型在AI编程能力与国际主流GPU产品训练结果相近。

此训练成果通过事实证明,国产GPU产品日臻成熟,足以承担百亿级AI大模型训练任务,打通了国内大模型创新发展的关键堵点,对于我国大模型自主生态建设、产业链安全保障具有十分重大的意义。下一步,爱特云翔将与合作伙伴们继续深入合作,基于AIDC齐云一号,建设更大规模的天垓100算力集群,承接基于国产GPU的千亿级AI大模型训练的算力服务。进一步夯实我国算力基础,助力人工智能产业自主生态建设。

关于智源研究院

北京智源人工智能研究院(简称智源研究院)是人工智能领域的新型研发机构。2018年11月14日,联合北京多家人工智能领域优势单位共建。智源研究院的愿景和目标是聚焦原始创新和核心技术,建立目标导向与自由探索相结合的科研体制,营造全球最佳的学术和技术创新生态,推动北京成为全球人工智能学术思想、基础理论、顶尖人才、企业创新和发展政策的源头,率先成为国际领先的人工智能创新中心,推动人工智能产业发展和深度应用,改变人类社会生活,促进人类、环境和智能的可持续发展。

关于天数智芯

上海天数智芯半导体有限公司(简称天数智芯)是中国领先的通用GPU 高端芯片及超级算力系统提供商。天数智芯以服务国家战略为己任,坚持四个面向,致力于开发自主可控、国际领先的高性能通用GPU产品,探索通用GPU赶超发展道路,加快建设自主产业生态,为全产业提供高端算力解决方案。未来,天数智芯将坚持中国特色的自主自强创新发展道路,打造更可信、更高效、更绿色的世界一流算力引擎,赋能千行百业数字化转型,促进我国数字经济高质量发展,开启中国引领世界走向元宇宙、数字孪生的崭新一页。

关于爱特云翔

爱特云翔专注为政企客户提供大数据中心、云计算、人工智能服务,是以cloud + AI为技术基座的科技创新型企业。爱特云翔目前拥有淄博临淄、宁夏中卫、青岛即墨等三个大数据产业园和IDC,总机柜数为2.2万个,已具备覆盖华北、华中、华东、华南的光纤网络,建立有北京、上海、淄博软件与算法研发中心、济南技术支持中心、深圳硬件设计中心、聊城智能物联生产线,及全国各地子公司等分支机构。

在等待大模型商业落地的过程中,我们不必过于悲观。毫无疑问,任何一项技术的商业落地都不是一蹴而就的,并不像部分投资者想得那样,这个月研发大模型,下个月就直接产生收入。在这个过程中,大模型落地的慢于预期实际上更多来自于我们自身心态的变化。就像我们常常听到的一句话:当一项技术诞生的初期,我们往往会高估它的短期影响,而低估它的长期影响。在最初的过度亢奋之后,我们往往又对技术的落地前景过于悲观。

在报告《寻找AI技术潜在应用场景的方法论是什么?》中,我们已经给出了寻找AI潜在落地场景的方法论,这里不再赘述。仅就一个有意思的问题做补充探讨。

在之前的报告中,在我们从商业价值的大小、数据获取难度两个维度对场景进行了划分,并指出对于一般公司而言(相对于BAT等互联网巨头与科大讯飞等垂域领域巨头而言),潜在机会可能更多地来自于长尾场景。

那么对于第二象限,即封闭场景——长尾场景象限和第三象限即开放场景——长尾场景象限来说,哪类场景是更好的潜在方向呢?我们认为是第二象限。原因在于:

关于AI大模型的五个关键问题

本文来自格隆汇专栏:国泰君安证券研究,作者:李沐华、齐佳宏