DeepSeek背后的国企身影
过去几周,Deep Seek在全球科技圈掀起了一场腥风血雨,其影响力之大,从美股市场的剧烈波动中可见一斑。
受Deep Seek冲击波影响,1月27日,美股AI、芯片股遭遇重挫,英伟达收盘大跌超过17%,单日市值蒸发5890亿美元,创下美国股市史上最高纪录。
这就好比Deep Seek在AI江湖中一剑封喉,直接把英伟达这样的巨头的股价给削了一大截。然而,Deep Seek的成功并非偶然,背后有一群非常硬核的供应商。比如浪潮信息和中科曙光。
先说说浪潮信息。
公开信息显示,浪潮信息的第一大股东是浪潮集团有限公司,持股比例高达31.93%。浪潮集团的第一大股东是山东省国有资产投资控股有限公司,而这家公司的第一大股东又是山东省国资委。再加上新增的济南华胜企业管理股份有限公司、济南山科科潮投资合伙企业(有限合伙)两个股东,浪潮集团国资持股比例约七成,妥妥的国有企业。
作为国内领先的算力基础设施供应商,浪潮信息为Deep Seek在北京亦庄智算中心提供了AI服务器集群,还配备了英伟达H800芯片及自研的AIStation管理平台。这就像给Deep Seek的研发工作铺了一条黄金大道,更是国有资本在AI领域布局的有力体现。
浪潮信息2月11日正式推出元脑R1推理服务器,它通过系统创新和软硬协同优化,单机就能部署运行Deep Seek R1 671B模型。此举直接把Deep Seek R1全参数模型的部署难度和成本给砍了下去,还把推理服务性能给拉了上来。
据悉,Deep Seek开源多版本模型里,Deep Seek R1 671B模型是个狠角色,号称全参数基础大模型。相比那些蒸馏模型,它泛化能力更强、准确度更高、上下文理解能力也更好,简直就是AI界的学霸。
但它对系统显存容量、显存带宽、互连带宽和延迟要求极高。FP8精度下至少要800GB显存,FP16/BF16精度下更是要1.4TB以上的显存。而且,Deep Seek R1是个典型的长思维链模型,短输入、长输出,推理解码阶段特别依赖高显存带宽和极低的通信延迟。
元脑R1推理服务器的推出,直接祭出了王炸——领先的显存容量、显存带宽和通信速度,完美契合Deep Seek R1的需求。这就好比给企业准备了一条高速公路,让Deep Seek全参数模型的本地化部署一路畅通无阻。
中科曙光也是个狠角色。它给Deep Seek在杭州的训练中心打造了一套液冷系统,单机柜功率密度直接飙到35kW,PUE值还不到1.15。这简直就是在AI训练的热战场里,硬生生开辟出了一条冷通道,让设备在高负荷运转时也能稳如泰山。
这一液冷系统的建设,不仅为Deep Seek的训练工作提供了强大的散热保障,更是国有科技力量在数据中心基础设施领域的创新成果。
公开资料显示,中科曙光的股东阵营里藏着不少国有股东。其中,北京中科算源资产管理有限公司手握中科曙光16.36%的股份,其背后站着的是中国科学院计算技术研究所。中国科学院计算技术研究所是国内顶尖的科研机构,科研实力雄厚,技术底蕴深厚,被称为科研界的扛把子。中科曙光还有3.8%的股份被北京思科智控股有限责任公司持有,而这家公司背后又有深圳市国资委的身影。
简言之,Deep Seek的成功,是中国产业链协同的结果。
企观国资是企业观察报社官方微信公众号。《企业观察报》是由国务院国资委指导、中国企业改革与发展研究会主管主办的全媒体平台,被国务院国资委认定为国资国企自有舆论平台,致力于以专业化、市场化、国际化视角关注报道中国企业改革发展。
互联网新闻信息服务许可证号:10120240005
微信公众号:cneoguo(企观国资)
地址:北京市海淀区紫竹院南路2号
电话:010-6871917713911965371