1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

DeepSeek周末大事不断!

1987web2025-03-29人工智能AI23
3月1日,DeepSeek接连传出两则重磅消息:

3 月 1 日,DeepSeek 接连传出两则重磅消息:

1、DeepSeek 首次披露:其 V3/R1 推理系统的理论成本利润率高达 545%,展现出显著的技术与成本优势。

2、潞晨科技宣布暂停 DeepSeek API 服务:用户需尽快使用账户余额,未使用部分将全额退款。

消息揭示了 DeepSeek 在技术创新与商业模式之间的双重挑战。

//   DeepSeek 首次披露理论利润率   //

3 月 1 日,DeepSeek 在知乎平台开设了官方账号,并发布一篇技术文章——《DeepSeek-V3/R1 推理系统概览》。文章显示,DeepSeek-V3/R1 推理系统的优化目标是实现更大的吞吐量和更低的延迟。为了达成这两个目标,DeepSeek 采用了大规模跨节点专家并行(EP)方案。这种方案虽然增加了系统的复杂性,但能有效提升性能。

DeepSeek 在文章中详细介绍了如何通过 EP 技术增长批量大小、隐藏传输耗时以及进行负载均衡,从而优化整个推理系统的性能。通过这些技术手段,DeepSeek 能够处理更大规模的数据,同时保持或提高响应速度。以下是预填充阶段的计算 - 通信重叠示意图:

解码阶段也采用了类似的策略,但更加精细,将 Attention 层进一步细分为两步,使用了五阶段流水线 ( 5-stage pipeline ) ,实现更流畅的通信 - 计算重叠。

在成本控制方面,DeepSeek 的表现尤为突出。根据官方披露的数据,V3/R1 的训练成本仅为 557.6 万美元,不到 OpenAI GPT-4o 模型的 1/20。其推理成本也极具竞争力,每百万 token 的定价仅为 16 元,相比 OpenAI 低了近 70%。基于这些优化,DeepSeek 的理论利润率高达 545%,显示出其在成本控制和效率提升方面的巨大潜力

//   潞晨科技暂停 DeepSeek API 服务   //

尽管 DeepSeek 在技术上取得了显著突破,但其基于 MaaS 的商业模式却面临严峻挑战。3 月 1 日,潞晨科技官微宣布:" 尊敬的用户,潞晨云将在一周后停止提供 DeepSeek API 服务,请尽快用完您的余额。如果没用完,我们全额退款。"

当天下午,潞晨科技 CEO 尤洋发文回应 DeepSeek 公布的理论成本利润率。争议焦点主要集中在以下几点:

数据参考性问题:尤洋认为文章中合并计算了 DeepSeek 网页、APP 和 MaaS API 的 token 数,无法准确反映 MaaS 的真实成本和使用情况。MaaS 是 ToB 工具,与 ToC 的网页和 APP 在性能要求和成本结构上存在显著差异。

MaaS 性能与稳定性:春节期间 DeepSeek APP 和网页频繁掉线,延迟高达 15 分钟以上,无法满足 ToB 客户对低延迟和高稳定性的要求。MaaS 作为 ToB 服务,需保证首字响应≤ 2 秒、单 token 处理≤ 100ms,现有技术难以达标。

商业模式可持续性MaaS 需时刻保持超负荷运转,且需准备 5 倍于实际需求的机器资源以应对突发流量,导致成本高企。高投入与低毛利的矛盾使得 MaaS 模式难以盈利。

技术创新的实际贡献:DeepSeek 在 AI 基础设施上依赖英伟达 GPU 和已有技术(如 MOE 架构、PD 分离),并未提出颠覆性算法。中小云厂商吹嘘推理速度提升 10 倍,但缺乏实际盈利案例,技术优势未能转化为商业成功。

Wind 金融终端输入命令

WBUY(万得交易快线)

一次开户,基金市场一键链接

线上批量下单,轻松多账户管理

组合资产穿透管理,实时监控底层持仓

专为机构打造

一站式基金投研、交易、管理平台