DeepSeek周末大事不断!
3 月 1 日,DeepSeek 接连传出两则重磅消息:
1、DeepSeek 首次披露:其 V3/R1 推理系统的理论成本利润率高达 545%,展现出显著的技术与成本优势。
2、潞晨科技宣布暂停 DeepSeek API 服务:用户需尽快使用账户余额,未使用部分将全额退款。
消息揭示了 DeepSeek 在技术创新与商业模式之间的双重挑战。
// DeepSeek 首次披露理论利润率 //
3 月 1 日,DeepSeek 在知乎平台开设了官方账号,并发布一篇技术文章——《DeepSeek-V3/R1 推理系统概览》。文章显示,DeepSeek-V3/R1 推理系统的优化目标是实现更大的吞吐量和更低的延迟。为了达成这两个目标,DeepSeek 采用了大规模跨节点专家并行(EP)方案。这种方案虽然增加了系统的复杂性,但能有效提升性能。
DeepSeek 在文章中详细介绍了如何通过 EP 技术增长批量大小、隐藏传输耗时以及进行负载均衡,从而优化整个推理系统的性能。通过这些技术手段,DeepSeek 能够处理更大规模的数据,同时保持或提高响应速度。以下是预填充阶段的计算 - 通信重叠示意图:
解码阶段也采用了类似的策略,但更加精细,将 Attention 层进一步细分为两步,使用了五阶段流水线 ( 5-stage pipeline ) ,实现更流畅的通信 - 计算重叠。
在成本控制方面,DeepSeek 的表现尤为突出。根据官方披露的数据,V3/R1 的训练成本仅为 557.6 万美元,不到 OpenAI GPT-4o 模型的 1/20。其推理成本也极具竞争力,每百万 token 的定价仅为 16 元,相比 OpenAI 低了近 70%。基于这些优化,DeepSeek 的理论利润率高达 545%,显示出其在成本控制和效率提升方面的巨大潜力。
// 潞晨科技暂停 DeepSeek API 服务 //
尽管 DeepSeek 在技术上取得了显著突破,但其基于 MaaS 的商业模式却面临严峻挑战。3 月 1 日,潞晨科技官微宣布:" 尊敬的用户,潞晨云将在一周后停止提供 DeepSeek API 服务,请尽快用完您的余额。如果没用完,我们全额退款。"
当天下午,潞晨科技 CEO 尤洋发文回应 DeepSeek 公布的理论成本利润率。争议焦点主要集中在以下几点:
数据参考性问题:尤洋认为文章中合并计算了 DeepSeek 网页、APP 和 MaaS API 的 token 数,无法准确反映 MaaS 的真实成本和使用情况。MaaS 是 ToB 工具,与 ToC 的网页和 APP 在性能要求和成本结构上存在显著差异。
MaaS 性能与稳定性:春节期间 DeepSeek APP 和网页频繁掉线,延迟高达 15 分钟以上,无法满足 ToB 客户对低延迟和高稳定性的要求。MaaS 作为 ToB 服务,需保证首字响应≤ 2 秒、单 token 处理≤ 100ms,现有技术难以达标。
商业模式可持续性:MaaS 需时刻保持超负荷运转,且需准备 5 倍于实际需求的机器资源以应对突发流量,导致成本高企。高投入与低毛利的矛盾使得 MaaS 模式难以盈利。
技术创新的实际贡献:DeepSeek 在 AI 基础设施上依赖英伟达 GPU 和已有技术(如 MOE 架构、PD 分离),并未提出颠覆性算法。中小云厂商吹嘘推理速度提升 10 倍,但缺乏实际盈利案例,技术优势未能转化为商业成功。
《》
《》
《》
《》
Wind 金融终端输入命令
WBUY(万得交易快线)
一次开户,基金市场一键链接
线上批量下单,轻松多账户管理
组合资产穿透管理,实时监控底层持仓
专为机构打造
一站式基金投研、交易、管理平台