原创什么是中国AI初创公司DeepSeek?
DeepSeek 表示,其模型是使用创新技术进行训练的,以克服其芯片质量和数量方面的差距
DeepSeek 的 AI 助手在 Apple App Store 中超过了 OpenAI 的 ChatGPT。
中国初创公司 DeepSeek 推出的最新人工智能 (AI) 模型在成为美国领先公司的潜在竞争对手后,引发了科技行业的动荡。
DeepSeek 在上个月的一篇论文中写道,它使用所谓的 2000 个 Nvidia H800 芯片,用价值不到 600 万美元的计算能力训练了其 DeepSeek-V3 模型,以达到与 OpenAI 和 Meta 最先进的模型相当的性能水平。
这些芯片不如市场上最尖端的芯片先进,后者受到出口管制,尽管 DeepSeek 声称它通过创新的 AI 训练技术克服了这一缺点。由 DeepSeek-V3 模型提供支持的 DeepSeek 的 AI 助手超越了 OpenAI 的 ChatGPT,成为美国 Apple App Store 中评分最高的免费应用程序。
这家总部位于中国的公司崛起引发了人们对美国领先科技公司投资数十亿美元用于训练 AI 模型的先进芯片和大型数据中心的质疑。这也是美国和中国之间人工智能竞赛的人造卫星时刻,此前人们认为美国在新兴领域比其地缘政治对手更具优势。
DeepSeek 模型的质量和报告的成本效率改变了中国人工智能公司落后于美国同行的说法,这种情况始于百度发布第一个中国 ChatGPT 等效产品之后。
根据该公司官方微信公众号上的一篇帖子,DeepSeek-R1 模型于上周发布,使用起来比 OpenAI 的 o1 模型便宜 20 到 50 倍,具体取决于任务。
R1 模型也是开源的,用户可免费使用,而 OpenAI 的 ChatGPT Pro 计划每月收费 200 美元。
DeepSeek 成立于 2023 年底,此前控股股东、量化对冲基金幻方联合创始人梁文峰采取行动,创建了一个新的独立集团,探索 [人工智能] 的本质。
通用人工智能 (AGI) 也是 OpenAI 追求的目标,它将 AGI 定义为在最具经济价值的任务中超越人类的自主系统。
DeepSeek 用比 openAI 少得多的员工和资金,而且用的时间也更短,做得非常令人印象深刻,Siebert 的首席信息官 Mark Malek 说。Malek 指出,DeepSeek不与 OPENAI 竞争,并解释了 DeepSek 与更知名的 AI 应用程序之间的一些差异。
OpenAI(以及 Google 的 Gemini)是一个广泛的通用工具,基于大量信息。它也可以用于创建更狭窄的应用程序。OpenAI 在自然语言处理方面具有强大的能力,而 DeepSeek 则是为特定于任务而创建的,Malek 说。现在,这并不意味着 DeepSeek 不好。重要的是要了解它与 OpenAI 不是一回事,因此从逻辑上讲,它需要的资源会更少。