1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

人们都不知道deepseek是什么东西,介绍一下给人们科普一下,

1987web2025-02-23人工智能AI69
栗正杰:Deepseek梁文锋。我们要讲梁文峰,你会知道他创办deepthink其实是非常传奇一件故事。他原来是浙江大学毕业,理工科毕业,毕业以后从事的是基金对冲的工作。2023年

栗正杰:Deepseek梁文锋。

我们要讲梁文峰,你会知道他创办deepthink其实是非常传奇一件故事。他原来是浙江大学毕业,理工科毕业,毕业以后从事的是基金对冲的工作。2023年大家知道,现在大家看全世界deepthink,觉得已经横扫全世界,不只是他的功能强而已,他整个发迹的过程听到会匪夷所思的。

他在2023年才开始搞AI的科技,2022年拜登已经对中国发起了科技的战争,已经禁止晶片要卖到中国。所以他在2023年开始搞的时候,只能用低阶的,所以就是H800的晶片,那时候比H100是比较高阶,他只能用H800。

我进几个数字,你听到会很可怕。

·第一个就是他这家公司员工有多少?139个人而已,他只有100,2023年到现在139个人,他做出模型大数据,总共用了多少组的镜片?2048组,H800。先不管美国泼不泼脏水,但他只用2048组低阶的镜片。

·第二个如果是Meta来讲,他做的是多少片镜片?用H100高阶镜片,有16384片,等于镜片光数量来讲只有1/8而已。

·第三个做出来效果是怎么样?做出来是资料库里面的数据,总共有数据是6710亿个参数在里面。

·第四个Beta是多少?4050亿,只有它的2/3的数量而已,这参数不但做的快,而且用的镜片少,而且数量比你多。

你怎么去进这公式?

·第五个它第一次发布是什么时候?去年才发布,12月26号,它发布的这种模型叫做ytwo的。这个模型刚开始发布出来时候,美国这些科技大佬不把它当一回事,认为只是一个浙江小公司,139个人公司有什么了不起,就不把它当一回事。后来他们试跑一下不得了,一跑又发现事态严重,结果没想到在1月20号,也就是川普就职那天发布最新型的,所以rone的这种架构发布出来。

那时候其他的这些,不管是Mate或煮是ogenAI来进,目前看起来是没有任何的竞争力。