1987WEB视界-分享互联网热点话题和事件

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

王兴、王慧文三搭闯“中国OpenAI”

1987web2023-03-14人工智能AI86
3月8日,美团创始人王兴发布朋友圈透露,个人将参与美团元老王慧文创业公司光年之外的A轮投资,并出任董事。从校园社交到本地生活服务,再到ChatGPT,不需太多说明,二王已被公认是互联网最合拍的CP之一

3月8日,美团创始人王兴发布朋友圈透露,个人将参与美团元老王慧文创业公司光年之外的A轮投资,并出任董事。从校园社交到本地生活服务,再到ChatGPT,不需太多说明,二王已被公认是互联网最合拍的CP之一。

面对北京商报记者对两人再搭的感慨,王慧文用两个握手的表情含蓄回应。王兴则在字里行间流露出坚定,AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近20年,既然他决心拥抱这次大浪潮,那我必须支持。

清华差生

1997年8月底,18岁的王兴从福建龙岩一中被保送至清华大学,报到时认识的第一个同学就是王慧文。我们宿舍六个人里有两个姓王,他比我大几个月,所以他就成了老王,王兴解释王慧文被叫作老王的原因。

这个称呼,被二人从清华带到了美团。多年来,王慧文也把这种宽松的氛围带到了各种场合。

我和王兴是大学同学,我们是学电子工程专业的,也就是学硬件的,但是我俩成绩不太好,专业课就没学会。即使在公开场合,王慧文也直言不讳,创业一开始是想做硬件的,但我俩学得太差了搞不定,后来王兴说互联网简单,要不咱俩去搞互联网吧。

他们决定创业是在2003年,那时互联网圈还不流行说降维打击,大厂在懵懵懂懂中蓄势待发:淘宝网上线、QQ注册数飙到2亿、百度超越Google成为中国网民首选的搜索引擎。

2005年,二王联合创办的实名制社交网络平台校内网上线,这两个清华差生终于在中国互联网圈有了点名气。

类似于Facebook、面向的又是愿意接受新鲜事物的大学生,校内网看起来万事俱备。但由于王兴创业经验不足、融资不到位,校内网资金链断裂。创始团队只亲自运营了一年,校内网就以200万美元的价格卖给了千橡集团。

九败一胜

丢了自己的阵地,创业还要继续,可惜后来王兴的饭否网、海内网,王慧文的淘房网,发展都不尽如人意。直到2010年成立美团,才让九败的王兴有了一胜。

从轻应用到重公司,从社交平台到团购,那是完全不同的运营逻辑,却是王慧文最擅长的从0到1。美团深入到各个城市,招聘线下团队、寻找生活服务类商家合作、以优惠的价格提供给互联网用户、教授商家操作流程……每一场都是硬仗。

当初因为志趣各异分别的创业伙伴们,因美团又聚在一起,其中就包括王慧文。

大家都在往这个行业进入的时候,我们需要做得更好,如果我们不能做得更好,我们就处在一个非常危险的状态。甚至可以毫不夸张地说,美团网这家公司离破产永远只有6个月时间。我这么说并不是危言耸听,也不是说美团网是个不靠谱的公司,大家不需要担忧这个事情,而是要拥抱这个事情。在2014年的美团年会上,王兴这么说。

大浪淘沙,2014年绝大多数团购网站已经关闭,美团笑到了最后。

千团大战结束,团购概念被逐渐淘汰,美团进入了更多新领域,电影票、酒旅,还有王慧文牵头做的外卖,这是他自己提出来的要求,因为新东西能激发起他的斗志。

王兴与王慧文之间的信任,王慧文之于美团的价值,也在美团一次又一次的组织架构调整中被外界确认。

2015年11月,美团成立五大事业群,王慧文是外卖配送事业群总裁,兼任美团高级副总裁。

2016年5月,美团设立餐饮生态平台,外卖配送事业群总裁王慧文兼任负责人。同年7月,美团整合原到店餐饮事业群、外卖配送事业群和餐饮生态平台成餐饮平台,王慧文任总裁。

2017年12月,美团将生鲜、外卖、配送、餐饮B2B整合成大零售事业群,王慧文担任总裁,新成立出行事业部,由王慧文负责。

外卖、出行……美团每一次对外扩张,几乎都是由王慧文挂帅,直到2020年12月18日。

放飞自我式投资

十年,我需要休息休息,下一个十年,就托付给兄弟们了,感谢你们。王慧文当天在朋友圈发文,美团内部信也同时官宣,美团联合创始人、高级副总裁王慧文按计划正式退休。

在当年1月和12月的美团内部信中,二人互相道谢。在美团之外,二人继续同行,最让人津津乐道的是他们在新能源汽车行业的重聚。

2019年理想创始人李想厚着脸皮找钱时,好朋友王兴掏了腰包,一年时间内,王兴及美团关联方累计向理想投资超过11亿美元。理想IPO前最后一轮融资时,王慧文的名字和王兴一起出现在理想投资名单上。

好奇心重、行动力强是今日资本创始人徐新对王兴的评价,和王兴对自己的总结一致,我是一个好奇心很重、喜欢新东西的人。

在文渊智库创始人王超眼中,这是王兴和传统式创业者马化腾(腾讯创始人)和马云(阿里创始人)的不一样之处。王兴的兴趣很广泛,眼光也不错,投理想那一笔就让他挣了很多钱。

据不完全统计,除了理想,王兴的个人投资项目还包括水滴互助、猩便利、e代驾、青萍科技、麦步科技、航班管家、老虎证券等。这些项目很难归纳出一个共同点,因此,王兴的个人投资多被外界评价为随性洒脱。

具体到这次投资光年之外,不排除王兴和王慧文是同学,又是创业伙伴的关系,但我认为还有平台经济在科技创新上的考量,王超进一步向北京商报记者解释,AI是和平台经济类关系比较紧密的行业,平台企业有大量数据,没有数据,大模型玩不转,平台企业也有资金实力,往科技创新方面探索很重要。

ChatGPT杀疯了

王慧文对AI的态度更加鲜明,关于人工智能,到现在为此,我只有一个判断,必须参与,发出这条朋友圈后,他在5天内又发了4条有关AI的内容,其中就包括著名的AI英雄帖。

组队打造中国OpenAI,设立北京光年之外科技有限公司,我出资5000万美元,估值2亿美元成立一只非盈利性基金,专门投资那些发展路径不清晰、实现希望很渺茫、商业价值不明确、一旦突破就能改变世界的科技探索。

对于光年之外的最新进展是否会通过朋友圈披露,他以点赞的方式向北京商报记者回应。

巧合的是,王兴宣布注资前,快手前AI核心人物李岩被曝最新动向,成立AI公司元石科技,进行多模态大模型的研发,与二王不谋而合。根据公开信息,毕业于中国科学院计算技术研究所的李岩,是工号在75上下的快手老员工,曾是快手AI技术研发的核心人物。2015年11月,李岩组建了快手内部第一个深度学习部门DL组,目标是构建算法模型对违法违规的视频内容进行识别。

对打造中国OpenAI有兴趣的还有前京东技术掌门人周伯文、出门问问CEO李志飞、前搜狗CEO王小川。

论技术、讲理想、谈情怀、抢人才,这波ChatGPT创业热,走的基本都是这个路径。

事实上,要做成中国OpenAI有很多困难。比如技术之外的因素,CEO和首席科学家是不是在某些决策或者对时间的期望能够达成关键一致?高层对时间、节奏、投入的认知要达成高度一致,包括投入多少钱、多少数据、多少人、多少算力。这些OpenAI不会告诉你答案,它可能尝试过很多,什么样的数据、方法论以及投入的预算是最优解。即使把参数给你,你可能也不一定能搞对。李志飞直言。

作为互联网创业老兵,王慧文团队的优势在于,拥有多年的创业经验、丰富的技术和市场洞察力,以及与国内外合作伙伴的紧密联系,独立财经评论员王赤坤向北京商报记者表示。

对王兴而言,他心中合格的伙伴需要具备这些特征,要沟通顺畅、目标一致,比我更有耐心、技巧,可以不厌其烦地做一些事情,这些恰好王慧文都有。

北京商报记者魏蔚

一些人猜测可能指神经网络的参数量,但和过去几年的数据并不对的上。

一些人理解是包括人和AI在内所有智能体的能力,但这个指标如何衡量又成了问题。

也有很多学者、网友并不认同这个判断,IBM科学家Grady Booch表示这是胡说,就被顶成了热评第一。

对于这些讨论,Altman只是简单的回复了现在还没开始。

但不管怎么说,AI飞速发展的背后,算力是一个明确可衡量的指标,也是必不可少的条件。

早在2018年,OpenAI还发表过另一个与摩尔定律形式相近的观点:

从2012年的AlexNet到2017年底的AlphaGo Zero,训练最大AI模型所需算力每3.4个月翻一番

不久之后,他们自己发布的GPT-3又把这个数字缩短到2个月翻一番

到了ChatGPT时代,需要考虑的就不只是AI训练算力,全球1亿月活用户、接入微软必应搜索等产品,AI推理算力也是重要支撑。

OpenAI提出的新摩尔定律怎样理解?中国隐藏算力巨头有话说

允中发自凹非寺量子位|公众号QbitAI

  • 下一篇

    四个红色智能体通过MADDPG算法进行训练,它们的目标任务是追逐图中的两个绿色智能体。其中四个红色智能体为了获得更高的回报,学会了互相配合,共同去追捕其中一个绿色智能体。而与此同时,两个绿色智能体也学会了分开行动,其中一个智能体负责将四个红色智能体吸引开,然后另一个绿色智能体则乘机去接近水源(由蓝色圆圈表示)。

    事实上,MADDPG算法并非完全原创,它扩展自一个被称为DDPG的增强学习(Reinforcement learning)算法,灵感则来源于基于Actor-Critic的增强学习技术。另外据雷锋网了解,还有许多其它团队也正在探索这些算法的变种以及并行化实现。

    该算法将模拟中的每个智能体视为一个Actor,并且每个Actor将从Critic那儿获得建议,这些建议可以帮助Actor在训练过程中决定哪些行为是需要加强的。通常而言,Critic试图预测在某一特定状态下的行动所带来的价值(比如,我们期望能够获得的奖励),而这一价值将被智能体(Actor)用于更新它的行动策略。这么做比起直接使用奖励来的更加稳定,因为直接使用奖励可能出现较大的差异变动。另外,为了使训练按全局协调方式行动的多个智能体(Multiple agents that can act in a globally-coordinated way)变得可行,OpenAI的研究员还增强了Critic的级别,以便于它们可以获取所有智能体的行为和观察,如下图所示。

    据悉,MADDPG中的智能体在测试期间不需要访问中央的Critic,智能体们将根据自己的观察和对其它代理行为的预测而行动。由于每个智能体都有各自独立的集中式Critic,该方法能被用于模拟智能体之间任意的奖励结构,包括奖励冲突的对抗性案例。

    OpenAI的研究员已经在多项任务中测试了该方法,并且实验结果表明,MADDPG在所有任务中的表现均优于DDPG。上边的动图自左向右依次展示了:两个AI智能体(蓝色圈)尝试前往指定地点,并且它们学会分开行动,以便于向反对智能体(红色圈)隐藏自己的目标地点;其中一个智能体将地标传达给另一个智能体;最后是三个智能体通过协调共同到达各自的地标,并且途中没有发生碰撞。

    上图展示了,通过MADDPG训练的红色智能体比起通过DDPG训练的红色智能体表现出了更加复杂的行为。在上图的动画中,通过MADDPG(左图)和DDPG(右图)训练的红色智能体试图追逐绿色智能体,这期间它们可能需要通过绿色的森林或者躲避黑色的障碍物。

    OpenAI新研究成果:如何让AI智能体学会合作、竞争与交流?

    雷锋网AI科技评论按:在多智能体环境(Multiagentenvironments)中,智能体之间对资源的恶性竞争现象无疑是通往通用人工智能(Artifici