1987WEB视界-分享互联网热点话题和事件

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

阿里“通义千问”和OpenAI“Chatgpt”,它们有什么不同?

1987web2023-06-09人工智能AI356
4月11日,在2023阿里云峰会上,阿里正式宣布推出大语言模型通义千问,并开始邀请用户测试体验。据悉,通义千问是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多

4月11日,在2023阿里云峰会上,阿里正式宣布推出大语言模型通义千问,并开始邀请用户测试体验。据悉,通义千问是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等。阿里董事会主席兼首席执行官张勇表示,未来阿里所有产品都将接入通义千问实现全面升级。

通义千问是阿里云智能首席技术官周靖人领衔的团队自主研发的大模型,其训练数据截止至2023年2月,可以联网查询信息,例如直接提供网页摘要和翻译等。周靖人介绍,通义千问可通过API插件实现AI能力的泛化,不仅可以通过实现续写小说,编写邮件和生成会议摘要等功能帮助用户提升工作效率,还可以通过调用差旅接口推荐差旅产品,作为智能购物助手自动推荐品牌和产品提升用户购物体验。

在云峰会上,张勇介绍了钉钉、天猫精灵等阿里旗下产品在接入通义千问后变得更加智能和强大。天猫精灵接入通义千问后,不仅能够支持自由对话,可以随时打断、切换话题,还可以根据用户需求和场景随时生成内容,成为更聪明更人性化的智能助手;钉钉接入通义千问后,不仅能够自动生成工作方案,还可以在会议纪要后自动生成总结和待办事项,总共可以实现近10项新AI功能。

张勇说,通义千问是一场AI+云计算的全方位竞争,超万亿参数的大模型研发,并不仅仅是算法问题,而是囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要有超大规模AI基础设施的支撑。他表示,阿里云已经累积了从飞天云操作系统、自研芯片到智算平台的AI+云计算的全栈技术实力,这些技术将为未来AI时代企业和社会的发展提供强大助力,并且阿里云将会把这些AI基础设施和大模型能力向所有企业开放,共同推动AI产业的发展。

发布会当天,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。阿里云在大模型应用方面的生态建设已初见成效。

通义千问是阿里云智能在人工智能领域的重要突破,也是国内大模型领域的一次重要尝试。据悉,通义千问目前还在不断学习和成长中,未来将不断提升其功能和性能,为更多用户提供更好的AI服务。阿里云智能邀请所有有兴趣的用户参与通义千问的测试体验,共同见证AI的发展和进步。

2022年11月,OpenAI也推出了自己的大语言模型ChatGPT,该模型可以与用户进行自然的文本对话,并生成有创意的写作作品。ChatGPT是基于GPT-3.5语言模型构建的,该模型于2022年初完成训练。

那么,通义千问和ChatGPT到底有什么不同呢?

我们从以下几个方面进行比较:

参数规模

参数规模是衡量语言模型复杂度和能力的一个重要指标。

通义千问的参数规模为1.2万亿,而ChatGPT的参数规模为1.5万亿。

两者都是目前全球最大的语言模型之一,但ChatGPT略微领先于通义千问。

训练数据

训练数据是影响语言模型质量和泛化能力的一个关键因素。

通义千问的训练数据截止至2023年2月,可以联网查询信息,例如直接提供网页摘要和翻译等 。

ChatGPT的训练数据则是基于互联网上海量的文本数据进行训练的。

两者都拥有丰富和多样化的训练数据,但通义千问具有更强的实时性和时效性。

模型架构

模型架构是决定语言模型性能和效率的一个重要因素。

通义千问和ChatGPT都是基于Transformer架构构建的,该架构可以使模型学习语言中的规律,并生成连贯和人性化的文本。Transformer架构还可以支持多模态输入和输出,例如图像和音频。

通义千问和ChatGPT在Transformer架构上都进行了一些优化和改进,以提高其计算速度和资源利用率。

优化方法

优化方法是影响语言模型学习效果和对话质量的一个重要因素。

通义千问是基于人类反馈进行强化学习优化的,这使得它可以根据用户的偏好和满意度调整自己的回答,并提高对话质量。

ChatGPT则是基于监督学习进行微调的,这使得它可以更好地适应特定的任务或领域。两者都采用了先进的优化方法,但通义千问具有更强的交互性和适应性。

从以上比较可以看出,通义千问和ChatGPT都是目前全球领先的大语言模型,它们在功能和性能上各有优势和不足。

一般来说,通义千问在文本对话、阅读理解等方面表现较好,而ChatGPT在推理、数学等方面表现较好。两者都有时会生成不正确或无意义的回答,这是目前大语言模型面临的一个共同挑战。未来,我们期待两者能够不断改进和创新,为人类带来更多惊喜和价值。