大模型时代(4):国内AI大模型梳理
所谓AI大模型就是人工智能预训练模型,包含三大要素:大算力、强算法、大数据。大模型相当于人工智能的土壤,没有大模型支持,就不会有AI的成功。
AI大模型战场上,国外的OpenAI、谷歌、微软等大厂正打得火热;国内以百度、阿里、华为、腾讯为代表的科技巨头,科大讯飞、智谱AI、商汤科技等AI公司,三大运营商,以及智源研究院、复旦大学、中科院等学术/研究机构都纷纷投身AI大模型浪潮。
从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超80%,美国在大模型数量方面居全球之首。有专家披露,据不完全统计,目前中国10亿参数规模以上的大模型已发布79个。
那么我们先来看看国内的AI大模型:
1.百度文心大模型
2017年,在百度首届AI开发者大会上,百度喊出了All
in AI口号,随后围绕着AI进行了技术研发投入。得益于在人工智能领域的长期投入,百度在人工智能四层架构,也就是芯片层、框架层、模型层、应用层有着全栈的布局。
在芯片层,百度昆仑芯科技已实现两代通用AI芯片昆仑的量产及应用,为大模型落地提供强大算力支持。
在框架层,飞桨是国内首个自主研发的产业级深度学习平台,集基础模型库、端到端开发套件和工具组件于一体,有效支持文心大模型高效、稳定训练。
在模型层,文心大模型包括基础大模型、任务大模型、行业大模型三级体系,全面满足产业应用需求。
在应用层,文心已大规模应用于百度自有业务的各类产品,并通过企业级平台文心千帆进一步推动生态构建。
文心大模型包括NLP大模型、CV大模型、跨模态大模型、生物计算大模型和行业大模型。目前,文心大模型已经迭代至3.5版本,与3.0版本相比,训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。据百度官方表示,文心一言大模型的训练数据包括了万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
2.阿里通义大模型
2022年9月,阿里达摩院发布通义大模型系列。该模型打造了AI统一底座,并构建了通用与专业模型协同的层次化人工智能体系,首次实现模态表示、任务表示、模型结构的统一。通义大模型整体架构分为三个层次:
模型底座层:多模态统一底座模型M6-OFA,实现统一的学习范式和模块化设计;
通用模型层:多模态模型通义-M6、NLP模型通义-AliceMind以及CV模型通义-视觉;
行业模型层:深入电商、医疗、法律、金融、娱乐等行业。
通过部署超大模型的轻量化及专业模型版本,通义大模型已在超过200个场景中提供服务,实现2%~10%的应用效果提升。在搜索场景中,可实现以文搜图的跨模态搜索。在AI辅助审判中,可实现司法卷宗的事件抽取、文书分类等任务效果3~5%的提升。在人机对话领域,初步具备知识、记忆、情感以及个性的中文开放域对话大模型可实现主动对话、广泛话题、紧跟热点等对话体验。此外,通义大模型在AI辅助设计、医疗文本理解等其他领域也有丰富的应用场景。
在近期的2023世界人工智能大会上,阿里宣布推出通义大模型家族新成员通义万相。这是一款AI绘画模型,支持文生图等功能,它能够通过机器学习和自然语言处理技术,从文本描述中生成对应的图片或画作。
阿里大模型相关受益标的:恒生电子、千方科技、石基信息、众信旅游、卫宁健康、金桥信息等。
3.腾讯混元大模型
2022年4月,腾讯对外正式宣布,腾讯混元AI大模型在MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet五大跨模态视频检索数据集榜单中先后取得第一名的成绩,实现了该领域的大满贯。
基于腾讯强大的底层算力和低成本的高速网络基础设施,2022年底腾讯发布了低成本、可落地的NLP万亿大模型——混元(HunYuan)AI大模型。
混元AI大模型采用腾讯太极机器学习平台自研的训练框架AngelPTM,相比业界主流的解决方案,太极AngelPTM单机可容纳的模型可达55B,20个节点(A100-40Gx8)可容纳万亿规模模型,节省45%训练资源,并在此基础上训练速度提升1倍!
在模型层,混元大模型完整覆盖NLP大模型、CV大模型、多模态大模型、文生图大模型及众多行业/领域/任务模型。其中,HunYuan-NLP 1T的模型能力在自然语言理解任务榜单CLUE中登顶。
在产业化方面,混元先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务,通过NLP、CV、跨模态等AI大模型,不仅为业务创造了增量价值而且降低了使用成本。特别是其在广告内容理解、行业特征挖掘、文案创意生成等方面的应用,在为腾讯广告带来大幅GMV提升的同时,也初步验证了大模型的商业化潜力。
4.华为盘古大模型
2021年4月华为正式发布盘古系列大模型,包括NLP、CV和科学计算大模型,后续还发布了矿山、药物分子、气象、海浪等行业大模型。
其中,盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。在下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。而盘古CV大模型则是首次实现模型按需抽取的业界最大CV大模型,兼顾判别与生成能力,能够基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。
在7月7日的华为开发者大会2023上,盘古大模型3.0正式发布。盘古大模型3.0是一个完全面向行业的大模型系列,包括5+N+X三层架构:
L0基础大模型:包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型在内的5个基础大模型。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。
L1行业大模型:涵盖N个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的L0和L1上,为客户训练自己的专有大模型。
L2场景模型:为客户提供更多细化场景,它更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。
5、网易:玉言、子曰大模型
在2023世界人工智能大会上,网易多款AI大模型落地产品首次亮相,集中展示了在人工智能基础设施层、引擎层、平台层、模型层、应用层的领先创新成果。会上,由网易有道自研的首个教育大模型子曰最新应用成果——虚拟人口语教练首次亮相。
除了口语训练外,据悉子曰大模型系列应用成果还包括中文作文指导与批改、英语习题精讲等多种教育领域细分应用。子曰大模型能够作为基座模型支持很多下游任务,为所有下游场景模型提供语义理解、知识表达等基础能力,是有道AI产品体系的核心。有道研发团队在子曰大模型的基础上,会为不同场景设计定制化模型,以实现模型与场景的高度契合。
此前网易伏羲实验室推出了中文预训练大模型玉言。公开资料显示,玉言大模型参数达到110亿,由浪潮信息提供AI算力支持。玉言大模型相关技术已用于网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
据了解,网易AI大模型正在加速覆盖百余个产业应用场景,在加速创新应用的同时,网易伏羲有灵众包平台今年还将为10万人提供AI新职业,包含挖掘机远程驾驶员、AI绘画师、AI表情绑定师等人机协作的就业岗位。平台还会根据求职者的用户画像,提供针对性的培训,帮助他们实现能力和收入的提升。
6、京东:言犀大模型
京东集团技术委员会主席、京东云事业部总裁曹鹏介绍,即将推出的言犀大规模预训练语言模型将面向多模态,深入零售、物流、工业等产业场景。言犀是京东版ChatGPT,其预训练参数达到千亿级、品类覆盖3000+、人工审核通过率95%+、生成文字30亿+。
据悉,新一代京东大模型定位于产业版本的ChatGPT。该模型的落地应用路线图125计划也已公布,包括一个平台、两个领域和五个应用。其中,一个平台为ChatJD智能人机对话平台,两个领域为零售和金融,五个应用则包括内容生成、人机对话、用户意图理解、信息抽取和情感分类。
7、360:360智脑大模型
6月13日,360集团举行360智脑大模型应用发布会,认知型通用大模型360智脑4.0亮相,360智脑在多模态等关键能力上完成迭代,将全面接入360全家桶,同时360AI数字人正式发布。
360集团创始人周鸿祎介绍,认知型通用大模型360智脑4.0具备生成与创作、多轮对话、代码能力、逻辑与推理、知识问答、阅读理解、文本分类、翻译、文本改写、多模态(文本生成图像)十大核心能力。
周鸿祎表示,今年3月底,360智脑大模型率先落地搜索场景。在随后不到3个月时间内,360智脑完成从1.0版本到4.0版本的迭代。下一步,计划将360智脑升级到5.0版本,并发布插件平台。
各大巨头目前在大模型技术上基本同源,且都具有资金、算力、人才、数据等发展条件,未来有望成为我国大模型的第一梯队。
各家在应用场景上各有所长:百度具有搜索、小度智能音箱等应用场景;腾讯具有微信、QQ、游戏等应用场景;阿里具有电商、钉钉等应用场景;华为在2B应用方面独具优势。未来各家将结合自身优势,发力大模型研发及应用落地,我国的大模型产业将迎来快速发展阶段。
另外:2023年2月,原美团联合创始人王慧文发布AI英雄榜,高调入局AI大模型;同样高调入场的还有创新工场CEO李开复,3月19日,李开复在朋友圈宣布成立Project AI 2.0公司,进军AI大模型;随后,搜狗创始人王小川、前京东AI业务开路人周伯文、出门问问CEO李志飞等也都加入了AI大模型创业热潮。
比较不错的AI工具:
1.Gamma
App
一个可以自动制作PPT的AI智能网站。不需要魔法,邮箱直接注册。只要给它一个主题,剩下的PPT全都可以由AI自动生成。
生成后的PPT排版很漂亮,你还可以对生成后PPT进行编辑修改,提供很多组件,不过一次只能编辑一张PPT。
对于经常要做PPT的上班族来说,这是一个非常不错的效率工具。
2.AI创作家
一个全能的AI智能助手网站,支持AI聊天、智能写作、AI绘画、AI娱乐等功能,你可以在这里一键创作小红书爆款文案,以及各种风格文章、代码等,还可以让它扮演各种角色,在特定的场景下和你聊天答疑,解除你的困惑。
目前还可以免费使用!
3.改图鸭
AI绘画网站,不用注册,不用魔法,免费使用。
支持生成二次元、漫画、3D、赛博朋克、古风等风格类型。操作也比较简单,是文生图的形式,文字输入图片描述,调整图片大小参数,就可以一键生成。
描述下方提供多种语句描述,用户可以直接选择,也可以模仿语句进行输入。文字输入的越详细,生成的图片就会越贴近心中所想,细节各方面也会处理的更好。
4.Deepl
AI技术加持下的翻译神器,可以轻松完成各种短、长文本翻译,并且逻辑通畅,不生硬,语句更自然,甚至能用上俗语和专业术语,翻译文本越长效果越好。
5.FunAI
一个集AI问答、AI写作和AI学习于一体的智能AI助手,支持Android下载,一台手机就能承载AI智能,随时随地为你服务,无论是工作还是生活,它都能为你带来极大的便利。
软件的功能模块设计的也很清晰,想用什么功能都能一眼找到。支持一键生成计划总结、演讲稿、代码、营销策划方案、广告营销等风格文案。
6.酷表ChatExcel
由北大团队打造的AI表格处理工具。可以通过和机器对话表达出你的需求,系统就会根据需求来生成对应的Excel表格。你想要的表格效果也可以直接给你做出来。例如,你通过对话向它下达具体行列求和、平均数等命令,都可以直接为你生成。
以上6款AI工具,都可以用来提升工作效率,希望对你有帮助。
[本文内容主要来源于网络,仅用于学习]