今年,ChatGPT成了大家的明星,简直是个神奇的助手!问什么问题,都秒回,写各种文字、甚至代码,简直是工作利器。而国内这半年AI领域热度不减,涌现了一批新公司和产品,大厂也在风头上。AI技术的快速发展,让我们看到了无限可能,工作生活因此更加便利和高效。和GPT一样的大模型有很多
1、市面上流行大模型简介
1、微软(GPT系列GPT3.5/4.0)
官网地址:https://openai.com/blog/chatgpt
GPT,不用多介绍了,今年最火的大模型,没有之一。
- GPT 系列(Generative Pre-trained Transformer):
- GPT-3: 由OpenAI开发,是当前最大规模的预训练语言模型,具有1750亿个参数。GPT-3在多种自然语言处理任务中表现出色,甚至可以执行一些基本的计算和推理。
- GPT-2: GPT-3的前身,同样由OpenAI开发。虽然规模相对较小,但在发布时引起了广泛关注,因为它的生成文本质量令人印象深刻。
- GPT-1: 是第一个GPT模型,开启了预训练模型在自然语言处理领域的新时代。
- BERT(Bidirectional Encoder Representations from Transformers):
- 由Google开发,BERT是一种基于Transformer的预训练语言模型。与传统的从左到右的模型不同,BERT通过双向编码更好地捕捉上下文信息,成为自然语言处理领域的重要里程碑。
- T5(Text-to-Text Transfer Transformer):
- 由Google Research提出,T5是一种通用的文本生成和理解框架。与其他模型不同,T5采用“文本到文本”的范式,将所有任务都视为将输入文本转化为输出文本的问题。
- ViT(Vision Transformer):
- ViT是一种将Transformer模型应用于计算机视觉领域的模型。通过将图像分割成固定数量的块,然后输入Transformer模型进行处理,ViT在图像分类等任务中表现出色。
- CLIP(Contrastive Language-Image Pre-training):
- 由OpenAI开发,CLIP是一种联合学习模型,能够同时理解图像和文本。CLIP的设计使其能够在多个任务上进行迁移学习,包括图像分类、文本生成等。
- DALL-E:
- 也由OpenAI开发,DALL-E是一种生成模型,可以根据文本描述生成相应的图像。该模型可以创造出令人惊奇的图像,展示了预训练模型在图像生成任务上的潜力。
2、阿里(通义千问)
官网地址: https://tongyi.aliyun.com/
通义千问是一款超大规模的语言模型,它不仅擅长多轮对话,还能在文案创作中大显身手。具备强大的逻辑推理能力,让解决问题更加精准。不仅如此,通义千问还支持多模态理解,能够处理图像、文本等多种信息。而且,它还能轻松操控多语言,为用户提供更全面、多元化的语言服务。
3、华为(盘古3.0)
官网地址:https://www.huaweicloud.com/product/pangu/nlp.html
7月7日,盘古3.0震撼发布!这是一款专为各行业量身定制的大模型,致力于在金融、政务、制造、矿山、气象、铁路等领域深耕,打造行业专属的大模型和能力集。盘古3.0独特之处在于将深厚的行业知识与先进的大模型能力相融合,为千行百业提供卓越支持,助力组织、企业和个人成为行业的领军者,拥有属于自己的专业智囊。这一创新性的模型将重新定义行业智能化,开启组织和企业的智能化转型新纪元。
4、百度(文心一言)
官网地址:https://wenxin.baidu.com
文心一言,是一款经过大规模中文数据集训练的自然语言处理模型。它专注于文本分类、情感分析等任务,为处理中文文本提供高效而准确的解决方案。通过深度学习和先进的文本处理技术,文心一言助力用户在各种语言任务中取得更卓越的表现。
5、科大讯飞(星火大模型)
官网地址:https://xinghuo.xfyun.cn/
星火大模型是一款卓越的认知大模型,它具备广泛的跨领域知识和出色的语言理解能力。通过自然对话方式,它不仅能够深刻理解用户的意图,还能执行各种任务。星火大模型在为用户提供智能服务方面展现了卓越的能力,为多领域应用提供了强大的认知支持。
6、AlphaGo/AlphaZero(Amazon Bedrock AI)
官网地址: https://aws.amazon.com/cn/bedrock/
亚马逊推出了Amazon Bedrock,这是一款生成式AI产品,为开发者提供了一个灵活的平台,让他们可以在其基础上进行定制,生成符合自身需求的模型。与此同时,这也是亚马逊在不断拓展AI领域的努力之一,为开发者提供更便捷、创新的工具和资源。
7、Google(BERT大模型-医学Med PaLM 2)
论文地址:https://arxiv.org/abs/1810.04805
论文代码:GitHub - google-research/bert: TensorFlow code and pre-trained models for BERT
论文代码:https://github.com/conceptofmind/PaLM
BERT是由Google推出的自然语言处理模型,是一种强大的预训练模型。
今年,Google发布了最新的大语言模型PaLM 2,该模型应用于谷歌的25个功能和产品中,包括Google Bard聊天机器人、Google Workspace协同文档,以及一系列由人工智能驱动的工具,如魔法编辑器(Magic Editor)、魔术创作器(Magic Compose)以及代码生成工具「Codey」等。
Med-PaLM 2是Google推出的专注于医疗领域的大语言模型,与OpenAI GPT系列的模型相媲美,致力于为医疗领域提供更强大、精准的语言处理能力。
8、360(智脑4.0大模型)
官网地址:https://ai.360.com/
360智脑4.0是一款通用的认知型大模型。
9、腾讯(混元大模型)
官方地址:https://hunyuan.tencent.com/
腾讯云已与传媒、文旅、金融、政务、教育等多个行业的领先企业携手,共同在十余个行业中推动超过50个大模型的应用解决方案的探索和实践。
10、京东(言犀大模型)
官网地址:https://yanxi.jd.com/
7月13日,言犀隆重推出了全新的大模型,同时发布了优加DaaS和言犀智能两大服务平台的升级版。这一举措旨在以产业研发为基础,将70%通用数据与30%数智供应链原生数据相融合,为用户提供更加全面和智能的服务。
11、阿里(M6跨模态预训练模型)
官网地址:https://m6.aliyun.com/#/
M6 是一款阿里推出的跨模态预训练模型,参数达到十万亿以上,具有强大的多模态表征能力。
2、总结
今年,AI可谓是当之无愧的焦点之一。GPT只是冰山一角,各大公司纷纷展示了它们在AI领域的强项。通用型大模型只是开始,更多垂直领域、产业服务的大模型正崭露头角。国内AI发展势头正劲,未来有望在各行各业、各种场景中展现更广泛的应用。这不仅仅是一个起步,更是一个引领未来的契机。跟上这股浪潮,我们将在不久的将来看到AI在我们生活和工作中发挥更大作用。