原创 | 文 BFT机器人
前言:
相信大家现在对于AI大模型这个概念都清楚,毕竟现在AI大模型渗入到了我们各个生活场景中,这股科技之风吹遍了中国大大小小的城市,近年来看,还有越吹越烈之势。今天小编带你们来了解一下我国这股AI模型之风到底如何起势,又将吹起怎么样的“风浪”。
继ChatGPT发布后,大模型逐渐走入公众视野,在随后的时间内中国本土厂商积极跟进,相继推出基于大模型的AI应用产品。由于在某些行业中,行业知识和专业术语的使用非常独特,且涉及到十分复杂的数据和业务逻辑,因此需要特定的行业大模型以更好满足行业需求。
从ChatGPT走进中国以来,据统计,在2023年1月的月活跃用户数已达1亿,成为历史上用户增长最快的应用。随后,大模型逐渐走入公众视野,中国本土厂商积极跟进,相继发布国产大模型。
发展·背景
ChatGPT引领大模型走入公众视野,中国本土厂商加速追赶
2022年11月,美国AI公司Open AI发布旗下AI聊天机器人程序ChatGPT,该程序基于大型语言模型(LLM,Large Language Model)GPT-3.5,使用指令微调(Instruction Tuning)和基于人类反馈的强化学习技(RLHF,ReinforcementLearning with Human Feedback)训练而成。在发布后的短短两个月内,ChatGPT的月活用户突破1亿,成为史上用户增长速度最快的消费级应用程序。
在随后的时间内中国本土厂商积极跟进,相继推出基于大模型的AI应用产品。自ChatGPT发布以来的半年多时间内,中国本土各类型厂商已经发布近80款参数量在十亿量级以上的大模型,其中不乏华为、阿里、腾讯等互联网大厂,亦有三六零、科大讯飞等在AI领域拥有深厚经验积累的厂商,同时还有复旦大学、清华大学等高校机构。
图片来源:通信院(图示所列举的厂商及所推出AI大模型为不完全统计)
NLP大模型为目前应用主流
大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。
这些模型通常在各种领域,例如自然语言处理、图像识别和语音识别等方面,表现出高度准确和广泛的泛化能力。大模型按照功能可分为NLP大模型、CV大模型、科学计算大模型和多模态大模型。
如今,大模型支持的模态数量更加多样,从支持文本、图片等单一模态下的单一任务,逐渐发展成支持多种模态下的多种任务:
•NLP(Natural Language Processing,自然语言处理)大模型:LLM为NLP大模型的一种,主要用于处理自然语言文本数据,具备强大的语言理解和生成能力,帮助人类完成问答、创作、文本等工作,例如Open AI的GPT系列模型。
•CV(Computer Vision,计算机视觉)大模型:主要用于处理图像和视频数据,具备强大的图像识别和视频分析能力,如人脸识别、物体检测等,具体可以在智能驾驶、安防等领域进行利用,例如腾讯的PCAM大模型。
•科学计算大模型:主要用于解决科学领域的计算问题,如生物信息学、材料科学、气候模拟等,需要处理大规模数值数据,例如华为的盘古气象模型。
•模态大模型:可以同时处理多种类型的模态数据,如文本、图像、语音等,实现跨模态搜索、跨模态生成等任务,已有的渗透应用具体包括搜索引擎、办公工具、金融电商等,例如谷歌的Vision Transformer模型。
图片来源:通信院(AI大模型的基本分类)
中国AI大模型的发展历程
AI大模型历经起步、发展、突破阶段,当前已进入规模化应用阶段
AI大模型的形成及发展起点可以追溯到上世纪上半叶,在商业化应用方面发展至今已经历起步、发展、技术突破等阶段,当前进入规模化应用的新阶段。
01
起步阶段,1950-1980
AI主要以学术研究为主,代表性应用有博弈论、专家系统、机器翻译等
1950年图灵在其论文《论数字计算在决断难题中的应用》提出了著名的“图灵测试”,测试能否使机器模仿人类思考模式和行为,标志着人工智能行业开始迎来发展。但“人工智能”(Artificial Intelligence)的概念是在1956年举办的达特茅斯会议上才被正式提出,人工智能从此也正式进入公众视野。
图片来源:沙利文(起步阶段以学术研究为主)
发展初期,1980-2010年
02
AI开始向商业应用发展,出现许多初步的应用,如语音识别等
上世纪八十年代初,日本富士通公司推出了世界上第一台具备语音识别功能的PC,开启了AI在语音识别领域商业化应用的序幕。
在随后的1984年,苹果和IBM相继推出预装如语音识别、专家系统等AI软件的Apple Macintosh和IBM PC面世,也标志着AI开始进入家庭应用市场。
而在九十年代至二十一世纪初,神经网络的发展也推动AI在图像识别领域的应用,同时经AI赋能的搜索引擎也成为互联网行业在此阶段实现大发展的标志性产物。
图片来源:沙利文(开始向商业应用发展)
03
突破阶段,2010-2020年
AI技术得到了极大的突破,尤其是基于深度学习的技术
2011年,苹果公司推出Siri虚拟助手,标志着自然语言处理在消费电子产品领域开始被应用。2016年,谷歌DeepMind的AlphaGo击败了围棋世界冠军李世石,展示出AI在复杂策略游戏中的强大实力,标志着AI逐步拉开在游戏领域的应用。
同时,自然语言处理领域也取得了重要进展,OpenAI成立,旨在推动人工智能技术的发展和应用,此后OpenAI推出的GPT系列模型,尤其是ChatGPT,让计算机能够生成高质量的文本,并与人类进行流畅的对话。
标志着此阶段的AI技术得到了极大的突破,尤其是基于深度学习的技术,如在语音识别、图像识别、自然语言处理等领域都取得重大进展。
图片来源:沙利文(AI技术得到了极大的突破)
规模化应用阶段,2020年至今
04
AI大模型正式走向规模商业化应用
2022年ChatGPT等大语言模型的发布,标志着自然语言处理正式走向商用,随着技术的不断进步和应用场景的扩大,AI大模型走向规模化应用,应用场景不断拓展,如在自动驾驶、智能医疗领域等。
AI大模型通过仿真模拟,对corner case进行大规模训练,同时还通过自动标注的方式优化系统效率,降低标注成本,加速汽车高级别自动驾驶技术的落地。
在医疗领域,AI大模型的应用为病患的诊断治疗带来变革,深度学习技术可以帮助医生更精准地识别疾病,提高诊疗准确性。此外,还可以帮助医生制定个性化治疗方案,提供远程医疗服务,惠及更多患者。
中国AI大模型未来发展趋势
垂直领域、多模态能力和MaaS服务是AI大模型未来发展的三大方向
涌现和融合是大模型时代重要的AI趋势,大模型推动AI进入AGI阶段,而多模态AI的发展则提供了解决复杂问题和实现多模态智能处理的能力。在AI助力产业发展方面,垂直领域应用和MaaS服务将是AI大模型发展的重要趋势。
繁探究垂直行业应用将成为AI大模型发展的重要议题
行业大模型执行特定领域任务实现更优异的表现
由于在某些行业中,行业知识和专业术语的使用非常独特,且涉及到十分复杂的数据和业务逻辑,因此需要特定的行业大模型以更好满足行业需求。例如,医疗行业需要处理大量的医学术语和病历数据,金融行业需要处理大量的金融术语和交易数据。
行业大模型要针对特定行业的具体需求,提供更加精细和个性化的解决方案,才是成为能够满足各个行业创新式发展的“Killer App”,也将是AI大模型行业在企业级市场实现发展的重要方向。
据测算,2022年中国人工智能行业市场规模为3,716亿人民币,预计2027年将达到15372亿人民币,有望在下游金融、制造、交通、医疗等多领域不断渗透,实现大规模落地应用。
图片来源:沙利文(中国AI市场规模,2021-2027E)
多模态能力是AI大模型后续技术发展重点
多模态助力 AI 大模型解决复杂问题
多模态融合模型可以将不同类型的数据通过预处理转化为统一的表示形式,然后结合多个模态的信息,进行联合建模和分析。
该种模型可以在多个领域中发挥重要作用,比如在自然语言处理领域中,将语音、文本和图像等多种数据进行融合,提高自然语言处理的准确性和泛化能力。
在医疗领域中,将医学影像、病理切片、基因测序等多个模态的数据融合在一起,提高疾病诊断和治疗的精度和效率。
图片来源:沙利文(AI大模型将从单模态向多模态进行转变)
Mass将成为AI大模型行业未来的核心商业模式
MaaS是一种新型的商业模式,其发展将促生新的产业生态
MaaS(Model as a Service,模型即服务)是将AI大模型转变为可服务化的产品,通过API接口或者SaaS平台,将大模型能力出租给第三方客户使用,能使更多的企业和开发者快速构建自己的AI应用。
MaaS服务模式的发展将促生新的产业生态——即以MaaS平台为核心,联合垂直行业的小公司,共同构建AI应用生态。这种生态模式能更好地满足不同行业和领域的需求,推动AI技术的广泛应用。
结语:
综上所述,中国大模型发展一路发展至今,披荆斩棘,共创了许多属于中国辉煌的成绩。我相信在未来,随着人工智能技术的不断发展和场景应用的不断拓展,AI大模型将会迎来更加广阔的发展前景,继续开创佳绩。
参考来源 | 头豹研究院
若您对该文章内容有任何疑问,请与我们联系,将及时回应。