前言
2024年将是Ai人工智能在各个行业垂直领域发展的元年。
随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。
回顾历史,互联网的兴起、电商的兴起、短视频的兴起,每次时代的变革都将带来很多巨大的机会和红利。
2023年到现在几乎所有大型的互联网公司都在all in人工智能,不仅互联网公司,很多行业里的大型企业也开始布局。
随着去年2023年到现在一年的发展,这个领域更新迭代的速度非常之快,在自然语言处理、图像生成、图像识别、视频生成、文生图、文转3D、特征提取、文子转语音、等等等方面都成长出很多大模型。
一年的时间已经形成了像github这样的,在人工智能领域的开源社区huggingface,在全球开发者和互联网公司的助力下,它发展非常之快,huggingface目前的模型数量已经达到了快60万。
这个领域是充满无限可能和魅力的,虽然很多技术目前还处于成长阶段。
接下来谈一下我对这个领域目前的一个认知和未来发展的一个分析,包括对目前很多的中小型创业公司在经历这次变革有可能存在哪些机会。
在切入正题前先需要对大语言模型(LLM)基础与发展有一个基础的认知。
LLM自然语言模型
LLM(Large Language Model)大语言模型是人工智能领域中一种强大的自然语言处理模型,其发展历史可以追溯到词向量、词嵌入技术的出现,逐步演进到对句子和文本的理解,最终实现了对复杂语境的全面理解和生成。
国内外主要LLM发布时间及特点介绍
通过上图可以发现国内的大模型全部都是在2023年爆发,国外最早的也是2019年发布。
这些庞大的大语言模型基座只有大公司才有实力进行研发训练,原因是训练成本非常大,还需要有机器学习、深度学习方面技能人才储备。
公开数据GPT-3.5的成本(481万美元)。
所以企业或者其他公司如果想拥有这样的大模型或者接入这个功能就存在很多限制:
1自己搞一个成本是非常巨大的。
2调用这些巨头科技公司的api接口,是按token收费的,一个字等于2个token。
3还有就是企业数据安全问题,尤其是国企政务方面,很多数据都是私有化,不可能放到公网上面。
到这儿会发现这个语言大模型只是有一定的智能对话能力,只是比搜索引擎能够更快的得答案,用久了还会发现它还存在一些弊端,例如不具备记忆能力,和它沟通它只能记得当前的上下文内容,还有实时信息更新慢,新旧知识难以区分,无法灵活操控外部系统,无法为领域问题提供专业靠谱的答案。
还是没办法像移动互联网时代,像手机和app那样被广泛的应用开。
但是随着2023年5-6月份LLaMA语言模型7B、13B、30B、33B、65B的开源(而且允许商用)。使用这个领域发生了变化,因为它的开源使得大模型的算法壁垒快速消失,而且在极短的时间里经过很多实践和验证,百亿参数(1B=10亿参数)是可以像那些千亿参数的基座大模型一样涌现智能,并且在小模型在经过微调后在某些领域甚至超过那些千亿参数的大模型。
至此,整个AI开源社区开始百花齐放,小参数模型的性能快速崛起,随后一些大的公司也发布并开源了自己百亿参数的模型,想快速建立属于自己的AI模型生态圈。
这就意味着应用开发者和中小型科技公司可以用很小成本去测试、部署、打磨一个私有化的大模型,通过微调+rag它的知识库,变成自己的智能问答助手。
目前已经有很多公司在做产模一体化的应用推进和落地了,只是信息差和市场目前还没有全面打开。这只是快速落地开始,也是大爆发时代来临的前夜,我相信随着ai模型的不断普及和技术的突破,ai模型以后部署的成本会越来越低运用技巧也会越来越成熟。
如果国内可以解决算力(也就是GPU)卡脖子这个问题,将来使用国产的显卡进行训练和推理,成本会更低。这个目前国内已经有了成熟的案例,例如清华和质谱AI退出的chatglm3语言模型就可以使用国产华为昇腾910计算芯片进行推理和训练。
多智能体协同Agent
再聊一下关于模型、业务应用、数据调用、工具之间的一个沟通问题,也就是AI+行业的产品这条路该怎么走,这个目前还处于一个混沌和快速崛起的时候。
因为单自然语言模型是不具备反思、运用工具、规划、多智能体协同(也就是多模型协同)能力,它只能输出它现有知识库的内容,虽然现在通过向量数据库可以很快的更新模型的知识体系,但它也只能应用在智能客服、智能问答库对话形式的这些领域。
怎么可以让智能体像人一样遇到问题遇到失败去反思,通过反思可以去协同其它智能体或者工具或者外部的数据去再次规划然后决策做出行动,最后输出结果或者执行。
其实目前已经有解决这个问题的方向,就是Agent,翻译过来就是代理,首先Agent不是一个技术,它是一个概念。
最近特别火的Devin(AI实现自动写代码)就是Agent的落地产品,要实现类似Devin这样的智能体,就得至少实现大脑、角色定义、工具的使用、标准化流程四项能力。
想象一下现实中如果一个产品应用落地需要什么,老板提出需求、产品经理分析需求指定方案、前端ui设计、最后给到程序员落地为产品,最后进入测试阶段。而且在程序开发过程中还会遇到问题,会给产品经理进行反馈,这就意味着Devin光角色就得定制最少3个(程序员、产品经理、测试),模型还得具有相互反馈修正的功能,可以想象一下里面的逻辑还是有技术壁垒的。所以从技术上讲目前对于大多数科技公司实现这四件事还是有很大难度。这个技术目前是最前沿的,而且还处于时间成长阶段,能够掌握和精通的是极少数一部分人。
技术方面让模型和应用结合的框架目前优选就是AutoGpt、Metagpt、LangChain,由于其架构设计较为先进且具有高度模块化的特点,对于初次接触该框架的开发者来说,理解和掌握如何配置、串联各个组件以达到预期效果可能需要一定的时间投入和学习成本。而且它们目前的文档还不是很完善,没有中文文档,能力有限的开发人员遇到问题缺乏解决渠道,还有就是它们缺乏大型的工业化应用实践,没有经历充分的检验。
但是我相信,Agent也会和2022年11月发布的chatGPT一样,一年的时间里快速崛起,因为这个领域技术的发展太快了,几个月就会冒出一个新东西,拭目以待,以后各个领域的企业和公司,包扩政务以及传统行业都会诞生非常优秀的产模一体化的产品应用,非常有可能就在未来的三年。
变革的机会
产模一体化的关键还是承上启下,上是目前百花齐放的各种语言模型、图像识别、文生图、文生视频等,去做这些东西需要有一定的技术积累和大量研发成本,难度很大,往下就是app+api千行百业学会使用AI怎么运用AI,达到降本增效,这里面呢难度低,机会大,也是大多数科技公司、应用开发、创业公司的突破口。
那么作为企业和创业公司或者个人面对这样的变革应该怎么做呢?
1) 关注人工智能领域最新研究成果、技术动态以及市场报告,深入理解AI技术的发展趋势及其在各行业的应用案例,通过案例分析获取思路,这也是一种快速的学习法,获取目标、拆解、分析、输出、总结。
2) 具备垂直领域百亿参数模型的独立部署和微调能力,最好对模型的深层次有一个基础的了解,涉及数学概率论、统计方法、机器学习、科学计算、神经网络、Transformer模型、训练与优化等等。
3) 用AI的视角看世界,也是这篇文章的核心主题。
我觉着最先受益的应该是那些拥有庞大企业数据以及具备标准化流程的企业,因为它们深耕垂直行业,具备先天优势,除了同行是不具备竞争对手的,而且大多数企业不具备自己的AI技术团队。想象一下,如果可以通过人工智能降低企业的人工成本、流程成本、生产成本,谁落后谁就会渐渐退出舞台。
还有就是在某专业领域具备核心竞争知识库的公司和个人,完全可以打造一个属于他个人的私有化辅助教,解放自己,让智能助手去帮住需要帮助的人。说到这儿可以想象一下,有可能这么多年的教育模式都会发生改变,很多公司很多企业客服这个部门可能只有几个员工甚至没有员工。
转载请注明出处。。。