用AI的视角看世界

前言

2024年将是Ai人工智能在各个行业垂直领域发展的元年。

随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。

回顾历史,互联网的兴起、电商的兴起、短视频的兴起,每次时代的变革都将带来很多巨大的机会和红利。

2023年到现在几乎所有大型的互联网公司都在all in人工智能,不仅互联网公司,很多行业里的大型企业也开始布局。

随着去年2023年到现在一年的发展,这个领域更新迭代的速度非常之快,在自然语言处理、图像生成、图像识别、视频生成、文生图、文转3D、特征提取、文子转语音、等等等方面都成长出很多大模型。

一年的时间已经形成了像github这样的,在人工智能领域的开源社区huggingface,在全球开发者和互联网公司的助力下,它发展非常之快,huggingface目前的模型数量已经达到了快60万。

这个领域是充满无限可能和魅力的,虽然很多技术目前还处于成长阶段。

接下来谈一下我对这个领域目前的一个认知和未来发展的一个分析,包括对目前很多的中小型创业公司在经历这次变革有可能存在哪些机会。

在切入正题前先需要对大语言模型(LLM)基础与发展有一个基础的认知。

LLM自然语言模型

LLM(Large Language Model)大语言模型是人工智能领域中一种强大的自然语言处理模型,其发展历史可以追溯到词向量、词嵌入技术的出现,逐步演进到对句子和文本的理解,最终实现了对复杂语境的全面理解和生成。

国内外主要LLM发布时间及特点介绍


​ ​
通过上图可以发现国内的大模型全部都是在2023年爆发,国外最早的也是2019年发布。

这些庞大的大语言模型基座只有大公司才有实力进行研发训练,原因是训练成本非常大,还需要有机器学习、深度学习方面技能人才储备。

公开数据GPT-3.5的成本(481万美元)。

所以企业或者其他公司如果想拥有这样的大模型或者接入这个功能就存在很多限制:

1自己搞一个成本是非常巨大的。
2调用这些巨头科技公司的api接口,是按token收费的,一个字等于2个token。
3还有就是企业数据安全问题,尤其是国企政务方面,很多数据都是私有化,不可能放到公网上面。

到这儿会发现这个语言大模型只是有一定的智能对话能力,只是比搜索引擎能够更快的得答案,用久了还会发现它还存在一些弊端,例如不具备记忆能力,和它沟通它只能记得当前的上下文内容,还有实时信息更新慢,新旧知识难以区分,无法灵活操控外部系统,无法为领域问题提供专业靠谱的答案。

还是没办法像移动互联网时代,像手机和app那样被广泛的应用开。

但是随着2023年5-6月份LLaMA语言模型7B、13B、30B、33B、65B的开源(而且允许商用)。使用这个领域发生了变化,因为它的开源使得大模型的算法壁垒快速消失,而且在极短的时间里经过很多实践和验证,百亿参数(1B=10亿参数)是可以像那些千亿参数的基座大模型一样涌现智能,并且在小模型在经过微调后在某些领域甚至超过那些千亿参数的大模型。

至此,整个AI开源社区开始百花齐放,小参数模型的性能快速崛起,随后一些大的公司也发布并开源了自己百亿参数的模型,想快速建立属于自己的AI模型生态圈。

这就意味着应用开发者和中小型科技公司可以用很小成本去测试、部署、打磨一个私有化的大模型,通过微调+rag它的知识库,变成自己的智能问答助手。

目前已经有很多公司在做产模一体化的应用推进和落地了,只是信息差和市场目前还没有全面打开。这只是快速落地开始,也是大爆发时代来临的前夜,我相信随着ai模型的不断普及和技术的突破,ai模型以后部署的成本会越来越低运用技巧也会越来越成熟。

如果国内可以解决算力(也就是GPU)卡脖子这个问题,将来使用国产的显卡进行训练和推理,成本会更低。这个目前国内已经有了成熟的案例,例如清华和质谱AI退出的chatglm3语言模型就可以使用国产华为昇腾910计算芯片进行推理和训练。

多智能体协同Agent

再聊一下关于模型、业务应用、数据调用、工具之间的一个沟通问题,也就是AI+行业的产品这条路该怎么走,这个目前还处于一个混沌和快速崛起的时候。

因为单自然语言模型是不具备反思、运用工具、规划、多智能体协同(也就是多模型协同)能力,它只能输出它现有知识库的内容,虽然现在通过向量数据库可以很快的更新模型的知识体系,但它也只能应用在智能客服、智能问答库对话形式的这些领域。

怎么可以让智能体像人一样遇到问题遇到失败去反思,通过反思可以去协同其它智能体或者工具或者外部的数据去再次规划然后决策做出行动,最后输出结果或者执行。

其实目前已经有解决这个问题的方向,就是Agent,翻译过来就是代理,首先Agent不是一个技术,它是一个概念。

最近特别火的Devin(AI实现自动写代码)就是Agent的落地产品,要实现类似Devin这样的智能体,就得至少实现大脑、角色定义、工具的使用、标准化流程四项能力。

想象一下现实中如果一个产品应用落地需要什么,老板提出需求、产品经理分析需求指定方案、前端ui设计、最后给到程序员落地为产品,最后进入测试阶段。而且在程序开发过程中还会遇到问题,会给产品经理进行反馈,这就意味着Devin光角色就得定制最少3个(程序员、产品经理、测试),模型还得具有相互反馈修正的功能,可以想象一下里面的逻辑还是有技术壁垒的。所以从技术上讲目前对于大多数科技公司实现这四件事还是有很大难度。这个技术目前是最前沿的,而且还处于时间成长阶段,能够掌握和精通的是极少数一部分人。

技术方面让模型和应用结合的框架目前优选就是AutoGpt、Metagpt、LangChain,由于其架构设计较为先进且具有高度模块化的特点,对于初次接触该框架的开发者来说,理解和掌握如何配置、串联各个组件以达到预期效果可能需要一定的时间投入和学习成本。而且它们目前的文档还不是很完善,没有中文文档,能力有限的开发人员遇到问题缺乏解决渠道,还有就是它们缺乏大型的工业化应用实践,没有经历充分的检验。

但是我相信,Agent也会和2022年11月发布的chatGPT一样,一年的时间里快速崛起,因为这个领域技术的发展太快了,几个月就会冒出一个新东西,拭目以待,以后各个领域的企业和公司,包扩政务以及传统行业都会诞生非常优秀的产模一体化的产品应用,非常有可能就在未来的三年。

变革的机会

产模一体化的关键还是承上启下,上是目前百花齐放的各种语言模型、图像识别、文生图、文生视频等,去做这些东西需要有一定的技术积累和大量研发成本,难度很大,往下就是app+api千行百业学会使用AI怎么运用AI,达到降本增效,这里面呢难度低,机会大,也是大多数科技公司、应用开发、创业公司的突破口。

那么作为企业和创业公司或者个人面对这样的变革应该怎么做呢?

1)    关注人工智能领域最新研究成果、技术动态以及市场报告,深入理解AI技术的发展趋势及其在各行业的应用案例,通过案例分析获取思路,这也是一种快速的学习法,获取目标、拆解、分析、输出、总结。
2)    具备垂直领域百亿参数模型的独立部署和微调能力,最好对模型的深层次有一个基础的了解,涉及数学概率论、统计方法、机器学习、科学计算、神经网络、Transformer模型、训练与优化等等。
3)    用AI的视角看世界,也是这篇文章的核心主题。

我觉着最先受益的应该是那些拥有庞大企业数据以及具备标准化流程的企业,因为它们深耕垂直行业,具备先天优势,除了同行是不具备竞争对手的,而且大多数企业不具备自己的AI技术团队。想象一下,如果可以通过人工智能降低企业的人工成本、流程成本、生产成本,谁落后谁就会渐渐退出舞台。

还有就是在某专业领域具备核心竞争知识库的公司和个人,完全可以打造一个属于他个人的私有化辅助教,解放自己,让智能助手去帮住需要帮助的人。说到这儿可以想象一下,有可能这么多年的教育模式都会发生改变,很多公司很多企业客服这个部门可能只有几个员工甚至没有员工。

转载请注明出处。。。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/815693.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RuoYi-Vue若依管理系统学习笔记

1.环境部署 #准备工作 JDK > 1.8 (推荐1.8版本) Mysql > 5.7.0 (推荐5.7版本) Maven > 3.0 #运行系统 1、前往Gitee下载页面(https://gitee.com/y_project/RuoYi (opens new window))下载解压到工作目录 2、导入到Eclipse,菜单 File -> Import&#xff…

使用hexo+gitee从零搭建个人博客

一、环境准备 1.Node.js:下载 | Node.js 中文网 (nodejs.cn) ,Hexo 是基于Node.js 的博客框架 教程:https://blog.csdn.net/weixin_52799373/article/details/123840137 node -v npm -v 安装 Node.js 淘宝镜像加速器 (cnpm&am…

LeetCode 70. 爬楼梯 --- 经典动态规划

爬楼梯 1. 动态规划思路2. 解决方法3. 代码 题目简述:爬 n 阶楼梯才能到达楼顶,每次可以爬 1 或 2 个台阶。 1. 动态规划思路 动态规划是一种常见的解决问题的方法,它通过将大问题分解成更小的子问题,并利用子问题的解来解决大问…

linux下coredump问题的定位分析方法

(Owed by: 春夜喜雨 http://blog.csdn.net/chunyexiyu) 参考:https://blog.csdn.net/m0_73698480/article/details/130077852 最近定位了一段时间linux下的崩溃问题,又收集了一些思路,特整理记录一下。 常见coredump定位方法是&#xff1a…

软考中级网络工程师-网络技术

下列命令片段含义是( )。 system-view [HUAWEI] observe-port 1 interface gigabitethernet 0/0/1 [HUAWEI] interface gigabitethernet 0/0/2 [HUAWEI-GigabitEthernet0/0/2] port-mirroring to observe-port 1 inbound A 配置端口镜像 B 配置链路聚合 C 配置逻辑接口 D 配置访…

大模型应用工具 LangChain 入门书籍: LangChain 简明讲义

书籍信息 书名:《LangChain 简明讲义:从 0 到 1 构建 LLM 应用程序》出版社:电子工业出版社书籍链接:https://item.jd.com/14105705.html书籍配套代码:https://github.com/kebijuelun/langchain_book 书籍背景 计算机…

力扣LeetCode138. 复制带随机指针的链表 两种解法(C语言实现)

目录 题目链接 题目分析 题目定位: 解题思路 解题思路1(粗暴但是复杂度高) 解题思路2(巧妙并且复杂度低) 题目链接 138. 复制带随机指针的链表https://leetcode-cn.com/problems/copy-list-with-random-pointer/ …

实战项目——智慧社区(四)之 系统管理

1、用户管理 提供查询和搜索用户、根据id查询用户信息、添加用户、修改用户、删除用户的功能 界面 添加用户 修改用户信息 2、角色管理 提供查询和搜索角色、根据id查询角色信息、添加角色、修改角色、删除角色的功能 界面 添加角色 修改角色 3、菜单管理 提供查询和搜索菜…

机器学习在安全领域的应用:从大数据中识别潜在安全威胁

🧑 作者简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向的学习指导…

蓝桥杯第2152题——红绿灯

问题描述 爱丽丝要开车去上班, 上班的路上有许多红绿灯, 这让爱丽丝很难过。为 了上班不迟到, 她给自己的车安装了氮气喷射装置。现在她想知道自己上班最 短需要多少时间。 爱丽丝的车最高速度是 米每秒, 并且经过改装后, 可以瞬间加速到小于 等于最高速的任意速度, 也可以瞵…

Sonar下启动发生错误,elasticsearch启动错误

Download | SonarQube | Sonar (sonarsource.com) 1.首先我的sonar版本为 10.4.1 ,java版本为17 2.sonar启动需要数据库,我先安装了mysql, 但是目前sonar从7.9开始不支持mysql,且java版本要最少11,推荐使用java17 3.安装postsql,创建sonar数据库 4.启…

分布式锁的实现

一、背景 在分布式系统中,一个应用部署在多台机器中,在某些场景下,为了保证数据的一致性,要求在同一时刻,同一任务只在一个节点上运行,即保证某个行为在同一时刻只能被一个线程执行。在单机单进程多线程环境下,通过锁很容易做到,比如 mutex、spinlock、信号量 等。在多…

Chapter 1-10. Introduction to Congestion in Storage Networks

Common Questions on Storage Networks This section covers some questions that we have been frequently asked and our responses to those questions. 本节包括我们经常被问到的一些问题以及我们对这些问题的答复。 Q: What is the difference between a network and a …

ArcGIS Desktop使用入门(三)图层右键工具——可见比例范围

系列文章目录 ArcGIS Desktop使用入门(一)软件初认识 ArcGIS Desktop使用入门(二)常用工具条——标准工具 ArcGIS Desktop使用入门(二)常用工具条——编辑器 ArcGIS Desktop使用入门(二&#x…

如何下载和安装Google Chrome扩展插件:一步步指南

Google Chrome 插件为我们提供了这样的便利,但有时找到一个有用的插件后,我们可能需要将其下载到本地以便离线使用或备份。 一、为什么可以从Google Chrome商店直接下载插件? Google Chrome 扩展插件主要通过Chrome Web Store分发&#xff…

scala---面向对象(类,对象,继承,抽象类,特质)

一、类(class)和 对象(object) 1、类 类就是对客观的一类事物的抽象。用一个class关键字来描述和Java一样,在这个类中可以拥有这一类事物的属性,行为等等。 2、为什么要有对象 在java中的一个class既可…

流氓软件清理绝杀全家桶

下载地址:流氓软件清理绝杀全家桶.zip 网上仍有不少软件中携带流氓软件,甚至某些所谓的大厂出品的工具中也会有一些捆绑! 对于玩机经验不太丰富的小白来说,也许一不小心,桌面就会被某些流氓软件搞得乌烟瘴气&#xf…

实验笔记之——RGBD GS-ICP SLAM配置与测试

《RGBD GS-ICP SLAM》是最新开源的一个3DGS-SLAM工作,通过利用GICP来实现当前帧gaussian与已mapping的gaussian进行匹配进行位姿的估算,并通过关键帧的选择策略来进一步提升performance~ Use G-ICP to align the current frame with the 3D GS map whic…

基于人脸识别的发型推荐系统代码实现

1.摘要 本文介绍了一个基于人脸识别技术的发型推荐系统的实现与分析。该系统利用Python编程语言和相关库,结合Face人脸识别API,实现了用户上传照片后的性别识别、脸型分析和发型推荐功能。首先,用户通过Tkinter GUI界面选择上传照片&#xff…

gpt在线网页版最全收录

ChatGPT镜像 今天在知乎看到一个问题:“平民不参与内测的话没有账号还有机会使用ChatGPT吗?” 从去年GPT大火到现在,关于GPT的消息铺天盖地,真要有心想要去用,途径很多,别的不说,国内GPT的镜像…