大模型基础

大模型是什么

大模型是一种由大规模语言模型,由大量神经元组成,可以对输入的文本或者其他的类似视频图片语音等进行预测和生成,以便提供更多的信息给用户。这种模型通常基于深度学习技术和大规模语言模型训练,能够模拟人类的对话方式,通过视频,图片以及语音和文本的方式与用户进行交互。比如现在流行的chatgpt,llama,文心一言,都是基于大模型技术开发的。
其中包括几个大类:

  1. prompt 提示词,用于引导模型生成内容,比如chatgpt的prompt,llama的prompt,文心的prompt,都是不同的
  2. 大模型API调用,包括function calling assistant APIs
  3. RAG,也属于embedding的部分,根据向量数据库以及相关的一些相关性进行检索数据库,根据数据库的知识去解决用户的一些问题
  4. agent,也叫做智能体,通过将复杂任务进行子任务的拆解,并通过调用基层大模型进行子任务的求解,然后通过交互的方式将结果进行整合,从而完成复杂任务
  5. finetune,对大模型进行微调,使其能够更好的适应特定的任务和场景,比如我们想要做一个教育类的大模型,需要通过自己收集大量教育类数据,然后进行微调,使其能够更好的适应教育类任务。比如一对一的私教(网易出品的子曰大模型其实就是一个微调模型)。通俗易懂的讲就是让大模型学习专业领域的一些知识,从而让大模型成为某个领域的专家,用于部署和应用。
  6. 多模态大模型,前面提到的大模型其实主要还是以文本的方式作为大模型的输入输出,但是实际生活中我们的输入可以是多种多样的,比如说视频,图片,语音,文本等,所以大模型其实可以支持多种模态的输入输出,从而能够更好的适应多种场景。也是通往通用人工智能的必经之路
  7. 模型压缩,对大模型进行压缩,使其能够更好的适应不同的硬件环境和不同的部署场景,从而能够更好的部署和应用。
  8. 模型部署,将大模型部署到不同的硬件环境和不同的部署场景,从而能够更好的部署和应用。
  9. 模型安全,对大模型进行安全防护,使其能够更好的适应不同的硬件环境和不同的部署场景,从而能够更好的部署和应用

大模型能做什么

  1. 按格式输出:提取数据库或者用户输入的prompt中的内容按照要求的格式输出结果
  2. 分类:将用户输入的prompt按照要求进行分类,比如情感分类,情感分析,情感识别等
  3. 聚类:将用户输入的prompt按照要求进行聚类,比如相似度计算,相似度分析,相似度识别等,比如如果我们想要在数据库中找到我们想要的一些知识,之前的方式可能是百度,google搜索一下,之后可能是直接输入prompt,然后通过大模型进行搜索,从而能够更好的找到我们想要的知识。当然这里的prompt可能是文本也可以是语音,图片,视频等。
  4. 角色扮演:现在很多开源或者闭源的大模型,一般会让大模型扮演某一个角色,比如说你现在是一个专业的设计师,现在让你来回答一些设计师领域相关的问题,那么大模型就可以扮演设计师的角色,从而能够更好的回答设计师领域的问题。具体原因在于大模型训练的过程中一般会给训练数据进行分类打标签,这样如果提示词中有相应的一些类别标签,大模型就可以更好的识别并回答相应的问题。
  5. 问答:这个应该是最基本的一些功能了,大模型本身训练数据就是通过问答的方式去做的,问答包括简单的一问一答,或者类似function calling,assistant APIs的方式去调用大模型进行问答,大模型会根据用户的一些反馈给出一些问题,最后进行整合,从而给出最终的答案。
  6. 生成:包括类似程序员的代码生成,这种确定性的一些输入输出的一些问题可以通过大模型来解决用以提升生产效率。再比如生成文章,ppt,文案,图片,视频等,这些都是可以通过大模型来完成,知识目前看还是有很多需要改进的空间。比如视频生成时间维度上一致性的问题,经常生成的视频变着变着就千奇百怪了。
  7. 翻译:大模型可以进行多语言的翻译,从而能够更好的适应不同语言的用户需求。这个应该已经算是落地了,很多留学生都会用一些翻译软件,这样就可以在上课或者平时交流的时候可以通过这些软件来实现一定程度上的解决语言上的障碍了,再比如一些国内的大厂,比如网易开发的hi echo等通过大模型来扮演私教的方式教别人怎么进行英语的口语练习等。
  8. 鉴定:相当于分类的一种,赵勇在线推出了一款AI鉴宝的功能,这种其实就是之前通过AI来进行古董分类鉴定真伪,很多都只需要上传一张图片就可以给出结果,据说准确率达到95%。
  9. 垂类应用:比如某一程序员只懂C++后端编程,如果自己想要做一款APP出来,就可以通过大模型来辅助自己去完成包括前端,美术视角,后端,以及数据库的一些代码构建然后去实现一定意义上的超级个体,一个人完成整个链路的开发。
  10. 游戏:大模型可以进行一些游戏的开发,比如之前提到的王者荣耀,很多游戏都是通过大模型来辅助完成一些游戏操作的,
  11. 影视:很多特效类或者剪辑类的都是可以通过大模型来提升效率的
  12. 音乐:大模型可以进行一些音乐创作,比如之前提到的AI作词,AI作曲,AI编曲等,
  13. 图像:大模型可以进行一些图像处理,比如之前提到的AI换脸,AI图像修复等,
  14. 在线培训:比如知识付费,这一波应该是很多人都得到了大模型的红利,很多人想要了解自己不了解的一些事情,比如设计师不知道怎么码代码,包工头不知道怎么写PPT,程序员不知道怎么写文案,大模型可以进行一些辅助性的培训,从而能够更好的提升效率。
  15. 虚拟人:大模型可以进行一些虚拟人的开发,比如之前提到的AI主播,AI虚拟形象等,现在很火的数字人直播就是其中一种
    以上的只是个人视角所看到的一些应用,有重复也有一些不太黑的地方,当然也有很多没看到的领域,大家共勉吧,希望大模型能够给我们的生活带来更多的便利。AGI时代存在很多信息差,这就代表这赚钱的机会,最好的方式就是根据自己熟悉的领域去挖掘AI的一些应用,大的应用系统或者大模型微调等,都是需要某一行业大量的数据堆砌出来的,普通人更多的是找到某一个行业的链路中的某一环节去通过AI赋能提升效率,打出自己跟头部企业的差异来,然后去获取自己的第一桶金。

总之一句话,普通人其实大部分还是不知道或者没办法去清晰认识到自己的能力欠缺,没办法一直坚持去做自己擅长的一些事情,赚钱本质是你可以提供价值,而价值来源于你的能力,而能力来源于你的经验,而经验来源于你的经历,所以去做吧,洞察力+执行力才是赚钱的最好方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/653655.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

K个一组翻转链表---链表OJ

https://leetcode.cn/problems/reverse-nodes-in-k-group/?envType=study-plan-v2&envId=top-100-liked K个一组进行翻转,大体上是和前面两两翻转是类似的,区别就在于,这里需要自己判断是否需要翻转,如何翻转,怎么记录。这里我们用递归来实现。 是否需要翻转…

数据结构·单链表经典例题

1. 移除链表元素 OJ链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 本题是说给出一个链表的头节点head和一个整数val,如果发现节点中存的数据有val就删掉它,最后返回修改后的链表头节点地址 如果题目中没有明确…

第十八讲_HarmonyOS应用开发实战(实现电商首页)

HarmonyOS应用开发实战(实现电商首页) 1. 项目涉及知识点罗列2. 项目目录结构介绍3. 最终的效果图4. 部分源码展示 1. 项目涉及知识点罗列 掌握HUAWEI DevEco Studio开发工具掌握创建HarmonyOS应用工程掌握ArkUI自定义组件掌握Entry、Component、Builde…

【Redis】关于它为什么快?使用场景?以及使用方式?为何引入多线程?

目录 1.既然redis那么快,为什么不用它做主数据库,只用它做缓存? 2.Redis 一般在什么场合下使用? 3.redis为什么这么快? 4.Redis为什么要引入了多线程? 1.既然redis那么快,为什么不用它做主数据…

Nginx 配置解析:从基础到高级应用指南

Nginx 配置解析:从基础到高级应用指南 Nginx 配置解析:从基础到高级应用指南1. 安装和基本配置安装 Nginx基本配置 2. 虚拟主机配置3. 反向代理配置4. 负载均衡配置5. SSL 配置6. 高级配置选项结语 Nginx 配置解析:从基础到高级应用指南 Ngi…

C#使用OpenCvSharp4库读取电脑摄像头数据并实时显示

一、OpenCvSharp4库 OpenCvSharp4库是一个基于.Net封装的OpenCV库,Github源代码地址为:https://github.com/shimat/opencvsharp,里面有关于Windows下安装OpenCvSharp4库的描述,如下图所示: 二、C#使用OpenCvSharp4库…

java 中 this关键字

class Person {private double base;// 普通方法(非构造器方法)里的this,就是new出来的那个对象public double getBase(){ return this.base;}public void setBase(double b){this.base b }// 构造器中的this,是,当前正在new过程中的对象&am…

人机协同中的一阶谓词推理与态势信息增强

一阶谓词逻辑推理是指使用一阶谓词逻辑来进行推理和推断。在人机协同中,一阶谓词逻辑推理可以用于理解和解释人类用户的意图和需求,以及帮助机器理解和生成自然语言。 一阶谓词逻辑推理的基本原理是使用一组逻辑规则和事实,通过逻辑推理来得出…

Python tkinter (8) ——Spinbox控件

Python的标准Tk GUI工具包的接口 tkinter系列文章 python tkinter窗口简单实现 Python tkinter (1) —— Label标签 Python tkinter (2) —— Button标签 Python tkinter (3) —— Entry标签 Python tkinter (4) —— Text控件 Python tkinter (5) 选项按钮与复选框 Pyt…

中间件安全

中间件安全 vulhub漏洞复现:https://vulhub.org/操作教程:https://www.freebuf.com/sectool/226207.html 一、Apache Apache(音译为阿帕奇)是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和…

RT-DETR改进有效系列目录 | 包含卷积、主干、RepC3、注意力机制、Neck上百种创新机制

💡 RT-DETR改进有效系列目录 💡 前言 Hello,各位读者们好 Hello,各位读者,距离第一天发RT-DETR的博客已经过去了接近两个月,这段时间里我深入的研究了一下RT-DETR在ultralytics仓库的使用,旨在为大家解决为什么用v8的仓库训练的时候模型不收敛,精度差的离谱的问题,…

智能小程序页面配置、运行机制及路由

页面介绍 Page 代表应用的一个页面,负责页面展示和交互。每个页面对应一个子目录,一般有多少个页面,就有多少个子目录。它也是一个构造函数,用来指定页面的初始数据、生命周期回调、事件处理函数等。 每个小程序页面一般包含以下…

设计一个分布式ID

为了保证全局唯一性可以用时间作为区分点一部分,时间尽可能细化,可以精确到毫秒,甚至是微秒和纳秒。如果是分布式系统有多态机器,可以根据机器ID再进行以下区分。如哦机器运行的特别快,1毫秒有大量ID生成,可…

第十四章认识Ajax(五)

art-template模板引擎 简介 art-template模板引擎是新一代高性能JavaScript模板引擎,可以将数据与HTML模板结合,省去繁琐的字符串拼接,便于代码维护。 此模板主要使用特定的语法将动态数据嵌入到HTML模板中,然后生成最终的HTML页面。 art-template模板引擎既可以在服务…

代码随想录算法训练营第2天—数组02 | *977.有序数组的平方 ,209.长度最小的子数组 ,*59.螺旋矩阵II

*977.有序数组的平方 题目链接:https://leetcode.cn/problems/squares-of-a-sorted-array/ 文章讲解:https://programmercarl.com/0977.%E6%9C%89%E5%BA%8F%E6%95%B0%E7%BB%84%E7%9A%84%E5%B9%B3%E6%96%B9.html 视频讲解: https://www.bilib…

MarkDown快速入门-以Obsidian编辑器为例

直接上图,左右对应。 首先是基础语法。 # 标题,几个就代表几级标题;* 单个是序号,两个在一起就是斜体;- [ ] 代表任务,注意其中的空格; 然后是表格按钮代码 | 使用中竖线代表表格&#xff0c…

Mybatis 52_基于嵌套select的N-N关联

52_基于嵌套select的N-N关联 嵌套select的N-N关联映射基于嵌套select的映射时,可指定如下独有属性:项目0522基于嵌套select的N-N使用@Many注解嵌套select的N-N关联映射 【备注】:对于N-N关联,底层数据表不能直接使用主外键关联来管理,必须使用连接表来管理关联关系。 只要…

Ubuntu22.04安装docker

君衍. 一、认识docker二、查看Docker的依赖三、在Ubuntu22.04上安装Docker步骤1、更新Ubuntu2、添加Docker库3、安装Docker4、Docker测试 四、安装docker-compose 一、认识docker Docker是一个软件容器平台,属于Linux容器的一种封装,同时提供简单易用的…

3. 构建以太网交换网络

3.1 实验一:以太网基础与 VLAN 配置实验 3.1.1 实验介绍 3.1.1.1 关于本实验 以太网是一种基于 CSMA/CD(Carrier Sense Multiple Access/Collision Detection)的共享通讯介质的数据网络通讯技术。当主机数目较多时会导致冲突严重、广播泛滥…