从零开始一步一步掌握大语言模型---(1-写在最开始)

一、为什么要开始这个系列?

从23年开始接触Chatpgt以来,被其强大的功能深深的震撼到。它不仅是能写论文,编故事,真的是能深刻影响到我们各行各业的一项新技术。在我们社会即将迎来智能化革命的前期,深刻的理解和掌握这项技术,是参与到这波智能化革命中的必要条件。因此,开始这个系列,既是对我学习的总结,也希望能够帮助到尽可能多的人或者认识到更多可爱的人。

二、什么是大语言模型?

维基百科中定义大语言模型(Large Language Model, LLM)是一种语言模型,由许多神经网络的参数所组成,这些参数通常在十亿或百亿以上。这种模型使用自监督学习或者半监督学习通过对海量的未标记文本(就是互联网上爬取的)进行训练所得到的。

三、大语言模型可以做哪些任务?

大语言模型,我认为可以简单的将其理解为一种能通过键盘跟你交流的高中生或者本科生,并且能死心塌地尽可能去完成你交代的工作的一种工具。想想高中生本科生能通过键盘跟你交流什么,干什么,那么大语言模型都可以帮你做。通常来说,大语言模型具有以下几个比较专业的应用:
1.信息检索。因为它在训练阶段给它输入了海量的文本,甚至是互联网上所有尽可能的文字。所以它在训练过程中,可能学会了(捕获了)我们人类的大部分句法或语义,记住了这个世界的大量知识。所以现在很多搜索引擎如谷歌、百度等都借用它来实现高效的检索。
2.情感分析。给大模型输入文本,让其判断属于哪一类的情感。不要小看这项能力,在政府治理中,通过利用该技术,可以实时的监测到某项事件或者某段时间人民的舆情状况。或者在卖商品的里面,就可以快速分析中哪些商品人们对其的评价状况。
3.文本生成。这当然是大语言模型的拿手把戏了。给其一段命令,它可以生成出更多的内容。写故事,写论文,续写等等。之所以是拿手把戏,是因为大模型训练的时候,就是让它尝试尽可能的预测到下一个是什么字。通过不断的预测下一个字,就可以不断生成出更多的文字。其实这点和人类也很像,我们说话或者打字的时候,其实也是说完前面的,随后就会生成出后面的,(当然指的是一次对话或者同一个话题,如果换一个话题肯定就没办法按照预测的方式跳过去了)。
4.代码生成。代码也是文本,只不过是更有逻辑性的文本。在训练阶段输入代码功能的注释,以及大量的代码,让它尝试按照注释去生成出原来的代码。这样大语言模型就可以学习到用户输入一个功能,它怎么去生成出相对应的代码了。
5.聊天机器人。这点很好玩,因为大语言模型学习到了大量的人类知识,因此通过对话的方式,可以跟它聊天,而不是把它当成一个玩具或者弱智。
6.医疗保健和科学。大语言模型可以理解蛋白质、分子、DNA和RNA。利用LLM可以协助疫苗研制,寻找治疗方法。作为医疗聊天机器人,可以接收患者入院或进行基本诊断。
7.客户服务。可以把大模型微调成自己公司的专属客服。
8.营销。不懂。可能可以拿它写些广告词之类。
9.法律。现在清华大学的刘知远团队就在做。将大模型用到法律的各个业务流程中。
10.金融。用大模型分析用户是否遭遇欺诈或者异常的金融活动。这个后续我要进一步研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/769171.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT模型部署后续:聊天机器人系统的扩展与优化

一、多轮对话支持 为了实现多轮对话支持,我们需要维护用户的会话上下文。这可以通过在服务器端使用一个字典来存储会话状态实现。 目录 一、多轮对话支持 下面是一个简单的扩展例子: 二、性能优化 三、用户界面与交互优化 下面是一个简单的HTML示例&…

一文搞懂 YOLOv9 训练推理全流程 | YOLOv9你绝对不知道的细节!

文章地址:https://arxiv.org/pdf/2402.13616.pdf 代码地址:https://github.com/WongKinYiu/yolov9 前言 在这篇博客中,我们来聊聊 YOLOv9。首先,值得注意的一点是,YOLOv9的变化相对较小,它仍然基于YOLOv5的…

微信小程序button动态跳转到页面

微信小程序中如何动态的跳转到某个页面。 目录 1、首先在js文件中定义事件函数 2、在页面中进行传参调用 3、其它跳转方法简单说明 1、首先在js文件中定义事件函数 goto(e){const urle.currentTarget.dataset.url;wx.navigateTo({url: url})}, 2、在页面中进行传参调用 &l…

【随笔】Git -- 常用命令(四)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

带你学会深度学习之循环神经网络[RNN] - 2

前言 笔者写下此系列文章是希望在复习人工智能相关知识同时为想学此技术的人提供一定帮助。 图源网络,所有者可随时联系笔者删除。 代码不代表全部实现,只是为展示模型的关键结构。 与CNN不同,RNN被设计用来处理序列数据。它通过在网络的…

3GPP 协议资料学习和文档下载

一、登录3GPP官网 3GPP – The Mobile Broadband Standard 二、选择Specifications Per TSG Round 三、选择ftp下载路径 四、选择不同阶段的3GPP协议 包含了从1999年到R18,甚至更新到当前最新的协议。 五、查看对应版本的LTE或者5G NR协议 其中LTE射频相关章节为36.521系列&…

hadoop配置免密登录

1.生成密钥 ssh-keygen -t rsa 所有节点都要执行 2.所有节点执行 ssh-copy-id -i ~/.ssh/id_rsa.pub 用户名1主机名1 ssh-copy-id -i ~/.ssh/id_rsa.pub 用户名2主机名2 ssh-copy-id -i ~/.ssh/id_rsa.pub 用户名3主机名3 3.目录授权 chmod 700 ~/.ssh chmod 600 ~/.ssh…

小目标检测篇 | YOLOv8改进之增加小目标检测层(针对Neck网络为AFPN)

前言:Hello大家好,我是小哥谈。小目标检测是计算机视觉领域中的一个研究方向,旨在从图像或视频中准确地检测和定位尺寸较小的目标物体。相比于常规目标检测任务,小目标检测更具挑战性,因为小目标通常具有低分辨率、低对比度和模糊等特点,容易被背景干扰或遮挡。本篇文章就…

MP4如何把视频转MOV格式? MP4视频转MOV格式的技巧

在现代的数字媒体时代,视频格式转换成为了许多用户必须掌握的技能。特别是将MP4视频转换为MOV格式,这对于需要在Apple设备上播放或编辑视频的用户来说尤为重要。本文将详细介绍如何将MP4视频转换为MOV格式,帮助读者轻松应对不同设备和平台的需…

三端可调正稳压器集成电路D317——输出电压范围是1.2V至37V,负载电流最大为1.5A

D317大电流可调稳压电路 1、 概述: D317是一款三端可调正稳压器集成电路,其输出电压范围是1.2V至37V,负载电流最大为1.5A。它的使用非常简单,仅需两个外接电阻来设置输出电压。此外,它的电压线性度和负载调整率也比标准…

使用Python制作一个批量查询搜索排名的SEO免费工具

搭建背景 最近工作中需要用上 Google SEO(搜索引擎优化),有了解过的朋友们应该都知道SEO必不可少的工作之一就是查询关键词的搜索排名。关键词少的时候可以一个一个去查没什么问题,但是到了后期,一个网站都有几百上千…

浏览器工作原理与实践--渲染流程(上):HTML、CSS和JavaScript,是如何变成页面的

在上一篇文章中我们介绍了导航相关的流程,那导航被提交后又会怎么样呢?就进入了渲染阶段。这个阶段很重要,了解其相关流程能让你“看透”页面是如何工作的,有了这些知识,你可以解决一系列相关的问题,比如能…

获取第三方小程序指定页面的path

获取第三方小程序指定页面的path wx.navigateToMiniProgramappIdpathwx.navigateToMiniProgram 在开发小程序时需要跳转到第三方小程序指定页面时,需通过wx.navigateToMiniProgram方法完成。其中有两个主要参数appId和path,文本以问卷星为例,分享两者获取方法。 appId 在…

2021年安徽省职业院校技能大赛(网络建设与运维)

2021年XX省职业院校技能大赛 《主要网络环境》 网络搭建与应用赛项执委会及专家组 2021年4月 表1:拓扑结构图 表2:网络设备连接表 A设备连接至B设备 设备名称 接口 设备名称 接口 R1 G0/3 SW-1 E1/0/22 R1 G0/4 SW-2 E2/0/22 R1 G0/5 SW-Line1模拟交换机 E1/0/11 R1 G0/6 …

使用Python批量实现文件夹下所有Excel文件的第二张表合并

目录 一、前言 二、准备工作 三、实现步骤 遍历文件夹获取所有Excel文件 读取每个Excel文件的第二张表 合并所有表格 主函数 四、案例实践 五、注意事项 六、扩展与改进 七、总结 在数据处理和分析中,经常需要对多个Excel文件进行批量操作,特…

代码随想录阅读笔记-栈与队列【滑动窗口最大值】

题目 给定一个数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。 返回滑动窗口中的最大值。 进阶: 你能在线性时间复杂度内解决此题吗? 提示&am…

用PHP实现写一个网页图片验证码

下面这个验证码代码是一个典型的PHP验证码生成脚本,它的设计和实现都比较规范和实用。以下是对这个验证码代码的一些分析和介绍: 优点: 安全性:验证码的生成过程通过随机选取字符数组中的元素来实现,并且每次生成都会…

纳米体育数据足球数据接口:统计数据包接口文档API示例④

纳米体育数据的数据接口通过JSON拉流方式获取200多个国家的体育赛事实时数据或历史数据的编程接口,无请求次数限制,可按需购买,接口稳定高效;覆盖项目包括足球、篮球、网球、电子竞技、奥运等专题、数据内容。 纳米数据API2.0版本…

git commit 生成patch

在Git中,生成特定commit的补丁文件可以通过git format-patch命令实现。以下是生成补丁文件的步骤: 首先,确保你已经提交了想要生成补丁的commit。 然后,使用git format-patch -1 生成该commit的补丁文件,其中是你想要生…

如何提升FFmpeg 1‰的转码性能

在8K视频编解码特别是解码部分,我做了一些优化工作,转码速度提升了50%以上。专家们评价曰:“主要围绕算法并行度的优化,属于算法性能优化的常规手段,在创新性和技术难度方面的体现较为一般”。评价过于犀利&#xff0c…