书生·浦语大模型实战营Day01全链路开源体系

书生·浦语大模型实战营-全链路开源体系

扫码报名

大模型

  • 通用人工智能的重要途经
    在这里插入图片描述

  • 专用大模型–通用大模型

  • 大模型:通用人工智能的重要途经(专用大模型–通用大模型–多模态大模型–智能体)

InternLM发展历程

  • InternLM–书生 万卷(数据)、书生 浦语(模型)
  • InternLM–轻量级(7B)、中量级(20B)、重量级(123B)

在这里插入图片描述

  • InternLM2:7B和20B两种规模模型,InternLM2-Base、InternLM2和InternLM2-Chat三个版本

InternLM2

  • 回归语言建模的本质

在这里插入图片描述

  • InternLM2在超长上下文、综合性能、对话和创作体验、工具调用能力以及数理能力和数据分析功能等方面都有显著优势。

  • InternLM2-Chat-20B在重点评测上甚至可以达到比肩ChatGPT(GPT3.5)的水平。

从模型到应用过程和选型

在这里插入图片描述

  • 模型到应用的典型流程:业务场景是否复杂–算力是否足够–是否交互(智能体)–评测–部署

在这里插入图片描述

书生·浦语大模型全链路开源体系

在这里插入图片描述

数据(书生·万卷)

  • 书生·浦语大模型的数据集名为"书生·万卷",是一个包含1.6万亿token的多语种高质量数据集,涵盖多种模态和任务。包含文本数据(50 亿个文档,数据量超 1TB),图像-文本数据集(超 2200 万个文件,数据量超 140GB),视频数据(超 1000 个文件,数据量超 900GB)
  • 书生·万卷(总数据量:2TB,文本图像和视频);Opendatalab开放数据平台

预训练(InternLM-Train)

  • InternLM-Train是一个基于Transformer架构的预训练模型,它具有1040亿参数,通过在书生·万卷数据集上进行训练,使模型具备了强大的语言理解和生成能力。它支持从 8 卡到千卡训练,千卡训练效率达 92%;无缝接入 HuggingFace 等技术生态,支持各类轻量化技术。

微调(XTuner微调框架)

  • XTuner可以根据不同的任务需求,对大模型进行微调,使其在特定领域或任务上表现更加优秀。
  • 支持多种任务类型,如增量预训练,指令微调,工具类指令微调
  • 支持全量参数、LoRA、QLoRA 等低成本微调,覆盖各类 SFT 场景
  • 支持多种大语言模型的微调,如 InternLM, Llama, QWen, BaiChuan, ChatGLM,适配多种开源生态,支持加载 HuggingFace、ModelScope 模型或数据集
  • 支持自动优化加速,如 Flash Attention, DeepSpeed ZeRO, Pytorch FSDP,使得开发者无需关注复杂的现存优化与计算加速细节
  • 支持多种硬件,覆盖 NVIDIA 20 系以上所有显卡,最低只需 8GB 现存即可微调 7B 模型
  • 支持多种数据格式,如 Alpaca, MOSS, OpenAI, Guanacao 等等。

部署(LMDeploy部署框架)

  • LMDeploy提供大模型在 GPU 上部署的全流程解决方案,包括模型轻量化、推理和服务。可以将大模型快速部署到各种计算平台上,实现模型的实时推理和应用。

  • 接口支持:Python, GRPC, RESTful

  • 量化支持:4bit 、8bit

  • 推理引擎:turbomind, pytorch

  • 服务:openai-server, gradio, triton inference server

评测(OpenCompass评测框架)

  • 包含80 套评测集,40 万道题目。全方位评测,采用六大维度,主要是学科,语言,知识,理解,推理和安全。

  • 学科:初中考试、中国高考、大学考试、语言能力考试、职业资格考试

  • 语言:字词释义、成语习语、语义相似、指代消解、翻译

  • 知识:知识问答、多语种知识问答

  • 理解:阅读理解、内容分析、内容总结

  • 推理:因果推理、常识推理、代码推理、数学推理

  • 安全:偏见、有害性、公平性、隐私性、真实性、合法性

应用(Lagent和AgentLego)

  • 开源了轻量级智能框架Lagent,灵活支持多种大语言模型,支持多种类型的智能体能力。
  • Lagent多模态智能体工具箱和AgentLego多模态智能体工具箱。
  • 帮助开发者构建和训练多模态智能体,实现图文混合创作、多模态对话等应用场景。

InternLM2 技术报告阅读

LLM开发的主要阶段:预训练、监督微调和人类反馈强化学习。论文还在研读。

预训练数据

  • 文本数据

  • 代码数据

  • 长文本数据

预训练设置

  • tokenization

  • 预训练超参数

预训练阶段

  • 4k上下文训练

  • 长上下文训练

  • 特定能力增强训练

小结

  • 由于之前事情多没有太多精力分配到实战营,第一期只是简单跟学了一下。并没有深入学习LLM和InternLM相关技术。希望这次能够借此机会学习相关技术,将大模型推广到在自己的研究领域,学以致用。

欢迎关注公众号
个人小站:https://www.xiaowangyun.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/5478.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

海报生成器源码(Python版)

海报生成器源码(Python版) 效果图部分源码领取源码下期更新预报 效果图 部分源码 from flask import Flask, Response, request from flask_cors import CORS from flask_uploads import UploadSet, configure_uploads, IMAGES, patch_request_classimp…

Enhancing Diffusion——利用三维透视几何约束增强扩散模型

概述 透视在艺术中被广泛研究,但现代高质量图像生成方法却缺乏透视精度。新的生成模型引入了几何约束,通过训练过程提高透视精度。这样可以生成更逼真的图像,并提高相关深度估计模型的性能。 最近的图像生成技术使研究人员能够创造性地进行…

点成分享 | 温度控制的艺术:TX150系列水浴中的稳定性与均匀性解析

前言 在实验室和工业生产中,温度控制对于确保实验结果的精确性和产品的高质量至关重要,尤其是针对温度敏感的样品和原材料,如蛋白酶等,微小的温度误差都会对实验结果可靠性和生产质量造成影响。而在控温性能中,稳定性…

自学Java要到什么程度才足够能力去实习和就业?

引言 Java,作为当今软件开发领域的主流编程语言之一,对于初学者而言,明确掌握到什么程度才能开始寻找实习和入职机会是至关重要的。这涉及到对Java知识体系的理解深度、技能掌握程度以及实际项目经验的积累。 本文将分别从实习和入职两个不…

学习VUE2第6天

一.请求拦截器 可以节流,防止多次点击请求 toast是单例 二.前置路由守卫 在Vue.js中,前置路由守卫是指在路由转换实际发生之前执行的钩子函数。这是Vue Router(Vue.js官方的路由管理器)提供的一种功能,允许开发者在用…

UNI-APP_拨打电话权限如何去掉,访问文件权限关闭

uniapp上架过程中一直提示:允许“app名”拨打电话和管理通话吗? uniapp配置文件:manifest.json “permissionPhoneState” : {“request” : “none”//拨打电话权限关闭 }, “permissionExternalStorage” : {“request” : “none”//访…

CAN总线介绍及在ZYNQ 7020中的应用

一、CAN总线协议介绍 1.CAN是 Controller Area Network 的缩写(以下称为 CAN ),是 ISO 国际标准化的串行通信协议。可以用来满足“多总线通信时,线束的数量过多”、“通过多个 LAN ,进行大量数据的高速通信”的需要。…

FIFO Generate IP核使用——Native接口Basic页配置

Xilinx FIFO Generator IP核是一个经过全面验证的先入先出(FIFO)内存队列,专为需要按顺序存储和检索的应用而设计。该IP核为所有FIFO配置提供了优化解决方案,并在利用最小资源的同时实现最大性能(高达500MHz&#xff0…

《Python编程从入门到实践》day19

#昨日知识点回顾 使用unittest模块测试单元和类 #今日知识点学习 第12章 武装飞船 12.1 规划项目 游戏《外星人入侵》 12.2 安装pygame 终端管理器执行 pip install pygame 12.3 开始游戏项目 12.3.1 创建Pygame窗口及响应用户输入 import sysimport pygameclass…

Android4.4真机移植过程笔记(三)

如果文章字体看得不是很清楚,大家可以下载pdf文档查看,文档已上传~oo~ 7、安装加密APK 需要修改文件如下: 相对Android4.2改动还是蛮大的,有些文件连路径都变了: //Android4.2 1、frameworks/native/libs…

tableau基础学习——添加标靶图、甘特图、瀑布图

标靶图 添加参考线 添加参考分布 甘特图 创建新的字段 如设置延迟天数****计划交货日期-实际交货日期 为正代表提前交货,负则代表延迟交货 步骤:创建——计算新字段 把延迟天数放在颜色、大小里面就可以 瀑布图 两个表按照地区连接 先做个条形图&…

Linux的vim下制作进度条

目录 前言: 回车和换行有区别吗? 回车和换行的区别展示(这个我在Linux下演示) 为什么会消失呢? 回车和换行的区别 为什么\r和\n产生的效果不同? 打印进度条: (1)打印字符串 …

Anomalib:用于异常检测的深度学习库!

大家好,今天给大家介绍了一个用于无监督异常检测和定位的新型库:anomalib,Github链接:https://github.com/openvinotoolkit/anomalib 简介 考虑到可重复性和模块化,这个开源库提供了文献中的算法和一组工具,以通过即插即用的方法设计自定义异常检测算法。 Anomalib 包…

【STM32】快速使用F407通用定时器输出可变PWM

网上的文章太啰嗦,这里直接开始。 使用的是STM32CubeIDE,HAL。以通用定时器TIM12在 通道2上输出1KHz的PWM为例。 要确定输出的引脚、定时器连接在哪里。 TIM2、3、4、5、12、13、14在APB1上,最大计数频率84M。 TIM1、8、9、10、11在APB2…

RS0102YH8功能和参数介绍及如何计算热耗散

RS0102YH8功能和参数介绍-公司新闻-配芯易-深圳市亚泰盈科电子有限公司 RS0102YH8 是一款电平转换芯片,由润石(RUNIC)公司生产。以下是关于RS0102YH8的一些功能和参数的介绍: 电平转换功能: RS0102YH8旨在提供电平转换…

Web APIs 学习归纳5--- BOM浏览器对象

前面几节主要针对DOM进行了学习,现在开始新的内容的学习---DOM浏览器对象。 DOM是更注重页面(document)内容的设计,但是BOM不仅限于页面(document)的设计,而是更加全面包括页面的刷新&#xff0…

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-8.2-链接脚本

前言: 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM(MX6U)裸机篇”视频的学习笔记,在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

C++入门基础(二)

目录 缺省参数缺省参数概念缺省参数分类全缺省参数半缺省参数声明与定义分离 缺省参数的应用 函数重载函数重载概念例子1 参数类型不同例子2 参数的个数不同例子3 参数的顺序不同 C支持函数重载的原理--名字修饰(name Mangling) 感谢各位大佬对我的支持,如果我的文章对你有用,欢…

傲软录屏(ApowerREC)一款简单好用的录屏软件,中文破姐版 v1.6.9.6(240501)

软件介绍 傲软录屏,是由ApowerREC开发的一款高级录屏软件,兼容多个操作系统平台,包括Windows、Mac以及基于安卓和iOS的设备。这款专业工具具备捕捉各类屏幕活动的能力,确保音视频同步,无论用户是进行电脑桌面操作、参…

算法入门<二>:分治算法之汉诺塔问题及递归造成的栈溢出

1、分治算法 分治(divide and conquer),全称分而治之,是一种非常重要且常见的算法策略。分治通常基于递归实现,包括“分”和“治”两个步骤。 分(划分阶段):递归地将原问题分解为两…