书生·浦语大模型实战营Day01全链路开源体系

书生·浦语大模型实战营Day01全链路开源体系

web/2025/4/12 20:37:57/文章来源:https://blog.csdn.net/scc1371815174/article/details/137222289

书生·浦语大模型实战营-全链路开源体系

扫码报名

大模型

通用人工智能的重要途经
专用大模型–通用大模型
大模型：通用人工智能的重要途经（专用大模型–通用大模型–多模态大模型–智能体）

InternLM发展历程

InternLM–书生万卷（数据）、书生浦语（模型）
InternLM–轻量级（7B）、中量级（20B）、重量级（123B）

在这里插入图片描述

InternLM2：7B和20B两种规模模型，InternLM2-Base、InternLM2和InternLM2-Chat三个版本

InternLM2

回归语言建模的本质

在这里插入图片描述

InternLM2在超长上下文、综合性能、对话和创作体验、工具调用能力以及数理能力和数据分析功能等方面都有显著优势。
InternLM2-Chat-20B在重点评测上甚至可以达到比肩ChatGPT（GPT3.5）的水平。

从模型到应用过程和选型

在这里插入图片描述

模型到应用的典型流程：业务场景是否复杂–算力是否足够–是否交互（智能体）–评测–部署

在这里插入图片描述

书生·浦语大模型全链路开源体系

在这里插入图片描述

数据（书生·万卷）

书生·浦语大模型的数据集名为"书生·万卷"，是一个包含1.6万亿token的多语种高质量数据集，涵盖多种模态和任务。包含文本数据（50 亿个文档，数据量超 1TB），图像-文本数据集（超 2200 万个文件，数据量超 140GB），视频数据（超 1000 个文件，数据量超 900GB）
书生·万卷（总数据量:2TB,文本图像和视频）；Opendatalab开放数据平台

预训练（InternLM-Train）

InternLM-Train是一个基于Transformer架构的预训练模型，它具有1040亿参数，通过在书生·万卷数据集上进行训练，使模型具备了强大的语言理解和生成能力。它支持从 8 卡到千卡训练，千卡训练效率达 92%；无缝接入 HuggingFace 等技术生态，支持各类轻量化技术。

微调（XTuner微调框架）

XTuner可以根据不同的任务需求，对大模型进行微调，使其在特定领域或任务上表现更加优秀。
支持多种任务类型，如增量预训练，指令微调，工具类指令微调
支持全量参数、LoRA、QLoRA 等低成本微调，覆盖各类 SFT 场景
支持多种大语言模型的微调，如 InternLM, Llama, QWen, BaiChuan, ChatGLM，适配多种开源生态，支持加载 HuggingFace、ModelScope 模型或数据集
支持自动优化加速，如 Flash Attention, DeepSpeed ZeRO, Pytorch FSDP，使得开发者无需关注复杂的现存优化与计算加速细节
支持多种硬件，覆盖 NVIDIA 20 系以上所有显卡，最低只需 8GB 现存即可微调 7B 模型
支持多种数据格式，如 Alpaca, MOSS, OpenAI, Guanacao 等等。

部署（LMDeploy部署框架）

LMDeploy提供大模型在 GPU 上部署的全流程解决方案，包括模型轻量化、推理和服务。可以将大模型快速部署到各种计算平台上，实现模型的实时推理和应用。
接口支持：Python, GRPC, RESTful
量化支持：4bit 、8bit
推理引擎：turbomind, pytorch
服务：openai-server, gradio, triton inference server

评测（OpenCompass评测框架）

包含80 套评测集，40 万道题目。全方位评测，采用六大维度，主要是学科，语言，知识，理解，推理和安全。
学科：初中考试、中国高考、大学考试、语言能力考试、职业资格考试
语言：字词释义、成语习语、语义相似、指代消解、翻译
知识：知识问答、多语种知识问答
理解：阅读理解、内容分析、内容总结
推理：因果推理、常识推理、代码推理、数学推理
安全：偏见、有害性、公平性、隐私性、真实性、合法性

应用（Lagent和AgentLego）

开源了轻量级智能框架Lagent，灵活支持多种大语言模型，支持多种类型的智能体能力。
Lagent多模态智能体工具箱和AgentLego多模态智能体工具箱。
帮助开发者构建和训练多模态智能体，实现图文混合创作、多模态对话等应用场景。

InternLM2 技术报告阅读

LLM开发的主要阶段：预训练、监督微调和人类反馈强化学习。论文还在研读。

预训练数据

文本数据
代码数据
长文本数据

预训练设置

tokenization
预训练超参数

预训练阶段

4k上下文训练
长上下文训练
特定能力增强训练

小结

由于之前事情多没有太多精力分配到实战营，第一期只是简单跟学了一下。并没有深入学习LLM和InternLM相关技术。希望这次能够借此机会学习相关技术，将大模型推广到在自己的研究领域，学以致用。

欢迎关注公众号
个人小站：https://www.xiaowangyun.com

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/5478.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

海报生成器源码（Python版）

海报生成器源码（Python版）

海报生成器源码（Python版） 效果图部分源码领取源码下期更新预报效果图部分源码 from flask import Flask, Response, request from flask_cors import CORS from flask_uploads import UploadSet, configure_uploads, IMAGES, patch_request_classimp…

阅读更多...

使用ldirectord实现LVS健康检测

使用ldirectord实现LVS健康检测

注意：在LVS/DR模式环境下，具体配置见上篇LVS/DR配置 1.1 ldirectord介绍 LVS监控: ldirectord 主要设计用于监控Linux虚拟服务器（LVS）架构中的服务器池状态。LVS是一种负载均衡解决方案，用于将网络流量和请求分发到多…

阅读更多...

Enhancing Diffusion——利用三维透视几何约束增强扩散模型

Enhancing Diffusion——利用三维透视几何约束增强扩散模型

概述透视在艺术中被广泛研究，但现代高质量图像生成方法却缺乏透视精度。新的生成模型引入了几何约束，通过训练过程提高透视精度。这样可以生成更逼真的图像，并提高相关深度估计模型的性能。最近的图像生成技术使研究人员能够创造性地进行…

阅读更多...

点成分享 | 温度控制的艺术：TX150系列水浴中的稳定性与均匀性解析

点成分享 | 温度控制的艺术：TX150系列水浴中的稳定性与均匀性解析

前言在实验室和工业生产中，温度控制对于确保实验结果的精确性和产品的高质量至关重要，尤其是针对温度敏感的样品和原材料，如蛋白酶等，微小的温度误差都会对实验结果可靠性和生产质量造成影响。而在控温性能中，稳定性…

阅读更多...

自学Java要到什么程度才足够能力去实习和就业?

自学Java要到什么程度才足够能力去实习和就业?

引言 Java，作为当今软件开发领域的主流编程语言之一，对于初学者而言，明确掌握到什么程度才能开始寻找实习和入职机会是至关重要的。这涉及到对Java知识体系的理解深度、技能掌握程度以及实际项目经验的积累。本文将分别从实习和入职两个不…

阅读更多...

学习VUE2第6天

学习VUE2第6天

一.请求拦截器可以节流，防止多次点击请求 toast是单例二.前置路由守卫在Vue.js中，前置路由守卫是指在路由转换实际发生之前执行的钩子函数。这是Vue Router（Vue.js官方的路由管理器）提供的一种功能，允许开发者在用…

阅读更多...

UNI-APP_拨打电话权限如何去掉，访问文件权限关闭

UNI-APP_拨打电话权限如何去掉，访问文件权限关闭

uniapp上架过程中一直提示：允许“app名”拨打电话和管理通话吗？ uniapp配置文件：manifest.json “permissionPhoneState” : {“request” : “none”//拨打电话权限关闭 }, “permissionExternalStorage” : {“request” : “none”//访…

阅读更多...

CAN总线介绍及在ZYNQ 7020中的应用

CAN总线介绍及在ZYNQ 7020中的应用

一、CAN总线协议介绍 1.CAN是 Controller Area Network 的缩写（以下称为 CAN ），是 ISO 国际标准化的串行通信协议。可以用来满足“多总线通信时，线束的数量过多”、“通过多个 LAN ，进行大量数据的高速通信”的需要。…

阅读更多...

设计数据库

设计数据库

一、设计数据库 ER图：Entity-Relation实体关系图 RDBMS关系型数据库管理系统里不支持多对多的关系，只支持一对一或一对多关系 1、数据库三大范氏第一范式：每个字段不能再分第二范式：每个表都有主键第三范式：从…

阅读更多...

FIFO Generate IP核使用——Native接口Basic页配置

FIFO Generate IP核使用——Native接口Basic页配置

Xilinx FIFO Generator IP核是一个经过全面验证的先入先出（FIFO）内存队列，专为需要按顺序存储和检索的应用而设计。该IP核为所有FIFO配置提供了优化解决方案，并在利用最小资源的同时实现最大性能（高达500MHz&#xff0…

阅读更多...

《Python编程从入门到实践》day19

《Python编程从入门到实践》day19

#昨日知识点回顾使用unittest模块测试单元和类 #今日知识点学习第12章武装飞船 12.1 规划项目游戏《外星人入侵》 12.2 安装pygame 终端管理器执行 pip install pygame 12.3 开始游戏项目 12.3.1 创建Pygame窗口及响应用户输入 import sysimport pygameclass…

阅读更多...

预编码算法学习笔记

预编码算法学习笔记

预编码算法学习笔记摘要： 本文将深入探讨预编码算法的学习要点，包括其基本概念、原理、实现方法以及在通信系统中的应用。通过详细的阐述和实例分析，帮助读者全面理解预编码算法，并掌握其在实际问题中的应用技巧。关键词&…

阅读更多...

vim与tmux配置文件及常用命令总结

vim与tmux配置文件及常用命令总结

一. 配置文件 1. .tmux.conf # 使用CtrlA作为前缀组合键 set -g prefix C-a unbind C-b bind C-a send-prefix# 支持鼠标操作 setw -g mouse on# 为了能够重新加载配置文件而无需重启tmux，可以绑定一个快捷键 bind r source-file ~/.tmux.conf \; display-message…

阅读更多...

mysql linux远程连接失败处理

mysql linux远程连接失败处理

问题一：远程连接不上mysql，提示Access denied 一、通过下面命令连接不上数据库 mysql -uroot -p mysql -uroot -h 10.5.122.100 -P 3306 -p报错信息如下： ERROR 1045 (28000): Access denied for user ‘root’‘localhost’ (using passwo…

阅读更多...

Android4.4真机移植过程笔记（三）

Android4.4真机移植过程笔记（三）

如果文章字体看得不是很清楚，大家可以下载pdf文档查看，文档已上传～oo～ 7、安装加密APK 需要修改文件如下： 相对Android4.2改动还是蛮大的，有些文件连路径都变了: //Android4.2 1、frameworks/native/libs…

阅读更多...

tableau基础学习——添加标靶图、甘特图、瀑布图

tableau基础学习——添加标靶图、甘特图、瀑布图

标靶图添加参考线添加参考分布甘特图创建新的字段如设置延迟天数****计划交货日期-实际交货日期为正代表提前交货，负则代表延迟交货步骤：创建——计算新字段把延迟天数放在颜色、大小里面就可以瀑布图两个表按照地区连接先做个条形图&…

阅读更多...

Linux的vim下制作进度条

Linux的vim下制作进度条

目录前言： 回车和换行有区别吗？ 回车和换行的区别展示（这个我在Linux下演示） 为什么会消失呢? 回车和换行的区别为什么\r和\n产生的效果不同？ 打印进度条： （1）打印字符串 …

阅读更多...

Anomalib：用于异常检测的深度学习库!

Anomalib：用于异常检测的深度学习库!

大家好，今天给大家介绍了一个用于无监督异常检测和定位的新型库：anomalib，Github链接：https://github.com/openvinotoolkit/anomalib 简介考虑到可重复性和模块化，这个开源库提供了文献中的算法和一组工具，以通过即插即用的方法设计自定义异常检测算法。 Anomalib 包…

阅读更多...

【STM32】快速使用F407通用定时器输出可变PWM

【STM32】快速使用F407通用定时器输出可变PWM

网上的文章太啰嗦，这里直接开始。使用的是STM32CubeIDE，HAL。以通用定时器TIM12在通道2上输出1KHz的PWM为例。要确定输出的引脚、定时器连接在哪里。 TIM2、3、4、5、12、13、14在APB1上，最大计数频率84M。 TIM1、8、9、10、11在APB2…

阅读更多...

RS0102YH8功能和参数介绍及如何计算热耗散

RS0102YH8功能和参数介绍及如何计算热耗散

RS0102YH8功能和参数介绍-公司新闻-配芯易-深圳市亚泰盈科电子有限公司 RS0102YH8 是一款电平转换芯片，由润石（RUNIC）公司生产。以下是关于RS0102YH8的一些功能和参数的介绍： 电平转换功能： RS0102YH8旨在提供电平转换…

阅读更多...

最新文章