【书生大模型实战】L1-书生大模型全链路开源体系

【书生大模型实战】L1-书生大模型全链路开源体系

bicheng/2025/4/4 13:32:41/文章来源:https://blog.csdn.net/cjy_colorful0806/article/details/140724888

一、关卡任务

观看本关卡视频后，写一篇关于书生大模型全链路开源开放体系的笔记。
视频链接：【书生·浦语大模型全链路开源体系】 https://www.bilibili.com/video/BV1Vx421X72D/?share_source=copy_web

二、实验过程

书生·浦语大模型全链路开源体系，上海AI Lab，陈恺老师

大模型已经成为发展AGI的重要途径，传统的专用模型是针对特定任务，一个模型解决一个问题，比如ImageNet竞赛中涌现的分类模型，AlphaFold等等。

而通用模型旨在利用一个模型完成All任务，对应多种模态。比如GPT4通过Prompt实现。

书生浦语大模型开源历程：从2023年6月7日的InternLM，到2024年1月17日的InternLM2开源，实际上2024 年7月3日，已经发布了InternLM2.5，有3大亮点：

推理能力大幅提升，领先于国内外同量级开源模型，在部分维度上甚至超越十倍量级的 Llama3-70B；
支持 1M tokens 上下文，能够处理百万字长文；
具有强大的自主规划和工具调用能力，比如可以针对复杂问题，搜索上百个网页并进行整合分析。

Github仓库：https://github.com/InternLM/InternLM

InternLM2的体系：面向不同的使用需求，采用不同的规格，每个规格包括了3个模型版本。

从7B-20B，包括了Base、LM2和Chat版本。Base属于高质量、可塑性强的基准模型，适合在深度领域适配；LM2在多个能力方向强化，保持了很好的通用语言能力，更加推荐使用；Chat经过SFT、RLHF，面相对话交互进行了优化，具有很强的指令遵循、共情聊天和调用工具的能力。

回归语言建模的本质：采用新一代数据清洗过滤技术，包括多维度数据价值评估、高质量语料驱动的数据集和有针对的数据补齐。

主要亮点：

20W Token超长上下文
推理、数学和代码能力比肩GPT
精准指令遵循
可靠支持工具、复杂智能体搭建
强大的内生计算能力，加入了代码解释

性能全方面提升，比肩GPT3.5

使用例子：

工具调用能力升级

代码解释器可以求解一些积分等大学级别数学题目

从模型到应用典型流程

开放的高质量语料数据：书生万卷CC，基于互联网的开放内容，来源多样，安全性高

预训练优化工具，可以支持主流生态，开箱即用

微调Xtuner，增量续训和有监督的微调

最低8GB显存的显卡就可以微调

司南大模型评分体系

CompassRank：中立全面的性能榜单

评测工具链

部署工具：LMDeploy

全链条体系

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/51762.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

JavaScript字符串转换成base64编码方法

JavaScript字符串转换成base64编码方法

// base64编码表 const base64EncodeChars ref<string>("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789/" );/*** base64编码* param {Object} str*/ const base64encode (str: string) > {let result "";// 循环遍历字符串…

阅读更多...

银行贷款信用评分不足？大数据帮你找回失去的“分”

银行贷款信用评分不足？大数据帮你找回失去的“分”

在这个信息爆炸的时代，无论是个人还是企业，数据都成为了衡量信用和评估风险的重要依据。贷款、融资、求职甚至是日常消费，都可能因为一份好的数据报告而变得更加顺畅。那么，如何高效地查询自己的大数据，面对评分不足时…

阅读更多...

Typescript配置文件(tsconfig.json)详解系列五：allowArbitraryExtensions

Typescript配置文件(tsconfig.json)详解系列五：allowArbitraryExtensions

前言本文使用的Typescript版本为5.5.2 配置 {compilerOptions: {"allowArbitraryExtensions": true} }说明 allowArbitraryExtensions是typescript5.x后加入的字段，允许我们可以导入任何后缀名的文件。并且我们必须要有一个和这个文件配套的类型声明…

阅读更多...

【持续集成_02课_Jenkins+Git+Gogs综合应用】

【持续集成_02课_Jenkins+Git+Gogs综合应用】

https://www.cnblogs.com/xfeiyun/p/17510472.html Jenkins部署及持续集成——傻瓜式教程-腾讯云开发者社区-腾讯云一、Jenkins安装 Jenkins由Java语言编写而成，安装包即是一个war包。因此，Jenkins的运行启动依赖于Java环境，同时&#xf…

阅读更多...

G120 EPos配置方案及应用场景

G120 EPos配置方案及应用场景

EPos功能就是基本定位器功能，它可计算出轴的运行特性，使轴以时间最佳的方式移动到目标位置。EPos功能主要包括：设定值直接给定（MDI）功能、选择程序段功能、回参考点功能、点动功能、运行到固定挡块功能。 EPos功能通过处理给定的加速度、速度和位置值生成运行特性曲线，…

阅读更多...

正则采集器之四——采集网站管理

正则采集器之四——采集网站管理

本文介绍正则采集器的采集网站管理的开发。系统需要动态添加采集网站，对网站地址、名称、匹配商品的正则表达式字段进行设置。新建数据库表 CREATE TABLE item_website (id bigint NOT NULL AUTO_INCREMENT,code varchar(16) CHARACTER SET utf8mb4 COLLATE ut…

阅读更多...

springbootsecurity整合thymeleaf

springbootsecurity整合thymeleaf

首先创建一个springboot项目然后加入相关依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation&q…

阅读更多...

昇思 25 天学习打卡营第 15 天 | mindspore 实现 VisionTransformer 图像分类

昇思 25 天学习打卡营第 15 天 | mindspore 实现 VisionTransformer 图像分类

1. 背景： 使用 mindspore 学习神经网络，打卡第 15 天；主要内容也依据 mindspore 的学习记录。 2. Vision Transformer 介绍： mindspore 实现 VisionTransformer 图像分类；VisionTransformer 论文地址 VisionTransfo…

阅读更多...

深入分析MiniQMT实时订阅延迟测试代码

深入分析MiniQMT实时订阅延迟测试代码

摘要本文将深入分析两段MiniQMT平台的Python代码，这些代码用于测试实时数据订阅的延迟情况。我们将详细探讨代码的结构、关键功能以及它们在实时交易策略中的应用，并通过代码示例展示其工作原理。背景介绍 MiniQMT是一个量化交易平台，支…

阅读更多...

Redis是多线程还是单线程？

Redis是多线程还是单线程？

文章目录 1、用户态和内核态2、阻塞IO3、非阻塞IO4、IO多路复用4.1 select4.2 poll4.3 epoll4.4 epoll中的ET和LT4.5 epoll的服务端流程 5、信号驱动6、异步IO7、对比8、Redis是单线程的吗？9、单线程多线程网络模型变更 1、用户态和内核态 1、ubuntu和Centos 都是Li…

阅读更多...

KADB heap表VS AO表插入数据测试

KADB heap表VS AO表插入数据测试

单条插入数据准备： test# \d test Table "public.test" Column | Type | Modifiers ------------------------------------------ a | integer | b | character varying(20) | Distributed by: (a) test# in…

阅读更多...

day 02

day 02

作业： 1> 写一个日志文件，将程序启动后，每一秒的时间写入到文件中 1、2024- 7-29 10:31:19 2、2024- 7-29 10:31:20 3、2024- 7-29 10:31:21 ctrlc:停止程序 ./a.out 4、2024- 7-29 10:35:06 5、2024- 7-29 10:35:07 6、2024- 7-29 10:3…

阅读更多...

轻松入门Linux—CentOS,直接拿捏 —/— ＜2＞

轻松入门Linux—CentOS,直接拿捏 —/— ＜2＞

一、权限问题详细讲解读写的权限可以分别写成 r, w, x 总共有九个权限，可以分组三大组分别是： user：当前文件所属用户的权限 group：与当前文件所属用户同一组的用户权限 others：其他用户的权限故使用 u, g, o 来代表…

阅读更多...

从装机到冯·诺依曼架构，揭秘计算机的硬件组成

从装机到冯·诺依曼架构，揭秘计算机的硬件组成

在当今数字化的时代，计算机已经成为我们生活和工作中不可或缺的一部分。从日常办公到科学计算，从畅玩游戏到无人驾驶，计算机简直无所不能。而这一切的背后，离不开其精密而复杂的硬件组成。今天，我们将一起探索计算机的…

阅读更多...

Java中的异常总结

Java中的异常总结

异常的基本概念异常（Exception）：表示程序在执行过程中出现的错误或异常情况。异常通常表示程序的非正常状态，需要处理以防止程序崩溃。错误（Error）：表示虚拟机出现的严重问题，通常…

阅读更多...

Selenium Java中的isDisplayed()方法

Selenium Java中的isDisplayed()方法

isDisplayed（）方法用于确定元素是否可见。本文将详细讨论的WebElement接口isDisplayed（）方法。方法声明- boolean isDisplayed（）它能做什么？此方法用于判断元素是否显示。这个方法节省了我们…

阅读更多...

ora-01438

ora-01438

ORA-01438是Oracle数据库中的一个常见错误，它表示在尝试插入或更新数据库表时，某个列的值超出了该列定义所允许的精度范围。这通常发生在处理数值类型数据时，如NUMBER类型，其中精度指的是数值的总位数（包括整数部分和小…

阅读更多...

带有扰动观测器的MPC电机控制

带有扰动观测器的MPC电机控制

模型预测控制(Model Predictive Contro1, MPC)是一种先进的控制策略，虽然具有鲁棒性、建模简单、处理多变量系统、显示约束、预测未来行为和优化性能的能力等优势。它的不足在于预测控制行为的计算需要繁琐的计算量，以及抗干扰能力较弱。这里提出基于扰动…

阅读更多...

HDFS原理

HDFS原理

HDFS（Hadoop Distributed File System） HDFS——hadoop的分布式文件存储系统 HDFS原理19:49

阅读更多...

day24——homework

day24——homework

1> 写一个日志文件，将程序启动后，每一秒的时间写入到文件中 1、2024- 7-29 10:31:19 2、2024- 7-29 10:31:20 3、2024- 7-29 10:31:21 ctrlc:停止程序 ./a.out 4、2024- 7-29 10:35:06 5、2024- 7-29 10:35:07 6、2024- 7-29 10:35:08 #include <…

阅读更多...

最新文章