中国开源 AI 大模型之光-InternLM2

中国开源 AI 大模型之光-InternLM2

diannao/2025/4/26 16:10:08/文章来源:https://blog.csdn.net/yangguangqizhi/article/details/138922244

今天给大家带来 AI 大模型领域的国产之光 - InternLM2，在10B量级开源大模型领域取得了全球 Top 3 的成绩，仅次于 Meta 发布的 Llama-3，在国内则是第一名的存在！

简介

InternLM2是由上海人工智能实验室和商汤科技联合研发的一款大型语言模型（LLM），它在多个基准测试中展现出卓越的性能，尤其在长文本处理和开放式主观评估方面。以下是InternLM2的几个关键特点：

长文本处理能力：InternLM2特别设计了长上下文处理能力，能够处理长达200k个令牌的文本，这使得它在处理长篇幅内容时表现出色。
开源和免费商用：InternLM2模型及其全链条开源工具体系面向公众全面开源，并且可以免费商用，这促进了其在学术和工业界的广泛应用。
多阶段训练：模型的训练包括预训练、监督微调（SFT）和基于人类反馈的强化学习（RLHF）。这些阶段确保了模型在遵循指令和符合人类价值观方面的性能。
技术创新：InternLM2采用了分组查询注意力（GQA）技术来减少长序列推断时的内存占用，并通过位置编码外推技术进一步提升了模型的上下文长度处理能力。
性能提升：通过条件在线RLHF（COOL RLHF）技术，InternLM2能够协调多样但可能冲突的偏好，并通过多轮Proximal Policy Optimization（PPO）来减少奖励作弊问题。
社区贡献：InternLM2的贡献不仅在于其高性能，还在于提供了全面的数据准备指南和创新的RLHF训练技术，为社区提供了深入理解和进一步研究的基础。
模型规模：InternLM2发布了不同规模的模型，包括18亿、70亿和200亿参数的版本，以适应不同的研究和应用需求。

分类

按照模型大小分类

7B：为轻量级的研究和应用提供了一个轻便但性能不俗的模型

20B：模型的综合性能更为强劲，可有效支持更加复杂的使用场景

按照模型命名分类

InternLM2-Base：高质量和具有很强可塑性的模型基座，是模型进行深度领域适配的高质量起点

InternLM2：在Base基础上，在多个能力方向进行了强化，在评测中成绩优异，同时保持了很好的通用语言能力，是我们推荐的在大部分应用中考虑选用的优秀基座

InternLM2-Chat：在Base基础上，经过SFT和RLHF，面向对话交互进行了优化，具有很好的指令遵循，共情聊天和调用工具等能力

技术生态

训练&评测数据

模型微调

模型评测

模型部署

AI 智能体

接下来的文章将详细讲解如何用 internLM2 训练我们自己的 chatGPT，感兴趣的可以点赞收藏关注！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/12994.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

最大子序列的分数

最大子序列的分数

题目链接最大子序列的分数题目描述注意点 n nums1.length nums2.length从nums1和nums2中选一个长度为k的子序列对应的下标对nums1中下标对应元素求和，乘以nums2中下标对应元素的最小值得到子序列的分数0 < nums1[i], nums2[j] < 1000001 < k < …

阅读更多...

Leecode热题100---560：和为k的子数组个数

Leecode热题100---560：和为k的子数组个数

题目： 给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。 C： #include<iostream> #include<vector> using namespace std; class Solution { public:…

阅读更多...

AI作画算法详解：原理、应用与未来发展

AI作画算法详解：原理、应用与未来发展

随着人工智能技术的不断发展，AI作画逐渐成为了一个热门话题。AI作画，即利用人工智能算法生成绘画作品，不仅仅是技术的展示，更是艺术与科技结合的创新体现。本文将深入探讨AI作画的核心算法原理，并通过实例帮助读者更好…

阅读更多...

多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合

多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合

● 环境框架：python 3.9 pytorch 1.8 及其以上版本均可运行 ● 使用对象：论文需求、毕业设计需求者 ● 代码保证：代码注释详细、即拿即可跑通。往期精彩内容： 时序预测：LSTM、ARIMA、Holt-Winters、SARIMA模型的分…

阅读更多...

数据结构篇3—《龙门客“栈”》

数据结构篇3—《龙门客“栈”》

文章目录 🚩前言1、栈的概念2、栈的实现框架3、栈的代码实现3.1、栈的初始化和销毁3.2、入栈\出栈\返回栈顶元素\元素个数\判空3.3、栈定义注意事项 4、栈的应用实例——《括号匹配问题》 🚩前言前面记录了关于顺序表和链表的数据结构，这一篇…

阅读更多...

【CF1965A】Everything Nim

【CF1965A】Everything Nim

题目链接前置trick： 使用vector去重： vector<int> a(n);for(int i0;i<n;i) cin>>a[i];sort(a.begin(),a.end());a.erase(unique(a.begin(),a.end()),a.end());na.size();题意： 有 n n n堆石子，第 i i i堆有 a i a…

阅读更多...

【企业宣传片】拍摄思维提升，专业影视质感核心揭密，一课搞定

【企业宣传片】拍摄思维提升，专业影视质感核心揭密，一课搞定

课程下载：【企业宣传片】拍摄-课程网盘链接提取码下载.txt资源-CSDN文库更多资源下载：关注我。课程介绍大量案例分析宣传片拍摄的痛点要点根据案例告诉你解决方案，讲透概念改变你对企业宣传片的思维层级与认知归纳总结对比不同案…

阅读更多...

C++语法｜类直接包含与自身类型相同的成员变量？

C++语法｜类直接包含与自身类型相同的成员变量？

在C中，一个类不能直接包含与自身类型相同的成员变量。这是因为类的大小需要在编译时确定，而一个包含自身类型的成员变量会导致递归定义，从而无法确定类的大小。文章目录示例代码（非法定义）解决办法1.使用指针2.使用智…

阅读更多...

k8s 二进制安装优化架构之部署负载均衡，加入master02

k8s 二进制安装优化架构之部署负载均衡，加入master02

目录一实验环境二部署 CoreDNS 1，所有node加载coredns.tar 镜像 2，在 master01 节点部署 CoreDNS 3， DNS 解析测试 4， 报错分析 5，重新 DNS 解析测试三 master02 节点部署 1&#xff0…

阅读更多...

AI学习指南数学工具篇-PCA的应用场景

AI学习指南数学工具篇-PCA的应用场景

AI学习指南数学工具篇-PCA的应用场景在人工智能领域，数据处理是非常重要的一环。对于大量高维数据，我们往往需要进行数据降维来减少计算复杂度，同时利用可视化工具对数据进行分析和理解。主成分分析（Principal Component Analys…

阅读更多...

C++ 利用标准库多字节转宽字节字符

C++ 利用标准库多字节转宽字节字符

在 C/C 之中，通常建议使用：mbstowcs （C语言函数库）来实现多字节字符转宽字节字符，这是因为如果使用。 std::wstring_convert<std::codecvt_utf8<wchar_t>> 模板来实现，它可能导致程序崩溃的风险…

阅读更多...

【利用数组处理批量数据-谭浩强配套】（适合专升本、考研）

【利用数组处理批量数据-谭浩强配套】（适合专升本、考研）

无偿分享学习资料，需要的小伙伴评论区或私信dd。。。无偿分享学习资料，需要的小伙伴评论区或私信dd。。。无偿分享学习资料，需要的小伙伴评论区或私信dd。。。完整资料如下：纯干货、纯干货、纯干货！！…

阅读更多...

点云成图原理

点云成图原理

点成图（Point Cloud）是指由一组离散的点构成的图形，它们在空间中没有任何连接关系。点成图通常是由激光雷达、相机或其他传感器获取的三维数据，用于表示现实世界中的物体或场景。三角成图（Triangulation）…

阅读更多...

element ui Tree树形控件

element ui Tree树形控件

lazy 是否懒加载子节点，需与 load 方法结合使用 boolean 默认为falseload 加载子树数据的方法，仅当 lazy 属性为true 时生效 function(node, resolve)使用懒加载load不需要再使用data，利用resolve返回值即可注意：第一层的数据要写…

阅读更多...

PMR-440N7Q韩国施耐德三和相序继电器EOCR-PMR

PMR-440N7Q韩国施耐德三和相序继电器EOCR-PMR

韩国施耐德三和EOCR继电器PMR-440N7Q PMR-440-N 直流电动机保护器:DCL、DOCR-S/H 欠电流继电器:EUCR-3C 交流电压继电器:EOVR、EVR-PD、EVR-FD、EUVR 韩国三和EOCR电动机保护器:EOCR-SS、EOCR-SS1/SS2、EOCR-AR、EOCR-ST、EOCR-SP、EOCR-SP1/SP2、EOCR-SE、EOCR-SE2/SE PMR-44…

阅读更多...

GIT基础02 多机器协作等命令

GIT基础02 多机器协作等命令

前言首先我们知道git给我们提供了分支管理的功能我们一般使用master分支作为线上环境,master分支一般是一个稳定的分支我们通常是会创建一个其他分支进行开发,这样不会影响线上的机器运行如果没有git提供这样的分支功能,就无法做到这一套了指令学习假设软件出现问题咋办…

阅读更多...

LBSS138LT1G 丝印J1 SOT-23 N沟道 50V/200mA 贴片MOSFET

LBSS138LT1G 丝印J1 SOT-23 N沟道 50V/200mA 贴片MOSFET

LBSS138LT1G的应用领域广泛，主要因为它是一种N沟道金属氧化物半导体场效应晶体管（MOSFET），具有低电荷、快速开关速度和高阻断特性。以下是一些典型的应用领域： 1. 消费电子产品：LBSS138LT1G常用于电视、音响…

阅读更多...

debian apt 更改阿里源

debian apt 更改阿里源

1. 备份文件 cp /etc/apt/sources.list /etc/apt/sources.list.bak 2. 更改 sources.list文件内容为： deb http://mirrors.aliyun.com/debian/ buster main non-free contrib deb-src http://mirrors.aliyun.com/debian/ buster main non-free contrib deb htt…

阅读更多...

QT状态机1-三态循环状态机

QT状态机1-三态循环状态机

#include "MainWindow.h" #include "ui_MainWindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent)

阅读更多...

【C -＞ Cpp】由C迈向Cpp （6）：静态、友元和内部类

【C -＞ Cpp】由C迈向Cpp （6）：静态、友元和内部类

标题：【C -＞ Cpp】由C迈向Cpp （6）：静态、友元和内部类水墨不写bug （图片来源于网络） 目录 （一）静态成员 （二）友元 （三&#xff09…

阅读更多...

最新文章