Datawhale AI冬令营 ——如何定制自己的专属大模型?

定制一个自己的专属大模型最方便的步骤 ≈ 指定数据集 + 开源大模型 + 微调平台(如讯飞星辰Maas)

内容很开门!very goo( ̄▽ ̄)d!

下面我将演示如何用讯飞星辰Maas平台+甄嬛数据集构建Chat-嬛嬛。


Step1:注册讯飞星辰Maas

点击打开官网

在这里插入图片描述
在这里插入图片描述

讯飞星辰Maas平台 是一个模型微调的零代码平台,旨在简化模型微调过程,无需一行代码即可定制大模型!


Step2:拿到数据集

点我下载甄嬛数据集

具体的数据集格式会在后面介绍。


Step3:定制专属嬛嬛大模型!

按照流程走即可

  1. 点击【创建模型】
    在这里插入图片描述

  2. 配置基础信息
    在这里插入图片描述

  3. 点击【创建数据集】
    在这里插入图片描述

  4. 配置数据集信息
    在这里插入图片描述

  5. 导入我们的嬛嬛数据集!
    在这里插入图片描述

  6. 提交任务!
    在这里插入图片描述
    在这里插入图片描述
    耐心等待即可,大概需要10分钟左右的时间。


Step4: 创建应用

训练完成后,

点击跳转,创建应用
在这里插入图片描述
在这里插入图片描述
然后回到这个页面,点击发布为服务:
在这里插入图片描述

在这里插入图片描述
等待一会儿即可发布成功。


Step5:体验AI嬛嬛!

发布成功后,即可进行体验啦!

  1. 点击【体验】
    在这里插入图片描述
  2. 选择之前的模型
    在这里插入图片描述
    在这里插入图片描述

到这里我们就完成了模型的定制,定制的模型具有以下优势:
在这里插入图片描述


数据集相关:

  • 微调的数据集是定制大模型的关键

“真正复杂的工作都是在 收集数据,处理数据上,这些才是影响最后效果的最大难点问题。”

我们常见的微调数据集需要符合 Alpaca格式 ,以我们使用的嬛嬛数据集为例,其样本如下:

{"instruction": "小姐,别的秀女都在求中选,唯有咱们小姐想被撂牌子,菩萨一定记得真真儿的——","input": "","output": "嘘——都说许愿说破是不灵的。"
}

字段说明 :
instruction:任务的指令,模型需要完成的具体操作,一般可以对应到用户输入的 Prompt 。
input:任务所需的输入内容。若任务是开放式的,或者不需要明确输入,可以为空字符串。
output:在给定指令和输入的情况下,模型需要生成的期望输出,也就是对应的正确结果或参考答案。

特点与应用 :结构简单清晰,易于理解和处理。它明确地将任务指令和输入内容分离开来,能够很好地适用于各种自然语言处理任务,像文本生成、翻译、总结等任务,尤其适合单轮的、以任务为导向的指令微调任务.

  • 两类数据集格式:

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/888979.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Pandas】pandas isna

Pandas2.2 General Top-level missing data 方法描述isna(obj)用于检测数据中的缺失值isnull(obj)用于检测数据中的缺失值notna(obj)用于检测数据中的非缺失值notnull(obj)用于检测数据中的非缺失值 pandas.isna() pandas.isna() 是 Pandas 库中的一个函数,用于…

STC单片机I2C驱动例程

STC单片机系列通常指的是由宏晶科技(Hangzhou Macro Crystal Technology Co., Ltd.)生产的8051内核的微控制器。这些单片机因其成本效益和易于使用而在嵌入式系统中广泛使用。对于I2C通信,STC单片机没有内置硬件I2C模块,因此需要通…

03_Webpack模块打包工具

03_Webpack模块打包工具 目录 知识点自测 以下哪个选项是 ECMAScript 默认导出和导入的语法? A:export 和 require B:module.exports {} 和 import 变量名 C:export default 和 import 变量名 D:export 和 import {…

使用WebStorm开发Vue3项目

记录一下使用WebStorm开发Vu3项目时的配置 现在WebStorm可以个人免费使用啦!?? 基本配置 打包工具:Vite 前端框架:ElementPlus 开发语言:Vue3、TypeScript、Sass 代码检查:ESLint、Prettier IDE:WebSt…

阿里云 云产品流转(实现设备与小程序交互)

一、准备工作 1、设备接入平台 创建两个设备接入到对应产品中,具体可以参考这里(点击跳转)。 二、云产品流转设置 在物联网平台下-->消息转发-->云产品流转->数据源 1、数据源 数据源-->创建数据源-->填写信息-->确定&…

如何使用 JavaScript 获取 URL 参数?

在 JavaScript 中,获取 URL 参数是非常常见的操作,尤其是在 Web 开发中,常常需要获取查询字符串(query string)中的参数值来控制页面展示或进行 API 请求等操作。 方法 1: 使用 URLSearchParams 对象 URLSearchParam…

SAFT(Synthetic Aperture Focusing Technique)基于合成孔径技术的图像重建方法

SAFT(Synthetic Aperture Focusing Technique)是一种基于合成孔径技术的图像重建方法,广泛应用于超声波成像、雷达成像等领域。它的核心思想是通过合成多个接收信号,模拟一个虚拟的更大孔径,从而提高成像系统的空间分辨率。与传统的成像方法相比,SAFT能够显著提高图像的质…

goLang之路(RSA加密算法)

RSA加密算法 RSA加密算法RSA之go与Java加解密算法对应关系签名算法对应关系密钥系列化与反序列化 生成密钥对密钥序列化为字符串(pkcs1标准不推荐再使用,而且Java标准库也不提供支持)密钥反序列化为密钥对象 留一个示例(Go与Java交…

鸿蒙ZRouter动态路由框架—NavDestnation页面模板化

前言 源码:https://gitee.com/common-apps/ZRouterOH:https://ohpm.openharmony.cn/#/cn/detail/hzw%2Fzrouter 基本使用 在介绍基本使用的流程中,我们知道每个子页面都需要通过NavDestination来包裹,这样会造成代码的冗余&…

【AIGC】如何获取ChatGPT外部GPTs应用的提示词Prompt指令和知识库文件

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: AIGC | GPTs应用实例 文章目录 💯前言💯获取GPTs的提示词Prompt指令💯获取GPTs的知识库文件💯小结 关于GPTs指令如何在ChatGPT上使用,请看这篇文章&#xff…

沐风老师3DMAX摄相机阵列插件使用方法

3DMAX摄相机阵列插件,从网格对象或样条线的顶点法线快速创建摄相机阵列。该插件从网格的顶点或样条线的节点获取每个摄影机的位置和方向。 3DMAX摄相机阵列插件支持目前3dMax主流的物理相机、标准相机、VRay物理相机。 【版本要求】 3dMax 2015及更高版本 【安装方…

BMC VPD格式定义

1.说明 目前遇到有2种格式的VPD定义方式,特记录并分享出来。 本节可参考链接下载文件: https://gitee.com/wit_yuan/fru 2.参考PCI_Express_Base_6.0a.pdf 应用范围: 例如常见的定制raid卡,Hba卡采用的储存serial number等。 3.参考platform-manag…

每日速记10道java面试题23-Spring篇+Springboot篇

其他资料 每日速记10道java面试题01-CSDN博客 每日速记10道java面试题02-CSDN博客 每日速记10道java面试题03-CSDN博客 每日速记10道java面试题04-CSDN博客 每日速记10道java面试题05-CSDN博客 每日速记10道java面试题06-CSDN博客 每日速记10道java面试题07-CSDN博客 每…

4K高清壁纸网站推荐

1. Awesome Wallpapers 官网: https://4kwallpapers.com/ 主题: 创意、摄影、人物、动漫、绘画、视觉 分辨率: 4K Awesome Wallpapers 提供了丰富的高质量图片,分为通用、动漫、人物三大类,可以按屏幕比例和分辨率检索,满足你对壁纸的各种…

小迪笔记 第四十五天 sql 注入进阶 :二次注入,堆叠注入,数据读取(load_file)加外带

二次注入 概念:就是我们注入的语句(刚注入时 不会产生影响)但是我们的恶意代码会进入数据库 他在被二次利用的时候就会进行执行 这个就是二次注入 这个的典型案例就是账号密码的修改 : 大家应该也知道 账号注册一般是禁止你使…

双向链表容器

C中的list是一个双向链表容器&#xff0c;用于存储一系列的元素。它提供了在任意位置插入和删除元素的能力&#xff0c;同时还支持随机访问。 在C中&#xff0c;list是由标准模板库&#xff08;STL&#xff09;提供的容器之一。它位于<list>头文件中&#xff0c;并且通过…

正则表达式去除文本中括号()<>[]里的内容

一行文本中包含有各种括号&#xff0c;如()、<>、[]&#xff0c;我们希望把括号及括号内的内容0去除&#xff0c;可以通过正则表达式来实现。 匹配() pattern r\([^)]*\) # 匹配()匹配一个左括号(&#xff0c;然后匹配0个或多个不是右括号的任意字符[^)]*&#xff0c…

单击后移动至标记

单击后移动至标记 点击生成的表单之后&#xff0c;会在地图上自动的移动到改运动锻炼的位置 如何实现 实现这个我们肯定需要点击事件&#xff0c;但是我们需要去选取一个监听的类&#xff0c;我们使用事件委托的方式来创建这个点击事件&#xff1b; 实际代码 创建点击事件 …

C# 中的异常处理:构建健壮和可靠的程序

C#中的异常处理&#xff08;Exception Handling&#xff09;。异常处理是编程中非常重要的一部分&#xff0c;它允许开发者优雅地处理程序运行时可能出现的错误或意外情况。通过有效的异常处理&#xff0c;可以使应用程序更加健壮、可靠&#xff0c;并提供更好的用户体验。以下…

C# 中?. 和 ??

在 C# 中&#xff0c;?. 和 ?? 是两个不同的操作符&#xff0c;它们用于处理可能为 null 的对象。让我们分别解释这两个操作符以及它们的组合使用&#xff1a; 1. 可空类型 (?) 在 C# 中&#xff0c;? 用于定义可空值类型&#xff08;Nullable Value Types&#xff09…