公共资源速递
This Weekly Snapshots !
3 个数据集:
* PKU 简体中文分词数据集
* 1,823 张花卉图像数据集
* PAWS-X :用于释义识别的跨语言对抗数据集
1 个模型:
* Yi-34B-Chat-4bits
2 个教程:
* 通义千问 14B Chat Int4 模型 Gradio Demo
* 在 OpenBayes 运行通义千问 Qwen-1.8B-Chat 模型并进行微调
访问官网立即使用:openbayes.com
公共数据集
1. PKU 简体中文分词数据集
SIGHAN 2005 数据集由国际中文自动分词评测(简称 SIGHAN 评测)整合了多个机构的分词数据集构成。该数据集由中国微软研究所、北京大学、香港城市大学、台湾中央研究院联合发布,用以进行中文分词模型的训练与评测。其中 PKU 为简体中文分词数据集。
* 直接使用:https://reurl.cc/2zApgn
2. 1,823 张花卉图像数据集
该数据集包含 1,823 张蒲公英和雏菊花等多种花卉品种的图像,可以用于分类检测任务。
* 直接使用:https://reurl.cc/rrbMgx
3.PAWS-X :用于释义识别的跨语言对抗数据集
该数据集包含 23,659 个人工翻译的 PAWS 评估对和 296,406 个机器翻译的训练对,采用了六种类型不同的语言:法语、西班牙语、德语、中文、日语和韩语。所有翻译对均源自 PAWS-Wiki 中的示例。
* 直接使用:https://reurl.cc/qrbQ1y
公共模型
1. Yi-34B-Chat-4bits
「Yi-34B-Chat」是零一万物开源的大语言模型。本模型是「Yi-34B-Chat」的 4bits 量化版本,该版本可以直接在 RTX 3090 等消费级显卡上使用。
* 直接使用:https://reurl.cc/zlGxO0
公共教程
1. 通义千问 1.8B Chat API FT Demo
本教程主要演示了在 OpenBayes 平台运行「通义千问 Qwen-1.8B-Chat 模型」并进行微调的具体流程。
* 一键克隆:https://reurl.cc/4jDZGK
2. 通义千问 14B Chat Int4 模型 Gradio Demo
本教程主要演示了如何在 OpenBayes 上运行「通义千问 14B Chat」的 Int4 量化模型。
* 一键克隆:https://reurl.cc/bDb0oX
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!
更多详细教程,请观看:
【OpenBayes 官方教程】计算资源介绍_哔哩哔哩_bilibili