一、 LongWriter 简介
在自然语言处理领域,随着对长文本处理需求的不断增加,能够高效生成长文本的语言模型变得至关重要。LongWriter 的推出正是为了打破传统语言模型在生成超长文本时的限制。LongWriter-glm4-9b 是基于glm-4-9b进行训练的,可以一次生成 10,000 多个单词。这一突破性成果得益于其增强的模型架构和训练方法,它特别适用于需要生成长篇小说、学术论文、产品白皮书等长篇幅文本的任务。
二、模型搭建流程
基础环境最低要求说明:
环境名称 | 版本信息1 |
---|---|
Ubuntu | 22.04.4 LTS |
Cuda | V12.1.105 |
Python | 3.12 |
NVIDIA Corporation | RTX 3060 *2 |
1. 选择主机和镜像,一键创建实例
- 在租用实例页面,通过专业创建选择 2 张 RTX 3060 GPU
- 扩容数据盘(可选),然后进入应用社区
- 搜索并选择 LongWriter 大模型
- 创建实例
2. 进入网页端命令行
- 实例创建成功之后,点击“项目实例”再点击“WebShell”开启终端(小黑屏)
- 进入 WebShell 页面,运行后续的功能代码
3. 启动 web_demo.py 文件
# 切换到 LongWriter 项目工作目录
cd /LongWriter# 激活 LongWriter 虚拟环境
conda activate LongWriter运行 trans_web_demo.py 文件
python trans_web_demo.py
4. 获取端口号
- 第一次使用需要进行实名认证(通过实名认证可跳过此步骤)
- 实名认证之后进行开发对外端口
- 获取访问地址
5. 进入 web 页面
将获取到的链接复制到本地浏览器:
# 比如当前获取的地址如下:
http://hn-a.suanjiayun.com:30758
以上就是在算家云搭建 LongWriter 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。
点击算家云-应用社区,选择模型,一键开启 AI 之旅!