前面提到CPU版本如何安装和部署ChatGLM,虽然能部署,但是速度和GPU比起来确实一言难尽。
然后找阿里云白嫖了一个服务器(省点用的话,不用的时候关机,可以免费用两个多月没问题),只要没有申请过 PAI-DSW 资源的新老用户皆可申请 5000CU 的免费额度,3个月内使用。
阿里云免费试用活动页 点这里获取免费的GPU服务器
1、点击试用,完成注册、实名、领取产品后进入如下页面。
2、创建工作空间并授权。
3、授权完成,前往默认工作空间。
4、创建交互式建模(DWS)实例。
5、输入实例名称,GPU 选择 A10 或者 V100 都行,这俩是支持资源包抵扣的,其他的不支持,这里注意!V100 性能更好,但我们测试使用没必要,就选 A10 就行,A10 显卡每小时消耗6.991计算时,如果不关机持续使用大概可以使用30天。然后选择镜像,创建实例即可
选择镜像 URL,填入与地区对应的镜像地址。
杭州地域:dsw-registry-vpc.cn-hangzhou.cr.aliyuncs.com/cloud-dsw/eas-service:aigc-torch113-cu117-ubuntu22.04-v0.2.1_accelerated
北京地域:dsw-registry-vpc.cn-beijing.cr.aliyuncs.com/cloud-dsw/eas-service:aigc-torch113-cu117-ubuntu22.04-v0.2.1_accelerated
上海地域:dsw-registry-vpc.cn-shanghai.cr.aliyuncs.com/cloud-dsw/eas-service:aigc-torch113-cu117-ubuntu22.04-v0.2.1_accelerated
深圳地域:dsw-registry-vpc.cn-shenzhen.cr.aliyuncs.com/cloud-dsw/eas-service:aigc-torch113-cu117-ubuntu22.04-v0.2.1_accelerated
6、自己登陆服务器,部署模型即可