丹摩征文活动|基于丹摩算力Llama3.1实现私有化部署的Chatbot

一、简介

Llama 3.1 模型介绍

Llama 3.1 是一种大型的、开源的语言生成模型,类似于OpenAI的GPT-3,但它是由Meta(前Facebook)推出的。Llama 3.1具备强大的自然语言处理能力,可以执行各种语言任务,如对话生成、文本摘要、机器翻译等。Llama 3.1 设计之初就是为了使其在各种硬件和资源环境下高效运行,因此其能够通过优化模型架构,在不同规模的设备上实现较好的性能。

私有化部署的优势

私有化部署指的是将Chatbot部署在自己的服务器或者私有云环境中,而非依赖第三方服务(如OpenAI、Google Cloud等)。这样做有几个显著的优势:

1.数据隐私和安全性:企业或用户的数据不会离开本地系统,避免了将敏感数据暴露给外部服务提供商的风险。
2.定制化能力:用户可以根据特定业务需求对Chatbot进行更高层次的定制,包括训练专门的模型、调整对话策略等。
3.降低长期成本:虽然初期部署可能需要较高的基础设施投资,但长期来看,私有化部署可避免按调用次数收费的云服务费用。
4.可控性:企业拥有对整个系统的完全控制,能够随时进行优化和调整,而不依赖于第三方平台的更新和维护。

应用场景

基于 Llama 3.1 和丹摩算力的私有化部署 Chatbot 可应用于多个领域:

企业客服:通过自动化解答客户问题,提高服务效率,减少人工成本。
智能助手:提供个性化的智能助手服务,帮助用户完成日常任务。
教育与培训:为学生提供智能辅导,支持实时问答与互动式学习。
医疗健康:通过与医疗数据对接,提供初步的健康咨询服务。

三、部署 Llama 3.1

1. 创建实例

在这里插入图片描述
由于 CogVideoX 在 FP-16 精度下的推理至少需 18GB 显存,微调则需要 40GB 显存,我们这里需要选择大于 40GB 显存的实例。
在这里插入图片描述
镜像选择 PyTorch2.3.0、Ubuntu-22.04,CUDA12.1 镜像。
在这里插入图片描述
创建密钥对
进行实例
在这里插入图片描述
点击操作里的JupyterLab,进入JupyterLab的页面。平台已预置了调试好的代码库,开箱即用。

在这里插入图片描述
点击Terminal,进入终端页面

2. 安装依赖

安装 Llama 3.1 部署所需的 Python 库:

pip install langchain==0.1.15
pip install streamlit==1.36.0
pip install transformers==4.44.0
pip install accelerate==0.32.1

在这里插入图片描述

3. 下载模型

用丹摩平台的内网高速下载 Llama-3.1-8B-Instruct 模型:

wget http://file.s3/damodel-openfile/Llama3/Llama-3.1-8B-Instruct.tar
tar -xf Llama-3.1-8B-Instruct.tar

在这里插入图片描述

四、Chatbot 项目开发

  1. 编写Web聊天机器人代码
    创建 llamaBot.py 文件,实现一个简单的 Web 聊天机器人:
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import streamlit as st# 创建标题和副标题
st.title("💬 LLaMA3.1 Chatbot")
st.caption("🚀 A Streamlit chatbot powered by Llama 3.1")# 模型路径
model_path = '/root/workspace/Llama-3.1-8B-Instruct'# 获取模型和 tokenizer
@st.cache_resource
def load_model():tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)tokenizer.pad_token = tokenizer.eos_tokenmodel = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.bfloat16).cuda()return tokenizer, modeltokenizer, model = load_model()# 初始化会话状态
if "messages" not in st.session_state:st.session_state["messages"] = []# 显示历史消息
for msg in st.session_state["messages"]:st.chat_message(msg["role"]).write(msg["content"])# 处理用户输入
if prompt := st.chat_input():st.chat_message("user").write(prompt)st.session_state.messages.append({"role": "user", "content": prompt})# 生成模型回复input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to('cuda')output = model.generate(input_ids, max_new_tokens=512)response = tokenizer.decode(output[0], skip_special_tokens=True)st.session_state.messages.append({"role": "assistant", "content": response})st.chat_message("assistant").write(response)

在这里插入图片描述

2. 运行 Streamlit 服务

在终端中启动 Web 服务:

streamlit run llamaBot.py --server.address 0.0.0.0 --server.port 1024

在这里插入图片描述
需注意:

访问地址:务必使用 0.0.0.0,以便通过浏览器访问实例。
端口映射:通过丹摩平台的访问控制,将内部端口映射至公网。

3. 添加端口映射

进入 GPU 云实例页面,选择操作 -> 更多 -> 访问控制,添加 Streamlit 服务端口,映射成功后即可通过访问链接打开 Chatbot 界面。
在这里插入图片描述

五、效果展示

访问1024的端口链接,可见 Llama 3.1 Chatbot 的交互界面,用户可以直接输入问题,与 Chatbot 进行对话。

示例对话:

用户:请简述 Llama 3.1 的主要特性。
Chatbot:Llama 3.1 是 Meta 发布的最新开源模型,包含 405B、70B 和 8B 三个版本,支持 128K 上下文长度,具备更强的理解和生成能力。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/887247.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ssm168基于jsp的实验室考勤管理系统网页的设计与实现+jsp(论文+源码)_kaic

毕 业 设 计(论 文) 题目:实验室考勤管理系统设计与实现 摘 要 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本实验室考勤管…

(动画)Qt控件 QLCDNumer

文章目录 LCD Number1. 介绍2. 核心属性3 . 代码实现:倒计时1. 在界⾯上创建⼀个 QLCDNumber , 初始值设为 10.2. 修改 widget.h 代码, 创建⼀个 QTimer 成员, 和⼀个 updateTime 函数3. 修改 widget.cpp, 在构造函数中初始化 QTimer4. 修改 widget.cpp, 实现 updateTime 4. 动…

session理解

一、术语session   session:中文经常翻译为 ‘会话’,其本来的含义是指有始有终的一系列动作/消息,比如:打电话时从拿起电话拨号到挂断电话这中间的一系列过程可以称为一个session。在阅读技术书籍时我们可能会看到这样的话“在…

Java集合分页

一、前言 在Java开发中,若单次展示的数据量太大,会造成程序响应缓慢,就需要用到分页功能,每一页展示一定量的数据,分多次展示 ... 那么在List集合中,如何实现分页功能呢? 本文将以3种方式&…

【线程】Java多线程编程

【线程】Java多线程编程 一、前言一个最简单的多线程编程示例可以使用的工具 二、创建线程的方式三、Thread类中重要的属性和方法3.1 构造方法3.2 常见属性 一、前言 当有多个线程的时候,这些线程的执行顺序是不确定的。这一点,是我们之前提到的操作系统…

IP转发流程

IP 转发是网络通信中通过中间设备(如路由器或启用了转发功能的主机)将接收到的 IP 数据包根据路由表的指引发送到目标网络的过程。以下是 IP 转发的详细流程及转发过程中各个环节的说明: IP 转发的流程详解 数据包到达路由器或主机&#xff…

Java技术复习提升 11 常用类

第11章 常用类 1 包装类 不同包装类都继承自Object类 Serialiazble接口表示该类表示序列化 Comparable接口用于定义自然顺序 包装类和基本数据的转换 jdk5之前手动装箱拆箱 jdk5之后自动装箱拆箱 自动装箱底层调用的是valueof方法 拆箱仍然是intvalue方法 public class Inte…

P1 练习卷(C++4道题)

1.纷繁世界 内存限制:256MB 时间限制:1s 问题描述 这是一个纷繁复杂的世界。 某一天清晨你起床很迟,没有吃上早饭。于是你骑着自行车去超市,但是你又发现商店的工作人员已经重新贴上了价格标签,零食价格都涨了50%。你…

STL之哈希

STL之哈希 unordered_set/map&哈希之介绍unordered系列哈希哈希表的模拟实现 unordered_set&/map的模拟实现哈希的应用位图(bitmap/bitset)布隆过滤器(Bloom Filter)海量数据处理 unordered_set/map&哈希之介绍 unor…

Selenium的八种定位方式

1. 通过 ID 定位 ID 是最直接和高效的方式来定位元素,因为每个页面中的 ID 应该是唯一的。 from selenium import webdriverdriver webdriver.Chrome(executable_pathpath/to/chromedriver) driver.get(https://example.com)# 通过 ID 定位 element driver.find…

logback动态获取nacos配置

文章目录 前言一、整体思路二、使用bootstrap.yml三、增加环境变量四、pom文件五、logback-spring.xml更改总结 前言 主要是logback动态获取nacos的配置信息,结尾完整代码 项目springcloudnacosplumelog,使用的时候、特别是部署的时候,需要改环境&#…

AwsCredentialsProvider认证接口

一、介绍 1、简介 AwsCredentialsProvider 是 AWS SDK 中用于提供 AWS 身份验证凭证的一个接口。AWS SDK 中涉及身份验证和授权的操作都需要用到凭证,而 AwsCredentialsProvider 作为一种抽象,负责提供这些凭证。AwsCredentialsProvider 在 Java SDK 中尤为重要,它可以用于…

OpenMM的安装与使用

技术背景 OpenMM是一款基于Python开发的开源分子动力学模拟软件,这几年因为AlphaFold的缘故,使得这个软件的热度有了不少提升。并且可以使用GPU硬件加速,所以性能上也不赖。这里介绍一下该软件的基本安装和使用方法,并附带一个真空…

R语言p值矫正整的方法

在 R 语言中&#xff0c;P 值的校正常用于控制多重假设检验中的错误率。以下是常用的 P 值校正方法及其实现方式&#xff1a; 1. p.adjust函数 R 提供了内置的 p.adjust 函数&#xff0c;支持多种校正方法&#xff1a; # 示例数据 p_values <- c(0.01, 0.02, 0.03, 0.04,…

Linux各种并发服务器优缺点

本文旨在介绍针对“无并发C/S模型”改进的方法总结以及各种改进方法的优缺点&#xff0c;具体函数的实现并不介绍。 1. 无并发C/S模型 创建服务器流程分析&#xff1a; socket()创建服务器的监听套接字bind()将服务器给服务器的监听套接字绑定IP地址和Port端口号listen()设置…

项目:从CSV文件中删除标题行

一、项目内容 打开当前工作目录中所有扩展名为.csv的文件&#xff0c;读取CSV文件的内容&#xff0c;并除掉第一行的内容以重新写入同名的文件。 二、代码分析 循环遍历从os.listdir()得到的文件列表&#xff0c;跳过非CSV文件。创建一个CSV reader对象来读取该文件的内容&a…

cookie反爬----普通服务器,阿里系

目录 一.常见COOKIE反爬 普通&#xff1a; 1. 简介 2. 加密原理 二.实战案例 1. 服务器响应cookie信息 1. 逆向目标 2. 逆向分析 2. 阿里系cookie逆向 1. 逆向目标 2. 逆向分析 实战&#xff1a; 无限debugger原理 1. Function("debugger").call() 2. …

网络无人值守批量装机-cobbler

网络无人值守批量装机-cobbler 一、cobbler简介 ​ 上一节中的pxe+kickstart已经可以解决网络批量装机的问题了,但是环境配置过于复杂,而且仅针对某一个版本的操作系统进批量安装则无法满足目前复杂环境的部署需求。 ​ 本小节所讲的cobbler则是基于pxe+kickstart技术的二…

推荐一款开源电子书阅读器Koodo Reader

Koodo Reader 是一个开源的电子书阅读器&#xff0c;支持多达15种主流电子书格式&#xff0c; 内置笔记、高亮、翻译功能&#xff0c;助力高效书籍阅读和学习。 官网地址&#xff1a;https://www.koodoreader.com/zh 一、下载软件 下载地址&#xff1a;https://dl.koodoreader.…

如何理解JS的 异步

JS是一门单线程的语言&#xff0c;这是因为它运行在浏览器的渲染主线程中&#xff0c;而渲染主线程只有一个。 而渲染主线程承担着诸多的工作&#xff0c;渲染页面、执行JS都在其中运行。 如果使用同步的方式&#xff0c;就极有可能导致主线程产生阻塞&#xff0c;从而导致消…