《英伟达-本地AI》--NVIDIA Chat with RTX-本机部署

《英伟达-本地AI》--NVIDIA Chat with RTX-本机部署

news/2025/4/28 6:58:23/文章来源:https://blog.csdn.net/weixin_72186894/article/details/136169507

阿丹：

突然发现公司给配置的电脑是NVIDIA RTX 4060的显卡，这不搞一搞本地部署的大模型玩一玩？？？

从0-》1记录一下本地部署的全过程。

本地模型下载地址：

Build a Custom LLM with Chat With RTX | NVIDIA

GitHub上的开发者下载地址：

GitHub - NVIDIA/trt-llm-rag-windows: A developer reference project for creating Retrieval Augmented Generation (RAG) chatbots on Windows using TensorRT-LLM

下载的文件有32个G！！
开始安装：

为了方便观看我直接放翻译的版本：（跟着红色箭头就可以了）

安装许可：

这个应该是选择安装的功能：

选择安装的位置：

开始安装：（这个下载的过程需要使用科学的上网环境！）

然后开始漫长的等待安装。。。。。。

点击完成：

双击第一次会开始下载数据也是一些依赖

这些依赖下载完毕就欧克了。

会自己将网页打开。

但是在本地访问的时候出现了一些问题。

要注意的是。在本地运行的时候需要开启科学的上网环境。

下个文章我会重点解决和汇总一下我在安装的时候出现的问题。集中一起解决。

部署问题解决文章：

《英伟达-本地AI》--NVIDIA Chat with RTX--部署问题：ValueError: When localhost is not accessible-CSDN博客

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/693807.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

虚拟机安装Centos7迷你版

虚拟机安装Centos7迷你版

虚拟机安装Centos7迷你版迷你版较常规版精简了很多功能，所以体积也小了很多，喜欢自定义安装的可以选择迷你版参考文章： VirtualBox虚拟机安装Centos7详细教程图解网卡配置参考文章下载Centos迷你版镜像安装镜像下载镜像阿里云Cen…

阅读更多...

Python 安装和使用的IDE

Python 安装和使用的IDE

安装安装 Anaconda (包较大), 包含了一些库安装 Miniconda (包较小) 只和 python 打包, 没有其他的包, 用的时候需要自己安装 conda install pandaspython pythonipython 有更多的功能 ipythonjupyter jupyter notebookjupyterlab 可以去 github 查看 conda install -c…

阅读更多...

理论学习-ARM-内核

理论学习-ARM-内核

ARM内核函数的调用加载、存储计算中断异常线程的切换为了提高学习效率，我们要提前想好学习策略。首先，使用频率越高的知识点，越要首先学习。假使，我们学习了一个知识点，能覆盖工作中80%的工作量，那是不是…

阅读更多...

机器学习基础（四）非监督学习的进阶探索

机器学习基础（四）非监督学习的进阶探索

导语：上一节我们详细探索监督学习的进阶应用，详情可见： 机器学习基础（三）监督学习的进阶探索-CSDN博客文章浏览阅读296次，点赞13次，收藏11次。监督学习作为机器学习的一个主要分支，…

阅读更多...

【C++】vector模拟实现+迭代器失效

【C++】vector模拟实现+迭代器失效

vector模拟实现成员变量定义默认成员函数构造函数迭代器范围for、对象类型匹配原则容量操作sizeemptycapacityreserve成员变量未更新memcpy值拷贝 resize内置类型的构造函数数据访问frontbackoperator[ ] 数据修改操作push_backpop_backswapclearinsertpos位置未更新无返回…

阅读更多...

解决缓存失效导致的数据库压力问题（缓存击穿问题）

解决缓存失效导致的数据库压力问题（缓存击穿问题）

问题描述在软件开发过程中，特别是在使用缓存策略优化数据访问性能时，经常会遇到缓存失效引发的问题。具体来说，在一个服务类BaseDataService中，findData方法负责从数据库拉取数据并缓存。这里使用了expireAfterWrite60s的缓存策…

阅读更多...

【Linux】Linux调试器-gdb使用

【Linux】Linux调试器-gdb使用

1. 背景程序的发布方式有两种，debug模式和release模式 Linux gcc/g出来的二进制程序，默认是release模式要使用gdb调试，必须在源代码生成二进制程序的时候, 加上 -g 选项 2. 开始使用 gdb binFile 退出： ctrl d 或 quit 调…

阅读更多...

新建一个flask项目

新建一个flask项目

在Flask中创建一个新的项目，您可以遵循以下步骤： 确保您已经安装了Python环境。如果还未安装Flask，可以通过pip来安装： pip install flask创建一个新的文件夹作为您的项目文件夹，例如myflaskapp： mkdir …

阅读更多...

Java 学习和实践笔记（15）：面向过程和面象对象其实很简单！

Java 学习和实践笔记（15）：面向过程和面象对象其实很简单！

学完这一节，才真正明白了什么叫面向对象和面向过程，其实很简单~ 第一个例子：怎样把大象装进冰箱这个很清楚很容易地可以列出第一步。第二个例子：怎样制造一台汽车这个就很难确定哪一步做第一步。面向过程和面向对象的区别 …

阅读更多...

echarts折线图单位为Bit/s的数据展示

echarts折线图单位为Bit/s的数据展示

需求：单位为Bit/s的数据需要换算y轴、legend和tooltip的单位； 显示数据时需要换算单位是因为数据以比特每秒（Bit/s）的形式返回，但是在实际展示中，可能更方便和易读的是使用其他单位，例如Gb/s、M…

阅读更多...

8 磁盘存储器的管理

8 磁盘存储器的管理

外存的组织方式连续组织方式：为每一个文件分配一组相邻接的盘块链接组织方式：多个不连续的盘块链接指针隐式链接显示链接：文件分配表FAT FAT技术： FAT12（512B）、以簇为单位的FAT12文件系统、FAT16、…

阅读更多...

笔记：torch.roll

笔记：torch.roll

最近在准备写 swin transformer 的文章，记录下 torch.roll 的用法： >>> x torch.tensor([1, 2, 3, 4, 5, 6, 7, 8]).view(4, 2) >>> x tensor([[1, 2],[3, 4],[5, 6],[7, 8]]) 第0维度向下移1位，多出的[7,8]补充到顶部 &g…

阅读更多...

【移动开发】iOS平台 Java编译器 Jedona Compiler 评测

【移动开发】iOS平台 Java编译器 Jedona Compiler 评测

上期编译器评测链接： Java Compiler IDE评测一、使用平台该编译器（Jedona Compiler）在苹果应用市场App Store中下载，笔者使用iPad进行Java代码编写。应用市场界面： 二、开发界面介绍开发界面比较简洁&#xf…

阅读更多...

【JGit 】简述及学习资料整理

【JGit 】简述及学习资料整理

JGit 介绍 [官网](JGit | The Eclipse Foundation): https://www.eclipse.org/jgit/ 用户指南 : https://github.com/eclipse-jgit/jgit/wiki/User-Guide JGit是一个用于Java编程语言的开源Git实现。它提供了一组Java库和API，使开发人员可以在他们的Java应用程序…

阅读更多...

python 与 neo4j 交互（py2neo 使用）

python 与 neo4j 交互（py2neo 使用）

参考自：neo4j的python.py2neo操作入门官方文档：The Py2neo Handbook — py2neo 2021.1 安装：pip install py2neo -i https://pypi.tuna.tsinghua.edu.cn/simple 1 节点 / 关系 / 属性 / 路径节点(Node)和关系(relationship)是构成图的基础…

阅读更多...

重磅！移远通信正式发布一站式XR产品解决方案，助力探索数字世界新纪元

重磅！移远通信正式发布一站式XR产品解决方案，助力探索数字世界新纪元

伴随着以5G、大数据、云计算等现代化信息科技的发展，人类对数字世界、智慧地球的探索更加深入。尤其是以XR（扩展现实）为代表的技术崛起，更让物理世界与虚拟世界中的连接愈发紧密，千行百业也亟待新探索。近日&#xff…

阅读更多...

计算机组成原理（4）-----Cache的原理及相关知识点

计算机组成原理（4）-----Cache的原理及相关知识点

目录 1.Cache的原理 2.Cache的性能 3.Cache和主存的映射方式 （1）全相联映射 （2）直接映射 （3）组相联映射 4.替换算法 (1)随机算法(RAND) (2)先进先出算法(FIFO) (3)近期最少使用(LRU) (4)最近不经…

阅读更多...

论文阅读：How Do Neural Networks See Depth in Single Images?

论文阅读：How Do Neural Networks See Depth in Single Images?

是由Technische Universiteit Delft(代尔夫特理工大学)发表于ICCV,2019。这篇文章的研究内容很有趣,没有关注如何提升深度网络的性能，而是关注单目深度估计的工作机理。 What they find？ 所有的网络都忽略了物体的实际大小，而关注他们的垂直…

阅读更多...

使用 openssl 进行哈希计算

使用 openssl 进行哈希计算

版本：OpenSSL 3.0.2 15 Mar 2022 (Library: OpenSSL 3.0.2 15 Mar 2022) SHAx 系列如果对象完全存储在内存中，可以使用以下函数： #include <openssl/sha.h>unsigned char *SHA1(const unsigned char *data, size_t count, unsigned…

阅读更多...

C#_WaitAll、WhenAll、async及await

C#_WaitAll、WhenAll、async及await

Task.WhenAll、Task.WaitAll Task.WhenAll 和 Task.WaitAll 都是用于等待多个任务完成的方法，但它们之间有一些重要的区别。返回类型: Task.WhenAll: 返回一个 Task 对象，该对象表示所有输入任务的联合任务。 Task.WaitAll: 没有返回值。它是一个同步方…

阅读更多...

最新文章