Nvidia 携手 RTX 推出的本地运行 AI 聊天机器人

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

Nvidia 今天推出了 Chat with RTX 的早期版本,这是一个演示应用程序,允许你在个人电脑上运行一个私人 AI 聊天机器人。你可以向它提供 YouTube 视频和你自己的文档,以创建摘要和基于你自己的数据获取相关答案。这一切都在个人电脑上本地运行,你所需要的只是一块至少拥有 8GB VRAM 的 RTX 30 或 40 系列 GPU。

我在过去的一天里对 Chat with RTX 进行了简短的测试,尽管这个应用程序还有点粗糙,但我已经可以看到这将成为数据研究的有价值部分,特别是对于需要分析一系列文档的记者或任何人来说。

Chat with RTX 能够处理 YouTube 视频,所以你只需输入一个 URL,它就会让你搜索特定提及的字幕或总结整个视频。我发现这对于搜索视频播客非常理想,特别是在寻找过去一周关于微软新 Xbox 策略转变的传言中的特定提及时。

然而,搜索 YouTube 视频并不是完美的。我尝试搜索一段 The Verge YouTube 视频的字幕,但 Chat with RTX 下载了一个完全不同视频的字幕。这甚至不是我之前查询过的视频,所以在这个早期演示中显然存在漏洞。

Chat with RTX 在搜索你本地的文档方面表现出色。当它正常工作时,我能够在几秒内找到视频中的参考内容。我还为 Chat with RTX 创建了一个 FTC 诉微软文档的数据集进行分析。当我去年覆盖这个法庭案件时,快速搜索文档经常让人感到不堪重负,但 Chat with RTX 帮助我几乎立即在我的电脑上查询它们。

例如,聊天机器人很好地总结了在审判中揭示的微软整个 Xbox Game Pass 策略:

根据提供的上下文信息,Xbox Game Pass 是一项游戏内容订阅服务,它提供单一月费访问游戏库的权限。它被视为一个能让玩家在任何地方玩他们的游戏,并允许发布商在各处触达玩家的平台。该服务由 Project xCloud 和 Xbox Series X 支持,旨在为发布商创造一个利润丰厚的游戏环境。游戏 CSA 的主要战略目标是扩大 Xbox Game Pass 的规模,认为全球有着高达 7.5 亿的订阅者机会。该服务面临三个主要的内容动态,包括需要差异化的内容、扩展到控制台之外和有限的内容供应。

我还发现这对于扫描 PDF 和事实核查数据非常有用。微软自己的 Copilot 系统在 Word 中处理 PDF 并不好,但 Nvidia 的 Chat with RTX 没有问题地拉出所有关键信息。响应几乎是即时的,没有你通常在使用基于云的 ChatGPT 或 Copilot 聊天机器人时看到的延迟。

Chat with RTX 的一个大缺点是,它真的感觉像是一个早期的开发者演示。Chat with RTX 实质上在你的电脑上安装了一个网络服务器和 Python 实例,然后利用 Mistral 或 Llama 2 模型来查询你提供的数据。然后,它利用 Nvidia 的 Tensor 核心在 RTX GPU 上加速你的查询。

Chat with RTX 并不总是准确的。它在我的电脑上安装大约需要 30 分钟,我的电脑配备了一个 Intel Core i9-14900K 处理器和一个 RTX 4090 GPU。这个应用程序几乎有 40GB 大小,Python 实例占用了系统中可用的 64GB RAM 中的大约 3GB。一旦运行起来,你就可以通过浏览器访问 Chat with RTX,同时在后台运行的命令提示符会输出正在处理的内容和任何错误代码。

Nvidia 并不是将这个作为所有 RTX 拥有者都应该立即下载和安装的成熟应用程序来提供。存在许多已知的问题和限制,包括源归属并不总是准确。我最初尝试让 Chat with RTX 索引 25,000 个文档,但这似乎使应用程序崩溃了,我不得不清除首选项才能再次开始。

Chat with RTX 也不记得上下文,所以后续问题不能基于之前问题的上下文。它还在你要求它索引的文件夹内创建 JSON 文件,所以我不建议在你的整个 Windows 文档文件夹中使用这个。

我喜欢一个好的技术演示,Nvidia 在这里确实提供了这样的演示。它展示了未来在你的个人电脑上本地运行的 AI 聊天机器人的可能性,特别是如果你不想订阅像 Copilot Pro 或 ChatGPT Plus 这样的服务就能分析你的个人文件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/685470.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024.2.16日总结(小程序开发8)

数据监听器 监听对象属性的变化 数据监听器支持监听对象中单个或多个属性的变化 纯数据字段 什么是纯数据字段 纯数据字段指的是哪些不用于页面渲染的data字段 应用场景:例如有些情况下,某些 data 中的字段既不会展示在界面上,也不会传递给其他组件…

html从零开始9:javaScript简介,语句、标识符,变量,JavaScript引入到文件【搬代码】

javaScript简介 javaScript语句、标识符 变量 var num 10; var就是固定声明,num就是变量名&#xff0c;10就是变量&#xff1b;<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Comp…

Flutter 动画(显式动画、隐式动画、Hero动画、页面转场动画、交错动画)

前言 当前案例 Flutter SDK版本&#xff1a;3.13.2 显式动画 Tween({this.begin,this.end}) 两个构造参数&#xff0c;分别是 开始值 和 结束值&#xff0c;根据这两个值&#xff0c;提供了控制动画的方法&#xff0c;以下是常用的&#xff1b; controller.forward() : 向前…

Docker笔记-搭建Python环境、安装依赖、打包镜像、导入镜像、编写bash脚本灵活调用

说明 适合无联网的机器及多Python的机器进行部署。 制作docker版Python环境 有网络及有docker的&#xff0c;拉取指定版本的python如&#xff1a; docker pull python:3.7 安装好后进入容器&#xff1a; docker run -it <name> /bin/bash 使用pip安装各种依赖&…

Redis -- 数据库管理

目录 前言 切换数据库(select) 数据库中key的数量&#xff08;dbsize&#xff09; 清除数据库&#xff08;flushall flushdb&#xff09; 前言 MySQL有一个很重要的概念&#xff0c;那就是数据库database&#xff0c;一个MySQL里面有很多个database&#xff0c;一个datab…

Simulink模块说明

Simulink库 Commonly Used Blocks Bus Creator 将一组输入元素合并成一条总线**输入&#xff1a;**要包含在总线中的输入元素。**输出&#xff1a;**由合并的输入元素组成的输出总线&#xff0c;指定为虚拟或非虚拟总线。 Bus Selector Bus Selector 模块输出您从输入总线选…

《白话C++》第9章 泛型,Page842~844 9.4.2 AutoPtr

源起&#xff1a; C编程中&#xff0c;最容易出的问题之一&#xff0c;就是内存泄露&#xff0c;而new一个对象&#xff0c;却忘了delete它&#xff0c;则是造成内存泄露的主要原因之一 例子一&#xff1a; void foo() {XXXObject* xo new XXXObject;if(!xo->DoSomethin…

Web项目利用MybatisPlus进行分页查询

之前在写博客系统前台页面的时候&#xff0c;遇到了利用mp进行分页查询的情况&#xff0c;由于涉及到的知识点相对较为重要&#xff0c;固写一篇博客以此巩固。 一、功能需求 在首页和分类页面都需要查询文章列表。 首页&#xff1a;查询所有的文章分类页面&#xff1a;查询…

[计算机网络]---序列化和反序列化

前言 作者&#xff1a;小蜗牛向前冲 名言&#xff1a;我可以接受失败&#xff0c;但我不能接受放弃 如果觉的博主的文章还不错的话&#xff0c;还请点赞&#xff0c;收藏&#xff0c;关注&#x1f440;支持博主。如果发现有问题的地方欢迎❀大家在评论区指正 目录 一、再谈协议…

【NLP】MHA、MQA、GQA机制的区别

Note LLama2的注意力机制使用了GQA。三种机制的图如下&#xff1a; MHA机制&#xff08;Multi-head Attention&#xff09; MHA&#xff08;Multi-head Attention&#xff09;是标准的多头注意力机制&#xff0c;包含h个Query、Key 和 Value 矩阵。所有注意力头的 Key 和 V…

springboot189基于SpringBoot电商平台的设计与实现

简介 【毕设源码推荐 javaweb 项目】基于springbootvue 的 适用于计算机类毕业设计&#xff0c;课程设计参考与学习用途。仅供学习参考&#xff0c; 不得用于商业或者非法用途&#xff0c;否则&#xff0c;一切后果请用户自负。 看运行截图看 第五章 第四章 获取资料方式 **项…

安全基础~通用漏洞5

文章目录 知识补充CSRFSSRFxss与csrf结合创建管理员账号 知识补充 NAT&#xff1a;网络地址转换&#xff0c;可以将IP数据报文头中的IP地址转换为另一个IP地址&#xff0c;并通过转换端口号达到地址重用的目的。即通过将一个外部IP地址和端口映射更大的内部IP地址集来转换IP地…

ICLR 2023#Learning to Compose Soft Prompts for Compositional Zero-Shot Learning

组合零样本学习&#xff08;CZSL&#xff09;中Soft Prompt相关工作汇总&#xff08;一&#xff09; 文章目录 组合零样本学习&#xff08;CZSL&#xff09;中Soft Prompt相关工作汇总&#xff08;一&#xff09;ICLR 2023#Learning to Compose Soft Prompts for Compositional…

透光卓越,光耦继电器的独特特点全面解析

光耦继电器作为电子控制系统中的核心元件&#xff0c;其光电隔离技术为其独特之处。通过光电隔离技术&#xff0c;光耦继电器实现了输入和输出之间的电气隔离&#xff0c;有效阻止了高电压与低电压之间的直接接触。这项技术不仅提高了系统的安全性&#xff0c;还有效减少了电气…

Vue练习1:组件开发1(头像组件)

样式预览 注释代码 <template><div class"img-box":style"{ //动态style必须为对象width: size rem,height: size rem}"><imgclass"avatar-img":src"url" //动态url/></div> </templ…

【DDD】学习笔记-聚合设计原则

聚合设计原则 对比对象图和聚合&#xff0c;我们认为引入聚合的目的是控制对象之间的关系&#xff0c;这实则是引入聚合的技术原因。领域驱动设计引入聚合&#xff08;Aggregate&#xff09;来划分对象之间的边界&#xff0c;在边界内保证所有对象的一致性&#xff0c;并在对象…

C语言从零实现贪吃蛇小游戏

制作不易&#xff0c;点赞关注一下呗&#xff01;&#xff01;&#xff01; 文章目录 前言一. 技术要点二、WIN32API介绍三、贪吃蛇游戏设计与分析 1.游戏开始前的初始化 2.游戏运行的逻辑 总结 前言 当我们掌握链表这样的数据结构之后&#xff0c;我们就可以用它来…

比特币 P2PKH、P2SH

标准脚本P2PKH、P2SH 区块链重要基础知识7-1——标准脚本P2PKH、P2SH-CSDN博客 比特币中P2SH(pay-to-script-hash)多重签名的锁定脚本和解锁脚本 https://www.cnblogs.com/itlgl/p/10419325.html

京东护网面试题汇总

1 、JNI 函数在 java 中函数名为 com.didi.security.main,C 中的函数名是什么样的&#xff1f; com_didi_security_mian java.com.didi.security.main 2 、Frida 和 Xposed 框架&#xff1f; 3 、SSRF 利用方式&#xff1f; 4 、宏病毒&#xff1f; 5 、APP 加壳&a…

黑群晖一键修复:root、AME、DTS、转码、CPU型号等

食用方法&#xff1a;SSH连接群晖使用临时root权限执行 AME3.x激活补丁 只适用于x86_64的&#xff1a;DSM7.x Advanced Media Extensions (AME)版本3.0.1-2004、3.1.0-3005 激活过程需要下载官方的解码包&#xff0c;过程较慢&#xff0c;耐心等待。。。 DSM7.1和7.2的AME版…