在Visual Studio Code中使用Phi-3模型

 更多数字生产力内容,欢迎关注我的公众号“ONE生产力”。

先前的文章中,我们已经介绍使用LM Studio在本地环境中运行Phi-3。LM Studio是一款革命性的桌面应用程序,它允许用户在自己的计算机上本地运行、管理和部署大型语言模型,但有朋友希望有工具能够更好的利用本地语言模型进行开发,今天我就向大家隆重介绍VS Code AI Toolkit,通过AI Toolkit,我们就可以在熟悉的VS Code中实现:

  • 在本地运行预先优化的 AI 模型:快速开始使用为各种设置设计的模型,包括使用 DirectML 加速或直接 CPU 运行的 Windows 11、带有 NVIDIA GPU 的 Linux 或仅限 CPU 的环境。
  • 无缝测试和集成模型:在用户友好的游乐场中试验模型,或使用 REST API 将它们直接合并到您的应用程序中。
  • 根据特定需求对模型进行微调:在本地或云端定制预先训练的模型(如流行的 SLM Phi-3 和 Mistral),以增强性能、定制响应并控制其风格。
  • 部署您的 AI 功能:选择云部署或将其嵌入到您的设备应用程序中。

本系列我们将包含两篇文章,今天第一篇我们将继续以Phi-3模型为例,介绍如何通过AI Toolkit在VS Code中使用本地模型,下篇我们将介绍如何通过AI Toolkit在VS Code中微调Phi-3模型。

准备

在开始之前,请先准备好您的Visual Studio Code,您可以参考官方教程配置您的VS Code环境:

Getting started with Visual Studio Code。

安装VSC AI Toolkit

AI Toolkit 在 Visual Studio Marketplace 中提供,可以像安装任何其他 VS Code 扩展一样进行安装。

如果不熟悉如何安装 VS Code 扩展,则请执行以下步骤:

  1. 在 VS Code 中的活动栏中,选择“扩展”
  2. 在“扩展搜索”栏中键入“AI Toolkit”
  3. 选择“适用于 Visual Studio Code 的 AI Toolkit”
  4. 选择“安装”

安装扩展后,你会看到 AI Toolkit 图标显示在“活动栏”中。

下载模型

在AI Toolkit中,您将看到模型资源两部分:

模型部分包含:

模型目录

资源部分包含:

模型Playground

模型微调

我们在模型目录中选择并下载适合我们用例的模型。AI Toolkit 提供了已针对 Windows 优化的公开 AI 模型集合。这些模型存储在不同的位置,包括 Hugging Face、GitHub 等(备注:如果您在中国大陆,请注意您的网络环境能否访问上述站点),但我们可以浏览这些模型并在一个地方找到所有模型,随时可以在 Windows 应用程序中下载和使用。

我们还可以找到每个模型的模型卡,检查模型的各种参数,以便进一步决定为特定应用选择哪一个。一些详细信息,如模型预训练的参数数量、对 CPU 或 GPU 的依赖性、模型的大小都可以在这里找到。最后,在决定之后,可以使用每个模型的“下载”按钮下载模型。可以下载任意数量的模型。

运行模型

下载模型后,在目录中的模型卡上选择“在Playground中加载”:

在Playground的聊天界面中,输入以下消息,然后按 Enter 键:

你应会看到流式传输回来的模型回复:

同时您还可以配置上下文说明推理参数,从而获得更好的答案。

与现有AI应用集成

和LM Studio、Ollama一样,AI Toolkit 也附带本地 REST API Web 服务器,其使用OpenAI兼容接口来提供模型。 这样,便可以使用终结点 http://127.0.0.1:5272/v1/chat/completions 在本地测试应用程序,而无需依赖云 AI 模型服务。 如果打算在生产中切换到云终结点,请使用此选项。 可使用 OpenAI 客户端库连接到 Web 服务器。

总结

Visual Studio Code AI Toolkit 是一个为 Visual Studio Code 设计的扩展,它提供了一系列强大的功能,包括下载、测试、微调 AI 模型以及使用应用或云部署 AI 模型的能力。相较于 LM Studio 和 Ollama,AI Toolkit与 Visual Studio Code 的深度集成,具有更好的继承性和易用性。此外,它支持广泛的模型操作,包括模型的发现、下载和运行,以及与云服务的无缝整合,使得模型的开发和部署更加便捷。

参考文献

适用于 Visual Studio Code 的 AI Toolkit 入门指南 | Microsoft Learn

Visual Studio Code AI Toolkit: How to Run LLMs locally

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/33866.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

走近数据变更捕获(CDC):定义、优势和用例

在当今快节奏的数字化环境下,企业需要数据来做出决策、提高运营效率、优化客户体验。然而,获得最新最准确的数据有时并不容易,尤其是当数据来自于多个系统和应用程序时。这时,数据变更捕获(Change Data Capture&#x…

内存卡数据移走了怎样恢复?简易步骤与解决方案

随着科技的快速发展,内存卡已成为我们日常生活中不可或缺的一部分,特别是在行车记录仪、手机、相机等设备上。然而,当内存卡中的数据意外移走或删除时,我们往往会感到焦虑和困惑。本文将为您介绍如何简易恢复内存卡中移走的数据&a…

基于SpringBoot+Vue北部湾地区助农平台设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝1W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟 感兴趣的可以先收藏起来,还…

震惊!CURRENT_TIMESTAMP不能乱用

事情发生在签到和查询签到记录. 设置mysql时间默认值为CURRENT_TIMESTAMP可以随系统生成默认时间戳,即生成该数据的时间戳, 但是有些特殊场景要避免由mysql给我们生成默认时间: 1、首先签到成功之后返回给前端, 2、前端收到执行成功之后立马去查询签到记录, 3、发现并没有…

leetcode-17-[235]二叉搜索树的最近公共祖先[701]二叉搜索树中的插入操作[450]删除二叉搜索树中的节点

一、[235]二叉搜索树的最近公共祖先 class Solution {public TreeNode lowestCommonAncestor(TreeNode root, TreeNode p, TreeNode q) {if(rootnull){return null;}//左子树if (root.val > p.val && root.val > q.val) {return lowestCommonAncestor(root.left…

智慧校园-实习管理系统总体概述

智慧校园实习管理系统是专为高校、企业和学生设计的一体化数字解决方案,它革新了传统实习管理的方式,通过科技手段促进了实习资源的高效对接与管理。该系统整合了实习信息发布、申请管理、过程监督、评估反馈等多个核心环节,构建了一个无缝连…

钡铼BL101网关6串口Modbus转MQTT优化智慧园区设备互联

BL101网关:优化智慧园区设备互联的关键利器 在当今快速发展的智能化时代,智慧园区管理对于设备之间的高效互联至关重要。钡铼(BL101)网关作为一款功能强大的Modbus转MQTT设备,不仅支持多种通信协议和硬件接口&#xf…

Excel条件格式的经典用法

目录: 一、自动设置填充颜色 二、设置Excel到期自动销毁 三、隔行自动标记 四、美化表格 五、快速突出显示重复值 六、标记空单元格 七、突出显示前N名单元格数值 八、表格添加新内容自动加边框 一、自动设置填充颜色 1、选择内容 首先我们选中表格的数据…

常微分方程算法之编程示例三(预估-校正法)

目录 一、研究问题 二、C代码 三、计算结果 一、研究问题 本节我们采用预估校正法(改进欧拉法)求解算例。 预估-校正法的原理及推导请参考: 常微分方程算法之预估-校正法(改进Euler法)_、改进欧拉法-CSDN博客https…

规则引擎-Aviator 表达式校验是否成立

目录 介绍特性使用更多文献支持 介绍 Aviator是一个轻量级、高性能的Java表达式执行引擎,它动态地将表达式编译成字节码并运行。 特性 支持绝大多数运算操作符,包括算术操作符、关系运算符、逻辑操作符、位运算符、正则匹配操作符(~)、三元表达式(?:…

IDEA services模块无法启动springboot服务(添加了springboot但是为空白)

https://blog.csdn.net/m0_54042402/article/details/117918995 https://blog.csdn.net/qq_46550964/article/details/122235235 Alt8 显示services模块 发现有springboot启动模块,点一下springboot之后,这个模块就消失了 会自动在.idea文件夹下的work…

五十八、openlayers官网示例Map Graticule解析——给地图添加经纬度网格线

这篇没啥好说的,写出来完全是嘲笑一下自己蠢,以及,,,帮大家避个坑。。。。 之前一个项目需要展示这种经纬线,但是我不知道openlayers有这种图层,于是拿canvas画上去的。。。。 很好&#xff0c…

【嵌入式Linux】<总览> 多进程

文章目录 前言 一、进程的概念与结构 1. 相关概念 2. 内核区中的进程结构 3. 进程的状态 4. 获取进程ID函数 5. 进程组 6. 会话 二、进程创建 1. fork和vfork函数 2. 额外注意点 3. 构建进程链 4. 构建进程扇 三、进程终止 1. C程序的启动过程 2. 进程终止方式…

2024年无线领夹麦克风选购指南,领夹麦克风哪个品牌好

"领夹麦克风"这个名词对于大多数人可能还比较陌生,但在互联网专业人士和短视频制作者的世界里,它却是一个不可或缺的工具。如果你有志于成为短视频领域的创作者,或者想要参与视频拍摄、直播等多媒体内容的制作,那么了解…

计算机工具软件安装攻略:Chrome浏览器下载安装及使用

1 Chrome简介 Chrome是谷歌公司开发的一款免费网页浏览器它快速、稳定、安全拥有简洁流畅的界面和丰富的应用程序内置了强大的谷歌搜索引擎。Chrome使用Blink浏览器引擎和V8 JavaScript引擎支持多种插件和扩展程序让浏览网页更便捷。它可以与Android手机良好同步支持跨设备浏览…

cpu scheduling cpu调度

soft real-time Vs hard real-time scheduling Real-Time CPU Scheduling Can present obvious challengesSoft real-time systems – Critical real-time tasks have the highest priority, but no guarantee as to when tasks will be scheduledHard real-time systems – …

“Allegro评论管理:高效处理评价,提升顾客满意度”

波兰Allegro平台以其庞大的用户基础和丰富的商品种类,成为波兰乃至欧洲电商市场中的一颗璀璨明珠。如何高效管理和优化顾客评价,成为每个商家亟待解决的核心问题。正是基于这一背景,“无忧易售”——一款专注于Allegro评价管理的功能上线了&a…

使用 Mac 数据恢复从 iPhoto 图库中恢复照片

我们每个人都会遇到这种情况:在意识到我们不想丢失照片之前,我们会永久删除 iPhoto 图库中的一些照片。永久删除这些照片后,是否可以从 iPhoto 图库中恢复照片?本文将指导您使用免费的 Mac 数据恢复软件从 iPhoto 中恢复照片。 i…

2024软件设计师笔记之考点版(一考就过):1-10

软件设计师之一考就过:成绩版 考点1:CPU、指令 真题1:CPU 执行算术运算或逻辑运算时,常将源操作数和结果暂存在(累加器(AC))中。 真题2:在程序的执行过程中,Cache与主存的地址映射是由(硬件自动)完成的。 真题3:计算机执行程序时,内存分为静态数据区、代码区、…

【漏洞复现】华测监测预警系统——SQL注入漏洞

声明:本文档或演示材料仅供教育和教学目的使用,任何个人或组织使用本文档中的信息进行非法活动,均与本文档的作者或发布者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 华测监测预警系统2.2版本存在sql注入,UserEdit接口S…