翻译: GPT-4 with Vision 升级 Streamlit 应用程序的 7 种方式一

随着 OpenAI 在多模态方面的最新进展,想象一下将这种能力与视觉理解相结合。

现在,您可以在 Streamlit 应用程序中使用 GPT-4 和 Vision,以:

  1. 从草图和静态图像构建 Streamlit 应用程序。
  2. 帮助你优化应用的用户体验,包括调试和文档。
  3. 克服LLM的局限性和幻觉hallucinations。

在本文中,我将带您了解 8 个实际用例,这些用例举例说明了将 GPT-4 与 Vision 结合使用的新可能性!
在这里插入图片描述

1. 人工智能中的多模态简史

在我们深入研究各种用例之前,重要的是要为多模态奠定一些概念基础,讨论开创性模型,并探索当前可用的多模态模型。

多模态(Multi-modal LLMs) LLMs 是一种基于多种类型的数据(如文本、图像和音频)进行训练的 AI 系统,而不是专注于单一模态的传统模型。
在这里插入图片描述
近年来,多模态的旅程取得了长足的进步,各种模式都铺平了道路:

  • CLIP 是 OpenAI 于 2021 年推出的 OG 模型,它是一种开创性的模型,能够以零样本和少样本学习的方式泛化到多个图像分类任务。
  • 2022 年发布的 Flamingo 以其在多模态领域生成开放式响应方面的强劲表现而著称。
  • Salesforce 的 BLIP 模型是一个统一视觉语言理解和生成的框架,可提高一系列视觉语言任务的性能。

GPT-4 with Vision 建立在开创性模型的基础上,以推进视觉和文本模式的整合。然而,它并不是当今唯一争夺注意力的多模态模型;Microsoft 和 Google 也越来越受欢迎:

  • Microsoft 的 LLaVA 使用预先训练的 CLIP 视觉编码器,尽管数据集较小,但仍提供与 GPT-4 相似的性能。
  • Gemini 是 Google 的多模式模型,它之所以脱颖而出,是因为它从根本上设计为多模式。

参考

https://blog.streamlit.io/7-ways-gpt-4-vision-can-uplevel-your-streamlit-apps/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/652287.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《合成孔径雷达成像算法与实现》Figure5.18

clc clear close all距离向参数 R_eta_c 20e3; % 景中心斜距 Tr 25e-6; % 发射脉冲时宽 Kr 0.25e12; % 距离向调频率 Fr 7.5e6; % 距离向采样率 Nrg 256; % 距离线采样点数 Bw abs(Kr*Tr); …

.NET绿色开源一键自动化下载、安装、激活Office的利器

前言 今天分享一款.NET开源、绿色、安全、无毒的支持一键自动化下载、安装、激活Microsoft Office的利器:LKY_OfficeTools。 工具介绍 一键自动化下载、安装、激活 Microsoft Office 的利器。绿色、开源、安全、无毒。 目前包含的功能: 一键快速下载、…

【机器学习300问】16、逻辑回归模型实现分类的原理?

在上一篇文章中,我初步介绍了什么是逻辑回归模型,从它能解决什么问题开始介绍,并讲到了它长什么样子的。如果有需要的小伙伴可以回顾一下,链接我放在下面啦: 【机器学习300问】15、什么是…

C#,计算几何,二维贝塞尔拟合曲线(Bézier Curve)参数点的计算代码

Pierre Bzier Bzier 算法用于曲线的拟合与插值。 插值是一个或一组函数计算的数值完全经过给定的点。 拟合是一个或一组函数计算的数值尽量路过给定的点。 这里给出 二维 Bzier 曲线拟合的参数点计算代码。 区别于另外一种读音接近的贝塞耳插值算法(Bessels int…

【CAD全套教程】第1阶段 CAD软件教程 002+003基础界面设置

002基础界面设置 1.切换界面至AutoCAD经典界面 方式一:任务栏点击后直接选择 方式二:右下角点击齿轮图标(切换工作空间)后直接选择 界面图 2.AutoCAD常用命令 工具栏右键单击,选择AutoCAD 3.命令提示行 最下方&#xf…

【Docker】实现JMeter分布式压测

一个JMeter实例可能无法产生足够的负载来对你的应用程序进行压力测试。如本网站所示,一个JMeter实例将能够控制许多其他的远程JMeter实例,并对你的应用程序产生更大的负载。JMeter使用Java RMI[远程方法调用]来与分布式网络中的对象进行交互。JMeter主站…

【前端web入门第二天】01 html语法实现列表与表格_合并单元格

html语法实现列表与表格 文章目录: 1.列表 1.1 无序列表1.2 有序列表1.3 定义列表 2.表格 2.1 表格基本结构2.2 表格结构标签2.3 合并单元格 写在最前,第二天学习目标: 列表 表格 表单 元素为嵌套关系 1.列表 作用:布局内容排列整齐的区域。 列表分类:无序列表、有序列表…

数字IC实践项目(8)—CNN加速器(ASIC_Flow;付费项目补充)

数字IC实践项目(8)—CNN加速器(ASIC_Flow;付费项目补充) 更新说明项目整体框图神经网络框图File tree 项目简介和学习目的软件环境要求 Area、QOR、Power&Timing报告Area & QORTiming & Power 总结 更新说…

【C++】类与对象(一)

前言 类与对象(一) 文章目录 一、面向对象和面向过程的对比二、类的引入2.1 C中的结构体2.2 类2.3 类定义方法2.4 修饰限定符2.5 封装2.6 类的实例化2.7 类对象的大小 三、this指针3.1 this 指针的使用 一、面向对象和面向过程的对比 面向过程编程是将程…

GoJS—交互式图表开发的神器(海量案例)

一、GoJS是什么: GoJS是一个用于创建交互式可视化图表和图形的JavaScript库。它提供了丰富的功能和工具,使开发人员能够轻松地构建各种类型的图表,包括流程图、组织结构图、网络拓扑图等。GoJS具有灵活的布局和样式设置,可以通过简…

Python中Numba库装饰器

一、运行速度是Python天生的短板 1.1 编译型语言:C 对于编译型语言,开发完成以后需要将所有的源代码都转换成可执行程序,比如 Windows 下的.exe文件,可执行程序里面包含的就是机器码。只要我们拥有可执行程序,就可以随…

基于STM32的智能手环设计与实现

需要原理图工程,源码,PCB工程的朋友收藏,这篇文章关注我,私我吧!!! 基于STM32的智能手环设计与实现 摘要一、研究背景及意义二、实现功能三、系统方案设计系统方案设计框图3.1 单片机芯片选择3…

[HGAME 2023 week1]easyenc

查壳 IDA打开 字符串打开就发现了明显的标志 int __cdecl main(int argc, const char **argv, const char **envp) {__int64 v3; // rbx__int64 v4; // raxchar v5; // alchar *v6; // rcxint v8[10]; // [rsp20h] [rbp-19h]char v9; // [rsp48h] [rbpFh]__int128 v10[3]; //…

【Java】SpringMVC参数接收(一)

1、接收单个参数 (1)直接接收参数 RequestMapping("/hello") RestController public class HelloSpring {RequestMapping("/t2")public String t2(String name){return "name" name;} } 当没有传入参数时,返…

《汇编语言:基于linux环境》eatsyscall汇编程序

当阅读此书,作者编写了一个这样的程序,我也想试一下。照着书中的代码写了下,可以使用nasm正常编译,ld也可以正常链接,但是无法正常执行。总是报错。 ; nasm -f elf64 -g -F stabs eatsyscall.asm ; ld -o eatsysca…

sqli-labs靶场第七关

7、第七关 id1 --单引号报错,id1" --双引号不报错,可以判断是单引号闭合 id1) --也报错,尝试两个括号闭合,id1)) --不报错 接下来用脚本爆库 import stringimport requestsnumbers [1, 2, 3, 4, 5, 6, 7, 8, 9, 0] letters2 list(string.ascii_…

【销售数据分析】客户画像分析之总体画像

前一段时间把财务分析的一些报表及分析场景讲得差不多了,接下来想和大家讲一下销售分析中的一些场景。今年看了许多企业的数据,发现大家2023年比疫情三年更难!从财务的几张报表就会发现净利润亏损的居多,而亏损的主要原因基本上都…

Easysearch:语义搜索、知识图和向量数据库概述

什么是语义搜索? 语义搜索是一种使用自然语言处理算法来理解单词和短语的含义和上下文以提供更准确的搜索结果的搜索技术。旨在更好地理解用户的意图和查询内容,而不仅仅是根据关键词匹配,还通过分析查询的语义和上下文来提供更准确和相关的…

什么是DevOps?DevOps是如何提效的?

文章目录 前言一、DevOps是什么?二、DevOps是如何提效的?总结 前言 随着软件行业的不断发展,如何打破开发、运维、测试之间的边界,使工作更加高效成为了企业的新一个难题,本文将向大家介绍DevOps文化,以及…

巨杉数据库携手广发证券入选2023大数据“星河”案例

近期,中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)连续七年共同组织的大数据“星河(Galaxy)”案例征集活动发布公示。本次征集活动,旨在通过总结和推广大数据产业发展的优秀成果,推动…