langchain调用多模态大模型

下面示例是使用langchain调用多模态的示例

数据处理

import os
import base64
from mimetypes import guess_typedef local_image_to_data_url(image_path):# Guess the MIME type of the image based on the file extensionmime_type, _ = guess_type(image_path)if mime_type is None:mime_type = 'application/octet-stream'  # Default MIME type if none is found# Read and encode the image filewith open(image_path, "rb") as image_file:base64_encoded_data = base64.b64encode(image_file.read()).decode('utf-8')# Construct the data URLreturn f"data:{mime_type};base64,{base64_encoded_data}"def get_image_message(img_path):def _get_template(image_path):print('文件路径为:' + image_path)url = local_image_to_data_url(image_path)return {"type": "image_url","image_url": {"url": url},}if not os.path.exists(img_path):print(f"Error: Path {img_path} does not exist.")returnimage_extensions = ['.png', '.jpg', '.jpeg']image_message = []# 判断传入的是一个file还是folderif os.path.isfile(img_path):image_url = _get_template(img_path)image_message.append(image_url)elif os.path.isdir(img_path):for f in os.listdir(img_path):if any(f.lower().endswith(ext) for ext in image_extensions):image_url = _get_template(os.path.join(img_path, f))image_message.append(image_url)else:print("错误!请检测传入的图片文件夹目录结构。")return image_messageif __name__ == '__main__':img_path = "img/temp/"user_image_message = get_image_message(img_path)

主程序

import os
from dotenv import load_dotenv, find_dotenv_ = load_dotenv(find_dotenv())from langchain.prompts import ChatPromptTemplate
from langchain_core.output_parsers import PydanticOutputParser
from langchain.schema.runnable import RunnablePassthrough
from pydantic import BaseModel, Field, validator
from langchain_openai import AzureChatOpenAIfrom ulits.data_processing import *class Result(BaseModel):Observation: str = Field(description="仔细观察你收的图像, 详细描述图像中的内容,用中中文回答")Thought: str = Field(description="根据你的描述,结合用户的视频搜索提示词,思考当前画面是否是用户想要寻找的画面")Result: bool = Field(description="给出结论,根据你的思考判断当前画面是否是用户想要搜索的画面", default=False)# OutputParser
parser = PydanticOutputParser(pydantic_object=Result)system_prompt_path = "prompt/prompt1.txt"
with open(system_prompt_path, 'r', encoding='utf-8') as f:system_prompt = f.read()user_text_message = [{"type": "text","text": "用户输入的视频搜索提示词:\n{query}\n"}]img_path = "img/"
user_image_message = get_image_message(img_path)user_message = user_text_message + user_image_message# Prompt 模板
prompt = ChatPromptTemplate.from_messages([("system", system_prompt),("user", user_message),]
).partial(format_instructions=parser.get_format_instructions())# 模型
model = AzureChatOpenAI(azure_endpoint=os.environ["AZURE_OPENAI_ENDPOINT"],azure_deployment=os.environ["AZURE_OPENAI_DEPLOYMENT_NAME"],openai_api_version=os.environ["AZURE_OPENAI_API_VERSION"],temperature=0,model_kwargs={"seed": 42})# LCEL 表达式
runnable = ({"query": RunnablePassthrough()} | prompt | model | parser
)# 运行
print(runnable.invoke("搜索一个拿伞的女人"))print("end")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/30836.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

34、shell数组+正则表达式

0、课前补充 jiafa () { result$(echo " $1 $2 " | bc ) print "%.2f\n" "$result" } ##保留小数点两位 薄弱加强点 a$(df -h | awk NR>1 {print $5} | tr -d %) echo "$a"一、数组 1.1、定义 数组的定义&am…

配电室数据中心巡检3d可视化搭建的详细步骤

要搭建配电室巡检的3D可视化系统,可以按照以下步骤进行: 收集配电室数据: 首先,需要收集配电室的相关数据,包括配电室的布局、设备信息、传感器数据等。可以通过实地调查、测量和设备手册等方式获取数据。 创建3D模型…

树莓派4b硬件资源

树莓派4B的硬件资源相当丰富,以下是对其硬件资源的详细归纳: 处理器: 树莓派4B使用Broadcom BCM2711芯片,该芯片基于ARM Cortex-A72架构。Cortex-A72是一个高性能的处理器架构,具有单线程性能高、功耗低以及强大的多核…

C# OpenCvSharp 图像处理函数-颜色通道-cvtColor

使用 OpenCvSharp 中的 cvtColor 函数进行图像颜色转换 在图像处理领域,颜色空间转换是一个非常常见的操作。OpenCvSharp 提供了一个强大的函数 cvtColor 来处理这类转换。本文将详细介绍 cvtColor 函数的使用方法,并通过具体的示例演示如何在实际项目中应用这些知识。 函数…

解决java.sql.SQLIntegrityConstraintViolationException: Duplicate entry ‘1‘ for key ‘book.PRIMARY‘

目录 问题 原因 解决方案 问题 场景:有张图书表,主键是自增的。现在我写了个添加图书功能。因为主键是自增的我插入时无需设置主键值。 关键代码如下: 然后就报这个异常了: 找了一圈并没有发现能解决我这个问题的。最终仔细分…

电脑桌面文件夹删除不了怎么办?6种方法快速解决,建议收藏!

桌面文件夹删不掉怎么办?有时会遇到桌面上的文件夹无法删除的问题,这是由于文件夹被系统进程或某些应用占用,或者是由于权限设置等原因造成的。以下是解决桌面文件夹无法删除问题的方法,帮助你有效地清理桌面环境。 桌面文件夹删不…

中欧科学家论坛暨第六届人工智能与先进制造国际会议(AIAM2024)

会议日期:2024年10月20-21日 会议地点:德国-法兰克福 会议官网:https://www.iaast.cn/meet/home/Bx130JiM 出版检索:EI、Scopus等数据库收录 【会议简介】 “中欧科学家论坛”由德国、法国、荷兰、瑞士、丹麦、意大利、西班牙…

欧几里得算法求解最大公约数(附代码实现,习题练习)

1.公约数、最大公约数的定义 公约数,亦称“公因数”。它是指能同时整除几个整数的数 。如果一个整数同时是几个整数的约数,称这个整数为它们的“公约数”。公约数中最大的称为最大公约数。对任意的若干个正整数,1总是它们的公因数。eg.30和4…

微信小程序常用的api(2)

动画API 创建实例 wx.createAnimation() 作用:用于在微信小程序中完成动画效果的制作 动画的常用属性 duration 【number型】 动画持续时间,单位毫秒,默认400毫秒 timingFunction 【string型】 动画效果 默认linear delay 【number型】 动…

C++回溯算法(2)

棋盘问题 #include<bits/stdc.h> using namespace std; void func(int,int); bool tf(int,int); void c(); int n,k; char a[110][110]; int cnt20; int main() {cin>>n>>k;for(int i0;i<n;i){for(int j0;j<n;j){cin>>a[i][j];}}func(0,0);cout…

交易账户实现多人下单 分仓系统 交易外接 多指令管理

交易账户实现多人下单 分仓系统 交易外接 多指令管理 指令管家下载&#xff1a;https://raw.githubusercontent.com/LeoGQ/quant/main/CommandKeeper/%E6%8C%87%E4%BB%A4%E7%AE%A1%E5%AE%B6.zip 或项目地址&#xff1a;https://github.com/LeoGQ/quant/tree/main/CommandKeeper…

在国内默默无闻的.NET,在国外火的超乎想象?

.NET开篇概述 在编程语言的竞技场上&#xff0c;.NET似乎在国内并未获得与其实力相匹配的名声&#xff0c;相较于Java和Python的广为人知&#xff0c;.NET更像是一位隐匿在幕后的高手。然而&#xff0c;当我们放眼国际&#xff0c;.NET的火爆程度却让人不得不重新审视这位“幕后…

nvm 管理多版本node

因有多个前端项目&#xff0c;不同项目使用的node版本不一样&#xff0c;所以在本地使用nvm管理不同的node版本。 一、安装nvm 1&#xff09;nvm理解 nvm全英文也叫node.js version management&#xff0c;是一个nodejs的版本管理工具。nvm和n都是node.js版本管理工具&#xff…

minIo ubuntu单节点部署

资源准备 minio二进制包 下载地址:https://dl.min.io/server/minio/release/linux-amd64/minio ubuntu-单节点部署 选择一台ubuntu18.04机器10.253.9.41、intel 或者 amd 64位处理器 上传minio到~目录 sudo cp minio /usr/local/bin/ sudo chmod x /usr/local/bin/minio 设…

2024MathorCup A题 赛后思路代码分享(分赛区一等奖)移动通信网络中 PCI 规划问题

今年突然变成分赛区 (10%) 推国&#xff0c;国奖结果还没出&#xff0c;感觉一等&#xff08;2%&#xff09;有点悬&#xff0c;论文写的太一般了我没时间去修。 4 月不务正业又被拉着打了次比赛&#xff0c;刚好这几天有闲暇&#xff0c;传一下之前写的解题思路&#xff0c;不…

PHP面试必会的20个问题

PHP是什么&#xff0c;它的全称是什么&#xff1f; PHP是一种服务器端脚本语言&#xff0c;主要用于Web开发。它的全称是Hypertext Preprocessor&#xff08;超文本预处理器&#xff09;&#xff0c;由Rasmus Lerdorf在1994年首次创建。PHP可以嵌入到HTML中&#xff0c;用于生成…

文本预处理1--去除#和句号之间内容

1.针对文本里特定两个符号之间内容的中文进行去除&#xff0c;本次选取#和句号之间的内容进行去除。 2.大家可以根据自己的实际需求修改代码实现自己的文本内容的整理。 3.下面是去除#和句号之间内容的python代码&#xff1a;其中读取的是txt文本&#xff0c;处理后的内容写回…

超声波清洗机哪家好用又实惠?四款亲测表现出色超声波清洗机安利

在当今社会&#xff0c;随着生活节奏的加快&#xff0c;年轻人越来越多地依赖眼镜来纠正视力或保护眼睛。无论是为了时尚搭配&#xff0c;还是因为长时间面对电脑和手机屏幕导致的视力问题&#xff0c;眼镜已经成为许多年轻人日常生活中不可或缺的配件。然而&#xff0c;就在我…

Python3 模块

在前面的几个章节中我们基本上是用 python 解释器来编程&#xff0c;如果你从 Python 解释器退出再进入&#xff0c;那么你定义的所有的方法和变量就都消失了。 为此 Python 提供了一个办法&#xff0c;把这些定义存放在文件中&#xff0c;为一些脚本或者交互式的解释器实例使…

Linux驱动开发(二)--字符设备驱动开发提升 LED驱动开发实验

1、地址映射 在编写驱动之前&#xff0c;需要知道MMU&#xff0c;也就是内存管理单元&#xff0c;在老版本的 Linux 中要求处理器必须有 MMU&#xff0c;但是现在Linux 内核已经支持无 MMU 的处理器了。 MMU的功能如下&#xff1a; 完成虚拟空间到物理空间的映射 内存保护&…