轻松实现远程智能交互:OriginBot与钉钉和GPT4o的集成指南

说明

我之前实现了简单UI来跟OriginBot交互,可以参考这里:古月居 - ROS机器人知识分享社区  但是由于我不是专业的前端开发,写UI还是比较耗时的,所以最近想修改一下这部分。

还有一个原因是,自己开发前端,如果想实现远程交互(不在同一wifi下),就一定需要一个云服务器来中转一下,这个是比较麻烦的。

我期望的交互效果是可以双向发送文字、图片和语音,找了一圈发现钉钉的「单聊机器人」可以满足所有要求,所以这篇博客记录一下如何为OriginBot接入钉钉单聊机器人。

创建钉钉单聊机器人

创建单聊机器人的步骤其实不复杂,可以参考:单聊机器人概述 - 钉钉开放平台

唯一需要注意的是消息接收模式要选择Stream模式,不要选择http模式即可。

如何实现收发消息

在钉钉开放平台上创建好单聊机器人后,还需要有一个服务来收发消息。

在OriginBot上创建一个文件dingtalk_runtime.py, 内容如下:

"""
用于钉钉单聊机器人收发消息
"""from dingtalk_stream import AckMessage
import dingtalk_stream
import osfrom prompts import base_prompt
from llms import azure_gpt4oclass DingtalkMsgHandler(dingtalk_stream.ChatbotHandler):def __init__(self):super(dingtalk_stream.ChatbotHandler, self).__init__()async def process(self, callback: dingtalk_stream.CallbackMessage):incoming_message = dingtalk_stream.ChatbotMessage.from_dict(callback.data)message_type = incoming_message.message_typeif message_type not in ("text"):self.reply_text("您发送的消息类型不合法,目前只支持文本。", incoming_message)return AckMessage.STATUS_OK, "OK"if message_type == "text":text = incoming_message.text.content.strip()self.reply_text(text, incoming_message)return AckMessage.STATUS_OK, "OK"def main():credential = dingtalk_stream.Credential(os.getenv("DINGTALK_CLIENTID"),os.getenv("DINGTALK_CLIENTSECRET"),)client = dingtalk_stream.DingTalkStreamClient(credential)client.register_callback_handler(dingtalk_stream.chatbot.ChatbotMessage.TOPIC, DingtalkMsgHandler())client.start_forever()if __name__ == "__main__":main()

运行这个脚本后,在钉钉中给“originbot_home_assistant”这个机器人发送消息后,它会给你回复一样的内容。

到这里就已经实现了最基础的交互功能了。

大家在代码中可以看到,我目前限定了只能接收文本格式的消息,其他类型暂时都不允许,这主要是为了降低一开始的开发难度,不用考虑所有可能。

但实际上,钉钉的单聊机器人支持很丰富的消息类型,可以看下面的说明:企业机器人发送单聊消息 - 钉钉开放平台

我会在后面需要的时候添加其他消息类型。

集成GPT4o

上面给出的通过钉钉单聊机器人跟智能小车交互的代码是非常简单的,它只能把你发给小车的消息原样返回,但实际使用过程中肯定不会这样使用。我在这里是希望通过在交互过程中集成GPT4o来让其更加智能化。

具体可以看下面的代码:

"""
大模型相关的封装和调用, 文件名是llms.py
"""import os
import requests
import json
import base64from logger import logger# 读取图片并编码为 Base64 字符串
def encode_image_to_base64(image_path=None, image_bytes=None):if image_path and image_bytes:raise ValueError("image_path and image_bytes cannot be both provided.")if image_path:with open(image_path, "rb") as image_file:encoded_string = base64.b64encode(image_file.read()).decode("utf-8")if image_bytes:encoded_string = base64.b64encode(image_bytes).decode("utf-8")return encoded_stringdef azure_gpt4o(message):api_key = os.getenv("API_KEY")headers = {"Content-Type": "application/json", "api-key": api_key}data = {"messages": message,"max_tokens": 4096,"temperature": 0.8,"frequency_penalty": 0,"presence_penalty": 0,"top_p": 0.95,"stop": None,}url = os.environ.get("GPT4O_ENDPOINT")try:response = requests.post(url, headers=headers, data=json.dumps(data))if response.status_code == 200:return response.json()["choices"][0]["message"]["content"]else:logger.info(f"LLM 调用失败,状态码:{response.status_code},错误信息:{response.text}")except requests.RequestException as e:logger.error(f"请求发生错误:{e}")except Exception as e:logger.error(f"发生未知错误:{e}")

点击轻松实现远程智能交互:OriginBot与钉钉和GPT4o的集成指南——古月居可查看全文

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/51768.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【嵌入式】前言

如今已经很少有产品不涉及到嵌入式,而把这种产品称为嵌入式系统的产品 嵌入式系统的特点就是软件、硬件可以裁切。 嵌入式未来发展趋势,网络化、节能化和智能化。 中国是嵌入式行业中重要的制造者和消费者,但我国还是有很多发展问题&#xf…

JAVA小白学习日记Day10

1.线程锁 使用Runnable接口和Lambda表达式: 在 EasyThreadA 类的 mainA 方法中,通过创建 Runnable 实例 run,并使用Lambda表达式。 EasyThreadA::method 绑定到 run 上。然后创建两个线程 a 和 b,分别启动它们,它们会…

NebulaGraph图数据库使用教程

一、NebulaGraph 是什么? NebulaGraph 是一款开源的图数据库,擅长处理千亿个顶点和万亿条边的超大规模数据集。 NebulaGraph 社区已成长为一个荟聚了众多用户、融合了各类图技术场景实践知识的活跃开源社区。你可以在其中与大家共同交流 NebulaGraph 周…

音视频开发入门很难?可能是你姿势不对

作为程序员,听到最烦的两个词一个是bug,在开始前刚好我有一些资料,是我根据网友给的问题精心整理了一份「音视频开发的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大…

深度学习之优化器(简要总结)

优化器是用于训练神经网络模型的关键组件,它们决定了模型参数如何根据损失函数的梯度进行更新。不同的优化器具有不同的特性和适用场景。 下面将介绍几种常见的深度学习优化器,以及基于pytorch版本的定义和使用方法。 1.SGD(Stochastic Gra…

【书生大模型实战】L1-书生大模型全链路开源体系

一、关卡任务 观看本关卡视频后,写一篇关于书生大模型全链路开源开放体系的笔记。 视频链接:【书生浦语大模型全链路开源体系】 https://www.bilibili.com/video/BV1Vx421X72D/?share_sourcecopy_web 二、实验过程 书生浦语大模型全链路开源体系&am…

JavaScript字符串转换成base64编码方法

// base64编码表 const base64EncodeChars ref<string>("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789/" );/*** base64编码* param {Object} str*/ const base64encode (str: string) > {let result "";// 循环遍历字符串…

银行贷款信用评分不足?大数据帮你找回失去的“分”

在这个信息爆炸的时代&#xff0c;无论是个人还是企业&#xff0c;数据都成为了衡量信用和评估风险的重要依据。贷款、融资、求职甚至是日常消费&#xff0c;都可能因为一份好的数据报告而变得更加顺畅。那么&#xff0c;如何高效地查询自己的大数据&#xff0c;面对评分不足时…

Typescript配置文件(tsconfig.json)详解系列五:allowArbitraryExtensions

前言 本文使用的Typescript版本为5.5.2 配置 {compilerOptions: {"allowArbitraryExtensions": true} }说明 allowArbitraryExtensions是typescript5.x后加入的字段&#xff0c;允许我们可以导入任何后缀名的文件。 并且我们必须要有一个和这个文件配套的类型声明…

【持续集成_02课_Jenkins+Git+Gogs综合应用】

https://www.cnblogs.com/xfeiyun/p/17510472.html Jenkins部署及持续集成——傻瓜式教程-腾讯云开发者社区-腾讯云 一、Jenkins安装 Jenkins由Java语言编写而成&#xff0c;安装包即是一个war包。因此&#xff0c;Jenkins的运行启动依赖于Java环境&#xff0c;同时&#xf…

G120 EPos配置方案及应用场景

EPos功能就是基本定位器功能,它可计算出轴的运行特性,使轴以时间最佳的方式移动到目标位置。EPos功能主要包括:设定值 直接给定(MDI)功能、 选择程序段功能、回参考点功能、点动功能、运行到固定挡块功能。 EPos功能通过处理给定的加速度、速度和位置值生成运行特性曲线,…

正则采集器之四——采集网站管理

本文介绍正则采集器的采集网站管理的开发。 系统需要动态添加采集网站&#xff0c;对网站地址、名称、匹配商品的正则表达式字段进行设置。 新建数据库表 CREATE TABLE item_website (id bigint NOT NULL AUTO_INCREMENT,code varchar(16) CHARACTER SET utf8mb4 COLLATE ut…

springbootsecurity整合thymeleaf

首先创建一个springboot项目 然后加入相关依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation&q…

昇思 25 天学习打卡营第 15 天 | mindspore 实现 VisionTransformer 图像分类

1. 背景&#xff1a; 使用 mindspore 学习神经网络&#xff0c;打卡第 15 天&#xff1b;主要内容也依据 mindspore 的学习记录。 2. Vision Transformer 介绍&#xff1a; mindspore 实现 VisionTransformer 图像分类&#xff1b;VisionTransformer 论文地址 VisionTransfo…

深入分析MiniQMT实时订阅延迟测试代码

摘要 本文将深入分析两段MiniQMT平台的Python代码&#xff0c;这些代码用于测试实时数据订阅的延迟情况。我们将详细探讨代码的结构、关键功能以及它们在实时交易策略中的应用&#xff0c;并通过代码示例展示其工作原理。 背景介绍 MiniQMT是一个量化交易平台&#xff0c;支…

Redis是多线程还是单线程?

文章目录 1、用户态和内核态2、阻塞IO3、非阻塞IO4、IO多路复用4.1 select4.2 poll4.3 epoll4.4 epoll中的ET和LT4.5 epoll的服务端流程 5、信号驱动6、异步IO7、对比8、Redis是单线程的吗&#xff1f;9、单线程多线程网络模型变更 1、用户态和内核态 1、ubuntu和Centos 都是Li…

KADB heap表VS AO表插入数据测试

单条插入数据准备&#xff1a; test# \d test Table "public.test" Column | Type | Modifiers ------------------------------------------ a | integer | b | character varying(20) | Distributed by: (a) test# in…

day 02

作业&#xff1a; 1> 写一个日志文件&#xff0c;将程序启动后&#xff0c;每一秒的时间写入到文件中 1、2024- 7-29 10:31:19 2、2024- 7-29 10:31:20 3、2024- 7-29 10:31:21 ctrlc:停止程序 ./a.out 4、2024- 7-29 10:35:06 5、2024- 7-29 10:35:07 6、2024- 7-29 10:3…

轻松入门Linux—CentOS,直接拿捏 —/— <2>

一 、权限问题详细讲解 读写的权限可以分别写成 r, w, x 总共有九个权限&#xff0c;可以分组三大组分别是&#xff1a; user&#xff1a;当前文件所属用户的权限 group&#xff1a;与当前文件所属用户同一组的用户权限 others&#xff1a;其他用户的权限 故使用 u, g, o 来代表…

从装机到冯·诺依曼架构,揭秘计算机的硬件组成

在当今数字化的时代&#xff0c;计算机已经成为我们生活和工作中不可或缺的一部分。从日常办公到科学计算&#xff0c;从畅玩游戏到无人驾驶&#xff0c;计算机简直无所不能。而这一切的背后&#xff0c;离不开其精密而复杂的硬件组成。今天&#xff0c;我们将一起探索计算机的…