MySQL表结构转换为ES索引Mapping

背景

日常开发过程中肯定会存在MySQL表数据迁移至ES的情况,以canal为例,数据迁移时需要提前在ES中创建索引Mapping,但是如果碰到字段特别的表时,创建Mapping将是一件耗费心神的事情。为了解决这些重复工作,我使用Python编写了一个脚本,自动将MySQL中的表结构同步到ES中,本脚本只同步表结构,并不同步表数据,如需同步数据可以采用canal或者logstash等方式进行同步

脚本内容

如果不需要直接同步到es中,需要注释脚本最后一行,该脚本会将转换后的mapping信息打印到控制台中

在这里插入图片描述

import mysql.connector
import requests
import json# MySQL连接配置
mysql_config = {'host': '127.0.0.1','port': '3306','user': 'root','password': '123456','database': 'test'
}# Elasticsearch配置
es_host = '127.0.0.1'
es_port = '9200'
es_index = 'order1'# 新版本es不需求type字段
# es_type = '_doc'def fetch_mysql_table_fields(mysql_config):connection = mysql.connector.connect(**mysql_config)cursor = connection.cursor()# 获取MySQL表字段信息,指定需要转换得表名cursor.execute(f"DESCRIBE {"`order`"}")fields = cursor.fetchall()cursor.close()connection.close()return fieldsdef generate_es_mapping(fields):mapping = {"mappings": {"properties": {}}}for field in fields:field_name = field[0]field_type = field[1]# 根据MySQL字段类型设置Elasticsearch映射类型es_field_type = "text"  # 默认为文本类型if "int" in field_type:es_field_type = "integer"elif "bigint" in field_type:es_field_type = "long"elif "tinyint" in field_type:es_field_type = "short"elif "float" in field_type:es_field_type = "float"elif "double" in field_type:es_field_type = "double"elif "decimal" in field_type:es_field_type = "double"elif "date" in field_type or "datetime" in field_type or "timestamp" in field_type or "time" in field_type:es_field_type = "date"elif "json" in field_type:es_field_type = "object"# 这里可以根据需要添加更多类型的映射mapping["mappings"]["properties"][field_name] = {"type": es_field_type}return mappingdef print_es_mapping(mapping):print(json.dumps(mapping, indent=2))def create_es_index_mapping(es_host, es_port, es_index, mapping):url = f"http://{es_host}:{es_port}/{es_index}"headers = {'Content-Type': 'application/json'}payload = json.dumps(mapping)response = requests.put(url, headers=headers, data=payload)if response.status_code == 200:print(f"Elasticsearch index mapping created for index '{es_index}'")else:print(f"Failed to create Elasticsearch index mapping. Status code: {response.status_code}")print(response.text)if __name__ == "__main__":# 获取MySQL表字段信息table_fields = fetch_mysql_table_fields(mysql_config)# 生成Elasticsearch Mappinges_mapping = generate_es_mapping(table_fields)# 打印Elasticsearch Mapping到控制台print_es_mapping(es_mapping)# 创建Elasticsearch Index Mappingcreate_es_index_mapping(es_host, es_port, es_index, es_mapping)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/625277.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

私域流量怎么运营最有效?

如何有效运营私域流量?这是许多企业和商家都在思考的问题。在当今的数字化时代,私域流量已经成为了企业和商家发展的重要资产之一。但是,如何才能运营好私域流量呢?下面我们将从多个角度来探讨这个问题。 一、什么是私域流量&…

[足式机器人]Part2 Dr. CAN学习笔记-Advanced控制理论 Ch04-3.5连续系统离散化

本文仅供学习使用 本文参考: B站:DR_CAN Dr. CAN学习笔记-Advanced控制理论 Ch04-3.5连续系统离散化

微服务网关的鉴权功能

1 网关如何整合openFeign完成统一鉴权 A 引入openFeign的依赖 B 注入user服务,lazy注解解决循环依赖 C openFeign阻塞线程,网关非阻塞线程,所以改成非阻塞调用 D 加载优先级,提高全局过滤器优先级 E 整合httpMessageConverter F 鉴…

代码随想录第六十三天——被围绕的区域,太平洋大西洋水流问题,最大人工岛

leetcode 130. 被围绕的区域 题目链接:被围绕的区域 步骤一:深搜或者广搜将地图周边的’O’全部改成’A’ 步骤二:遍历地图,将’O’全部改成’X’,将’A’改回’O’ class Solution { private:int dir[4][2] {-1, 0…

业务题day03

3-1 你们的项目是如何进行参数校验的 我们项目中使用Java Bean Validation规范进行参数校验,该规范定义了一组注解,用于对方法参数、类属性等进行校验。 在需要进行参数校验的对象上添加注解,如NotNull、NotBlank、Min、Max等。这些注解可以…

k8s-pod的控制器

pod控制器的概念 工作负载,workload,用于管理pod的中间层,确保pod资源符合预期的状态 预期状态 1、副本数 2、容器的重启策略 3、镜像拉取策略 pod出现故障时的重启等等 pod控制器的类型 1、replicaSet 指定pod副本的数量 三个组件 …

深入浅出关于go web的请求路由

文章目录 前言一、是否一定要用框架来使用路由?二、httprouter2.1 httprouter介绍2.2 httprouter原理2.3 路由冲突情况 三、gin中的路由总结 前言 最近重新接触Go语言以及对应框架,想借此机会深入下对应部分。 并分享一下最近学的过程很喜欢的一句话&am…

架构的未来:微前端与微服务的融合

目录 前言 微服务架构简介 微前端架构简介 微前端与微服务的融合 1. 共享服务 2. 基于事件的通信 3. 统一的身份和认证 4. 交付管道的集成 示例:使用微服务和微前端的电子商务平台 微服务架构 微前端架构 融合微服务和微前端 总结 作者简介…

rollup + typescript 搭建项目

一、创建项目 1、初始化项目 1、创建一个项目目录,进入该目录 2、执行 npm init -y 生成 package.json 3、执行 tsc --init 生成 tsconfig.json 2、安装依赖 (1)安装 typescript 和 rollup-plugin-typescript npm install -D typescript …

明明的随机数【C语言】

【华为机试题 HJ3】明明的随机数 描述输入描述:示例1参考代码1参考代码2描述 明明生成了N个1到500之间的随机整数。请你删去其中重复的数字,即相同的数字只保留一个,把其余相同的数去掉,然后再把这些数从小到大排序,按照排好的顺序输出。 数据范围: 1≤ n ≤1000 ,输入…

【打卡】牛客网:BM93 盛水最多的容器

题目: 考虑到盛水容器的特殊性。双指针从最两边开始遍历,遍历过程中舍弃最小的。 不知道原理。 模板的: class Solution { public:/*** 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可*…

数学建模 | 数学建模常用的十种解题方法

===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u011344545 ===================================================== 数学建模常用的十种解题方法 摘要一、蒙特卡罗算法1 蒙特卡罗计算重积分…

Android基于Matrix绘制PaintDrawable设置BitmapShader,以手指触点为中心显示原图的圆切图,Kotlin(4)

Android基于Matrix绘制PaintDrawable设置BitmapShader,以手指触点为中心显示原图的圆切图,Kotlin(4) 这篇 Android基于Matrix绘制PaintDrawable设置BitmapShader,以手指触点为中心显示原图像圆图,Kotlin&am…

C语言详解之一维数组二维数组以及变长数组

一周新的开始,今天的你学习了吗? 前言 今天打算把数组的相关知识知识复习一下,比如初始化,调用,以及他和指针的关系等等 数组是什么 数组是一种数据结构,它由相同类型的元素组成,并按照一定的…

burp靶场-path traversal

路径遍历 1.路径遍历漏洞 ### 什么是路径遍历 路径遍历也称为目录遍历。这些漏洞使攻击者能够读取正在运行应用程序的服务器上的任意文件。这可能包括&#xff1a; 应用程序代码和数据。 后端系统的凭据。 敏感的操作系统文件。### <img src"/loadImage?filename218…

springCould中的Stream-从小白开始【12】

&#x1f95a;今日鸡汤&#x1f95a; 见过一些人&#xff0c;他们朝九晚五&#x1f62d;&#xff0c;有时也要加班&#xff0c;却能把生活过得很&#x1f60e;有趣。他们有自己的爱好&#xff0c;不怕独处。他们有自己的坚持&#xff0c;哪怕没人在乎。&#x1f926;‍♂️ 开心…

FASTQ 文件压缩格式有哪些?

FASTQ 文件压缩格式 .gz .bz2 .xz .rfq .rfq.xz FASTQ 文件是用于存储测序数据的一种格式&#xff0c;它包含了大量的文本信息&#xff0c;因此通常占用大量的存储空间。为了有效地处理和传输这些数据&#xff0c;通常需要对 FASTQ 文件进行压缩来节省存储空间及传输带宽。以下…

xbox如何提升下载速度?

提高Xbox的下载速度可以通过以下几种方法&#xff1a; 连接稳定的网络&#xff1a;使用有线以太网连接而不是无线连接&#xff0c;因为有线连接通常更稳定且速度更快。 关闭正在运行的游戏和应用程序&#xff1a;运行游戏或应用程序会消耗网络资源和处理能力&#xff0c;关闭它…

Qt点击按钮在其附近弹出一个窗口

效果 FS_PopupWidget.h #ifndef FS_POPUPWIDGET_H #define FS_POPUPWIDGET_H#pragma once#include <QToolButton> #include <QWidgetAction> #include <QPointer>class QMenu;class FS_PopupWidget : public QToolButton {Q_OBJECTpublic:FS_PopupWidget(QW…

Linux Kdump分析宕机问题案例

文章目录 1. 查看问题原因2. 找出哪一行代码触发的宕机3. 查看宕机函数传入参数的值方法一&#xff1a;使用struct查看结构体的值方法二&#xff1a;使用rd命令查看对应内存的值 1. 查看问题原因 GNU gdb (GDB) 7.6 Copyright (C) 2013 Free Software Foundation, Inc. Licens…