X2Doris使用指南:界面化数据迁移工具 - 轻松实现整库迁移至Doris

什么是X2Doris

X2Doris 是 SelectDB 团队开发的,专门用于将各种离线数据迁移到 Apache Doris 中的核心工具,该工具集 自动建 Doris 表数据迁移 为一体,目前支持了 Apache Doris/Hive/Kudu/StarRocks 数据库往 Doris 或 SelectDB Cloud 迁移的工作,整个过程可视化的平台操作,非常简单易用。

安装部署

参考官网文档:https://docs.selectdb.com/docs/ecosystem/x2doris/x2doris-deployment-guide

使用指南

参考官网文档:https://docs.selectdb.com/docs/ecosystem/x2doris/x2doris-use-guide

常见问题

推荐使用最新版本的X2Doris,目前仅支持jdk8
使用文档参考:https://docs.selectdb.com/docs/ecosystem/x2doris/x2doris-use-guide

1.0.4版本的X2Doris支持Doris、Hive、StarRocks、Kudu导入Doris/Selectdb/Cloud

目前Doris 2 Doris 不支持bitmap类型,1.2系列版本不支持DATETIMEV2、DATEV2,2.1.2版本及之后读DATETIMEV2、DATEV2也有问题,后续考虑支持

1、首先确认源端和目标端的fe 8030/9030 be 9060/8040是否通的,源端有读取权限,目标端都有建表,写入的权限

2、使用Hive 的时候要确认下基础环境

验证方法,在安装x2doris 的机器上执行hive的命令,看是否能连上hive,然后执行show databases;看下
获取 Hive 元数据方式,目前支持三种:JDBC,阿里云 DLF,Metastore,直接在conf里面的hive修改即可

3、Hive的jdbc的连接形式在lib下面放连接的jar包
hive_jdbc.jar
hive_service.jar
报错截图
[图片]

4、hive2doris的时候建表能够成功,但是启动任务的时候,报错找不到库

确保spark的conf目录下有hive-site.xml
然后提交任务的时候加上 spark.sql.catalogImplementation=hive
报错截图

5、 get_next failed: out of sequence response: expected 4 but got 620757195
这是某个字段的值很大造成的,这个在205的版本后修了,新加了一个变量 max_msg_size_of_result_receiver 来控制返回结果的行数

6、前端报错提示:The number of parameters exceeded the maximum of 1000
在conf的application.yml里面 undertow: buffer-size: 1024的下面加一个这个max-parameters: 2000 重启下

7、ERROR BackendClient: Connect Doris BE{host='...**', port=9060} failed. **

使用telnet 确认 be的9060端口是否能够连通

8、Doris server Doris BE{host='...', port=9060} internal failed, status code [NOT_FOUND] error message is null

not found 这个就是读取的时候发现读取的tablet在这个be上面找不到副本了,副本迁移导致的问题。迁移过程不要有导入任务

9、The status of open scanner result from Doris BE{host=‘127.1.1.1’, port=9060} is ‘INVALID_ARGUMENT’, error message is:[(127.1.1.1)[INVALID_ARGUMENT]Unknown primitive type(17)]

Doris 不支持 thrift 读取 bitmap类型,暂时无解

10、如果导入少数据,yarn模式下可以设置下面的saprk参数(根据自己的情况来)

可以设置spark.executor.heartbeatInterval=300s
spark.network.timeout=320s
spark.driver.memory=4g
spark.executor.memory=6g

11、查询hive报错 Invalid method name: ‘get_table_req’

spark与hive的版本不兼容造成的,可能是由于hive的版本较低,启动任务的时候可指定下面两个参数(以2.1.1为例)
spark.sql.hive.metastore.version=2.1.1
spark.sql.hive.metastore.jars=/path/hive/lib/* (指定路径)
或者把这两个配置写到 spark/conf/spark-defaults.conf 文件里

12、X2Doris提交任务后,Spark报错数据库不存在: NoSuchDatabaseException: Database ‘dw_srclog’ not found

hive里conf的下hive-site.xml文件 拷贝到spark的conf

也可能是其他版本集成版本的hive版本没有匹配,比如星环的,华为云的等等

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/842125.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一屏万象,场景无限:蓝牙墨水屏标签多功能多场景应用带您领略未来

在数字化浪潮汹涌澎湃的今天,智能科技产品层出不穷,它们不仅极大地改变了我们的生活方式,更在无形中拓宽了我们的视野。而今,一款融合了创新技术与实用性于一体的蓝牙墨水屏标签,正以其多功能多场景应用的特性&#xf…

strstr的使⽤和模拟实现

strstr(function) Returnsa pointer to the irst occurrence of str2 in str1, or a null pointer if str2 is not part of str1. (函数返回字符串str2在字符串str1中第⼀次出现的位置)。 The matchingprocess doesnot include t…

无线麦克风什么品牌好?一文读懂无线领夹麦克风哪个品牌音质最好

​当我们谈论到演讲、表演或者录制视频时,一个高质量的无线麦克风能够使得整个体验提升至一个全新的水平。它不仅能够保证声音的清晰度和真实度,还能够让使用者在演讲或者表演时更加自信和舒适。基于对市场的深入研究和用户体验的考量,我挑选…

在微信公众号怎么添加留言板功能

在如今信息爆炸的时代,微信公众号已成为企业与用户互动的重要桥梁。如何在这个平台上脱颖而出,吸引用户的眼球,提升用户黏性,成为每一个公众号运营者都需要思考的问题。今天,我们就来聊聊如何在微信公众号中巧妙添加留…

车辆相关识别API优化您的车辆系统

车辆相关识别API是开发者们所需的重要工具,它们基于先进的计算机视觉和深度学习技术,提供了强大的车辆识别和分类能力。这些API能够从图像或视频中快速准确地识别和提取车辆的关键信息,如车辆型号、品牌、颜色等。对于开发者而言,…

【深度学习】最强算法之:人工神经网络(ANN)

人工神经网络ANN 1、引言2、人工神经网络(ANN)2.1 定义2.1.1 定义2.1.2 应用场景 2.2 核心原理2.3 实现方式2.4 算法公式2.5 代码示例 3、总结 1、引言 小屌丝:鱼哥,看新闻没? 小鱼:新闻天天看,啥事大惊小怪的。 小屌…

Python数据分析-心脏病(随机森林预测分析)

本次案例分析用心脏病数据集来做随机森林模型预测 导入基本的数据分析包 import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score…

【Python】【报错解决】【无法安装socket库】No matching distribution found for socket

一、问题描述 如下图,笔者在做一个安全相关的项目时,遇到如下报错: No matching distribution found for socket 在尝试安装socket(套接字)库时报错,报错代码: pip install socket二、原因及解…

【Lexus.4】Executive Sedan——Dismantling Follow-up

文章目录 碰撞测试前后防撞钢梁偏置碰撞A/B/C柱,边梁抗拉、屈服强度 底盘发动机轮上马力零部件供应商 来自2021《懂车大爆炸》——是一档为汽车爱好者、购车者和对汽车结构感兴趣的人提供的专业、生动的教学视频。它通过全拆散的方式,让观众更直观地了解…

路由引入实验(思科)

华为设备参考:路由引入实验(华为) 技术简介 路由引入技术在网络通信中起着重要的作用,能够实现不同路由协议之间的路由传递,并在路由引入时部署路由控制,实现路径或策略的控制 实验目的 不同的路由协议之…

抽样方法你真的懂么?

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、引言:抽样方法的魅力与挑战 二、有放回抽样与无放回抽样的比较 1. 有放回抽…

精通C++ STL(二):string类的模拟实现

目录 string类各函数接口总览 默认成员函数 构造函数 拷贝构造函数 赋值运算符重载函数 析构函数 迭代器相关函数 begin和end 容量和大小相关函数 size和capacity reserve和resize empty 修改字符串相关函数 push_back append operator insert erase clear swap c_str 访…

跨平台之用VisualStudio开发APK嵌入OpenCV(一)

序 本篇是杂谈以及准备工作(此处应无掌声) 暂时不管iOS(因为开发hello world都要年费) 软件: Visual Studio 2019(含Android SDK和NDK编译器等) OpenCV 这是一个女仆级的系列文章&#xf…

探索数据结构:单链表的实践和应用

🔑🔑博客主页:阿客不是客 🍓🍓系列专栏:渐入佳境之数据结构与算法 欢迎来到泊舟小课堂 😘博客制作不易欢迎各位👍点赞⭐收藏➕关注 ​ 一、前言 前面我们学习了数据结构中的顺序表&…

扭蛋机小程序开发,数字化发展对行业带来的优势

随着科技的不断进步和大众对娱乐消费需求的提高,线上扭蛋机得到了快速发展,市场规模不断扩大。线上扭蛋机是基于淘宝的小程序,它以电商的模式让消费者进行虚拟扭蛋,获得各类商品,扭蛋机小程序中的商品包括玩具、IP周边…

线段(线性dp)

题目链接:[TJOI2007] 线段 - 洛谷 思路: f[i][0]表示走完第i行且停在第i行的左端点最少用的步数 f[i][1]同理,停在右端点的最少步数。 那么转移就很简单了,走完当前行且停到左端点,那么一定是从右端点过来的&#x…

算法课程笔记——高斯消元

算法课程笔记——高斯消元 先乘后除&#xff0c;精度 #include<bist/stdc.h>usingnamespacestd; #definemaxn 2800intn,m,x,ans; bitset<N>a[N]; voidgauss(){ intcnt0; for(inti1;i<n;i){ intmaxxcnt1; for(intji1;j<n;j){ …

2024年上半年软件系统架构师考试【回忆版】

文章目录 考试时间考试地点综合知识案例分析1、微服务架构的优点和缺点2、质量属性的6个要素3、分布式锁 Redis的缺点4、MongoDB 存储矢量图的优势 论文回忆版论文一、论单元测试的设计与应用论文二、论大数据模型的设计与应用论文三、论模型驱动的架构设计及应用论文四、论云自…

Android端 可使用Yolov5训练 路标识别

相信大家对于路标识别&#xff0c;红绿灯识别&#xff0c;图形识别opencv中也是一件烦人的事情&#xff0c;其参数是及其受到现实环境因素的影响的&#xff0c;那么今天我就给大家推荐一种方式&#xff0c;缺点是周期长&#xff0c;但其优点是如果训练效果好久对于环境的各种变…

django在线考试系统-计算机毕业设计源码78268

摘 要 本论文主要论述了如何使用python语言、Django框架开发一个在线考试系统&#xff0c;本系统将严格按照软件开发流程&#xff0c;进行各个阶段的工作&#xff0c;面向对象编程思想进行项目开发。在引言中&#xff0c;作者将论述该系统的当前背景以及系统开发的目的&#xf…