【OceanBase诊断调优 】—— 建索引执行报错问题排查

背景

建索引可能因各种各样的原因产生报错,本文主要介绍碰到建索引报错时,如何定位到建索引报错的日志,方便后续进一步使用工具一键收集日志/根因分析,分析根本原因。

备注:此文档中涉及的语句适用于版本号>=4.2.3和 >= 4.3的。

问题排查

建索引主要分为几个阶段

  1. 发送RPC给RS执行建索引的第一步schema变更,并生成调度任务
  2. RS按照状态机执行调度任务,具体分为如下步骤
    1. 等事务结束
    2. 数据补全
    3. 校验checksum
    4. 索引表生效
    5. 失败/成功清理
  1. 建索引的工作线程刷新到RS执行任务完成,返回结果

建索引报错的日志分析的基本思路是根据建索引的基本步骤,判断建索引失败在哪一步,然后决策收集哪些机器的日志,排查的基本步骤如下

  1. 获取DDL报错表格的名字和租户的名字,可以作为输入参数
  2. 根据表格名字和租户名字,获取table_id,tenant_id
select tenant_id from __all_tenant where tenant_name = '租户名';
select table_id from __all_virtual_table where table_name = '表名' and tenant_id = '租户id';
  1. 根据索引名,查询到索引表ID
1. 根据索引名,查询索引表的id
select table_id from __all_virtual_table_history where tenant_id = 'xxx' and data_table_id = 'xxx' and table_name like '%索引名%';
  1. 根据索引表ID,查询__all_virtual_ddl_error_message表格中是否有记录(select task_id from __all_virtual_ddl_error_message where tenant_id = 'xxxx' and object_id = 'xxxx'),如果无记录,那说明失败在发送RPC,打印出信息,提示此时需要人工接入排查(这里后续梳理出需要添加的信息方便排查问题),否则进入步骤5
  2. 根据__all_virtual_ddl_error_message中查询到的task_id字段,查询__all_rootservice_event_history表(select event, trace_id,value6,rs_svr_ip, rs_svr_port from __all_rootservice_event_history where tenant_id = xxxx and value4 = 'task_id' and value2 != 0 and event != 'switch_state' and event not like 'index build task process fail' order by gmt_create desc limit 1;),根据失败所在的步骤,决策收集的信息,如果event字段的值为是ddl wait trans end ctx try_wait,那么进入步骤6,如果是 index sstable build task finish,那么进入步骤7,如果是其他的步骤,那么进入步骤8
  3. 如果是在等事务结束阶段失败,也就是event的名字为ddl wait trans end ctx try_wait,那么根据trace_id,去捞主表所有的tablet所在leader节点的日志
  4. 如果是在补数据阶段失败,那么根据value6字段解析出补数据失败的observer地址,根据observer地址以及trace_id,捞取observer对应的日志
  5. 如果是其他阶段失败,那么根据trace_id,以及rs_svr_ip和rs_svr_port来捞取执行时主RS的日志

OceanBase敏捷诊断工具相关链接:

github仓库GitHub - oceanbase/oceanbase-diagnostic-tool: OceanBase Diagnostic Tool is designed to help OceanBase users quickly gather necessary information and analyze the cause of the problem.
rpm包下载OceanBase分布式数据库-海量数据 笔笔算数
文档链接OceanBase分布式数据库-海量数据 笔笔算数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/346.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vivo怎么录屏?玩转手机新体验!(2024最新)

“最近新入手了一款vivo手机,感觉用起来真的很顺手,各种功能都很强大。昨天和朋友一起打游戏,突然想到要记录下精彩瞬间,但是找遍了手机,都没有找到录屏功能。我想请教一下各位vivo手机用户,你们通常在哪里…

深入剖析Tomcat(三) 实现一个简易连接器

Tomcat中的servlet容器叫做Catalina,Catalina有两个主要模块:连接器与容器。在本章,将会建立一个连接器来增强第二章中应用程序的功能,用一种更好的方式来创建request与response对象。 截止文章编写日期,servlet规范已…

ES Master 和data节点分别的职责

目录 Elasticsearch Master 节点 职责 特点 Elasticsearch Data 节点 职责 特点 通俗解释 Elasticsearch Master 节点 职责 集群管理: Master 节点负责整个集群的管理工作,包括集群的配置和控制。元数据管理: 维护集群的状态,包括索引的创建、删…

网络流的C++代码实现与过程讲解

网络流是一种非常重要的图论算法,它在许多实际问题中得到广泛应用。本文将介绍网络流算法的C++代码实现与过程讲解。 算法概述 网络流算法是通过将图中的边看作流量通道,将图的点看作流量的起点或终点,来求解图中的最大或最小流量的问题。它是一种非常重要的最优化算法,广…

DM数据库一次redo日志损坏修复的经历

1 缘由 服务器意外断电了,重新上电后发现DM数据库不能连接,提示网络通信异常,数据库拒绝连接。通过服务查看器发现数据库服务停止,并且手动启动失败,codeexited,status1/failure。 2 问题排查 网上查资料说…

Python教学入门:列表与元组

列表(Lists): 定义: 列表是 Python 中最常用的数据类型之一,用于存储一组有序的元素。列表使用方括号 [] 定义,元素之间用逗号 , 分隔。 特点: 列表是可变的(Mutable)…

WebSocket发送与接收数据

创建websocket对象,参数为服务器websockets地址: websocket new WebSocket("ws:127.0.0.1:7001"); 1、发送文本数据 websocket.send(我太笨了,不知道你说的是啥) 2、发送对象数据 发送对象的话需要通过 JSON.parse() 和JSON.…

Java梳理

梳理 1.ResponseBody return “hello world!” 当需要返回一个值的时候,需要使用到ResponseBody RestControllerControllerResponseBody 1.1没有Controller就不能写 GetMapping("/hello") public String sayHello() { return "Hello, wor…

HQL,SQL刷题,尚硅谷(中级)

目录 相关表结构: 1、order_info表 2、order_detail表 题目及思路解析: 第一题,查询各品类销售商品的种类数及销量最高的商品 第二题 查询用户的累计消费金额及VIP等级 第三题 查询首次下单后第二天连续下单的用户比率 总结归纳&#xff1a…

【双指针】

目录 1. LeetCode 283. 移动零 1.1 题目描述 1.2 题目思路 1.3 实现代码 2. LeetCode 1089. 复写零 2.1 题目描述 2.2 题目思路 2.3 实现代码 3. LeetCode 202. 快乐数 3.1 题目描述 3.2 题目思路 3.3 实现代码 4. LeetCode 11. 盛水最多的容器 4.1 题目描述 …

Debian12 中重新安装MSSQL 并指定服务器、数据库、数据表字段的字符排序规则和默认语言等参数

在 Linux 上配置 SQL Server 设置 - SQL Server | Microsoft Learn 零、查看sql server 服务器支持的字符排序规则 SELECT Name from sys.fn_helpcollations() where name Like Chinese% go------ Chinese_PRC_CI_AI Chinese_PRC_CI_AI_WS Chinese_PRC_CI_AI_KS Chinese_PRC_…

CV 面试指南—深度学习知识点总结(3)

本期专栏文章: CV 面试指南—深度学习知识点总结(1)CV 面试指南—深度学习知识点总结(2)CV 面试指南—深度学习知识点总结(3)CV 面试指南—深度学习知识点总结(4)CV 面试指南—深度学习知识点总结(5)

FPGA中闪灯程序设计示例

在FPGA设计中,闪灯的作用主要是用于测试和验证设计的功能和性能。具体来说,闪灯可以作为一个可视化的指示器,通过控制LED灯的闪烁模式和频率,来显示FPGA的工作状态或调试信息。 例如,在设计过程中,可以编写…

政安晨:【Keras机器学习示例演绎】(二)—— 使用 DeepLabV3+ 进行多类语义分割

目录 简介 下载数据 创建 TensorFlow 数据集 构建 DeepLabV3 模型 训练 利用色图叠加进行推理 对验证图像进行推理 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: TensorFlow与Keras机器学习实战 希望政安晨的博客能够对您有所裨益…

vue3 emits: [‘update:modelValue‘]

在 Vue.js 中,emits 选项用于声明组件可以触发的事件。[update:modelValue] 是 Vue 3 中用于自定义组件与 v-model 指令配合工作的特殊事件名。 当您使用 v-model 指令与自定义组件进行双向绑定时,Vue 内部实际上是在做以下操作: 将 value …

手动给docusaurus添加一个搜索

新版博客用docusaurus重构已经有些日子了,根据docusaurus的文档上也申请了Algolia,想一劳永逸的解决博客的搜索问题。但是流水有意,落花无情。 algolia总是不给我回复,我只能对着algolia的申请页面仰天长叹。 正常情况的申请 按照docusaur…

map基础知识

map 1.map 的定义和常用函数 1&#xff09;map 的定义 map 是一种关联容器&#xff0c;用于储存一组键值对<key-value pairs>&#xff0c;其中每个键都是唯一的&#xff1b; map 根据键的大小来自动排序&#xff0c;即 less<Key>&#xff0c;并且一般不会改变此…

函数调用栈Function Call Stack与递归

函数调用栈&#xff08;Function Call Stack&#xff09;是计算机内存中用于跟踪函数调用和返回的一种数据结构。在程序执行期间&#xff0c;每当一个函数被调用时&#xff0c;相关的信息&#xff08;例如函数参数、局部变量和返回地址&#xff09;都会被存储在栈内存中。当函数…

(十一)PostgreSQL的wal日志(2)-默认wal日志大小

PostgreSQL的wal日志(2)-默认wal日志大小 PostgreSQL的WAL&#xff08;Write-Ahead Logging&#xff09;日志文件默认大小为16MB是基于对性能和可靠性权衡的结果。这个默认值是在PostgreSQL早期版本中设定的&#xff0c;目的是在维持良好的系统性能和提高数据恢复能力之间找到…

Gitlab: Python项目CI/CD实践

目录 1. 说明 2. 准备工作 2.1 服务器 2.2 开发机hosts文件 2.3 项目 3. 步骤过程 3.1 建仓Fastapi T1 3.2 开发机测试构建与推送 ​编辑 3.3 在工作站添加gitlab-runner 3.4 提交代码&#xff0c;查看Pipelines结果 3.5 观察部署情况 4. 参考 1. 说明 分别以一个…