docker的资源限制参数设置错误,导致的clickhouse性能瓶颈

文章目录

    • 使用场景
    • 问题现象
    • 解决处理

使用场景

  • 我们使用docker作为服务的虚拟化工具,服务都部署在docker里
  • 我们使用docker-compose管理所有docker服务的配置文件
  • 针对某些服务,我们要限制这个docker服务容器占用的资源数量,例如cpu和内存
  • 在进行配置时,网上搜了一些文章,进行了设置,导致了本次错误(低级错误,还是要去官方网站学第一手知识)
  • 此次问题是在公司测试环境发现的,主要做一些功能测试,不用于性能测试,故只设置了很小的资源,反而发现了此问题
  • 出问题的是大数据组件clickhouse容器,针对clickhouse数据库的docker配置如下:
  clickhouse:image: yandex/clickhouse-servercontainer_name: clickhouseports:- 8123:8123- 9000:9000ulimits:nofile:soft: 262144hard: 262144deploy:resources:limits:cpus: "0.6"memory: 2Gvolumes:- ./volumes/ck/data:/var/lib/clickhouse- ./volumes/ck/log/:/var/log/clickhouse-server/- ./volumes/ck/etc/:/etc/clickhouse-server/- /etc/localtime:/etc/localtimerestart: on-failure

问题现象

  • 之前是把clickhouse数据库,直接部署在服务器上,使用了近一年,没什么问题
  • 前段时间,为了统一部署环境,将clickhouse也使用docker部署,将配置和文件卷映射到服务器
  • 使用docker部署后发现,在写入和查询并发量不大的情况下,clickhouse查询较慢
  • 查看了query_log,发现10万条数据,就用了600ms,很不应该,按理说一亿条数据这么慢还差不多
  • 之前使用clickhouse存储大数据,也没遇到这么慢的。clickhouse查询时,会使用并行查询,10万条应该是毫秒级返回才对

解决处理

  • 和同事交流后,发现cpus参数设置不合理

  • 我之前看着网上的一些文章和翻译,以为这个数字要取小数,是一个比值,是 “服务器cpu总数量 x 比值”,为该docker容器使用的cpu数量(这是我的错误理解

  • 在同事建议下,去看了官方英文文档,果然,我理解错了,这个就是简单的指 cpu数量

  • 官方文档使用小技巧:是官方文档网站里的搜索框,输入英文关键词,基本就可以查找到想要的结果
    在这里插入图片描述

  • 官方文档地址:https://docs.docker.com/compose/compose-file/deploy/#cpus

cpus configures a limit or reservation for how much of the available CPU resources, as number of cores, a container can use.

  • 核心是这句number of cores,很明确,就是数量,案例是设置小数如0.6,是指0.6个cpu,对clickhouse来说,完全不够用。clickhouse并行计算和数据文件块压缩合并,都比较吃cpu,至少要给8个cpu,生产环境,最好是32cpu起
    -除了CPU, 还有一点需要说明的是,clickhouse也比较吃内存,它的内存使用限制要求大于16G,否则也可能存在性能瓶颈和各种意外的报错
  • 仍然贴一篇官方文档:https://clickhouse.com/docs/en/operations/tips#ram

danger
If your system has less than 16 GB of RAM, you may experience various memory exceptions because default settings do not match this amount of memory. The recommended amount of RAM is 32 GB or more. You can use ClickHouse in a system with a small amount of RAM, even with 2 GB of RAM, but it requires additional tuning and can ingest at a low rate.

  • 优化后配置为
   deploy:resources:limits:cpus: "8.0"memory: 16G
  • 查询飞快,问题解决了
  • 当然,针对生产环境,这个配置就不够用了。要针对自己的业务量,进行一个预估,申请足够的cpu和内存配置的服务器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/107938.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

qt软件正常运行的崩溃了定位行号方法

软件(debug版exe或者release版exe)在正常运行状态下(不是gdb调试运行),如果软件崩掉,那么会直接闪退,软件什么也做不了,此时无法保存软件中的状态信息,此外,也…

IPv6知识概述 - ND协议

IPv6知识概述 - ND协议 参考文章:https://blog.csdn.net/Gina_wj/article/details/106708770 IPv6基础篇(四):邻居发现协议NDP ND协议功能概述 ND(Neighbor Discovery,邻居发现)协议是IPv6的…

原创Python文件头注释块

""" File: encapsulate_into_a_test_class.py Description: 将同一个测试类的测试用例封装到那个类当中去,然后将一个project的所有类移动到对应的generated_by_chatgpt/下面 Author: 行步至春深 Date: 2023.10.16 Usage: 直接在图形界面运行 Input …

flutter开发实战-下拉刷新与上拉加载更多实现

flutter开发实战-下拉刷新与上拉加载更多实现 在开发中经常遇到列表需要下拉刷新与上拉加载更多,这里使用EasyRefresh,版本是3.3.21 一、什么是EasyRefresh EasyRefresh可以在Flutter应用程序上轻松实现下拉刷新和上拉加载。它几乎支持所有Flutter Sc…

ICMP协议(二)

一 ping工作原理 ① 为什么ping不通 "ping不通分为两类" 1) 请求没有到目标服务器细节: 要注意是ip不通还是域名不能解析导致ping不通2) 请求到了目标服务器,但是没有回包 "常见原因" 1、对方关机/ip不存在备注: ping同网段不…

SQL 多线程指南

​您是否厌倦了盯着屏幕等待 SQL 查询完成运行?查询时间延迟是数据库管理员和开发人员中的一个常见问题,但事实并非一定如此。优化性能对于任何应用程序的顺利运行都至关重要,而多线程可以改变游戏规则。想象一下能够瞬间提高数据库性能。您可…

java.lang.ClassNotFoundException:javax.xml.bind.DatatypeConverter【解决办法】

在本地运行访问一点问题都没有(JDK1.8),但是部署在云服务器上(JDK11)后,访问救出了下面的报错。 遇到的问题: java.lang.ClassNotFoundException:javax.xml.bind.DatatypeConverter 原因:jdk版本问题 解决方案 方案一&#xff…

记一次MySQL5初始化被kill的问题排查 | 京东云技术团队

写在前面 由于测试环境JED申请比较繁琐,所以Eone提供了单机版Mysql供用户使用,近期Eone搭建Mysql5的时候发现莫名被kill了,容器规格是4C8G,磁盘30G 这不科学,之前都是可以的,镜像没变,配置没变…

k8s-16 k8s调度

调度器通过 kubernetes 的 watch 机制来发现集群中新创建且尚未被调度到 Node上的 Pod。调度器会将发现的每一个未调度的 Pod 调度到一个合适的 Node 上来运行。 kube-scheduler 是 Kubernetes 集群的默认调度器,并且是集群控制面的一部分如果你真的希望或者有这方面…

信息学奥赛一本通-编程启蒙3219:练36.2 不定方程求解

3219:练36.2 不定方程求解 时间限制: 1000 ms 内存限制: 65536 KB 提交数: 955 通过数: 687 【题目描述】 给定正整数a,b,c。求不定方程 axbyc关于未知数x和y的所有非负整数解组数。 【输入】 一行,包含三个正整数a&…

【超级简单】3步 安装conda + pytorch gpu版本

【超级简单】3步 安装conda pytorch gpu版本 1. 创建虚拟环境至于python 3.X和cuda对应 ? 2. 下载cuda 驱动,cuda toolkit (可选)3. 虚拟环境中输入以下指令至于 怎么查看自己电脑对应的cuda版本号 ? 4.测试是否安装成功有疑惑可以再看看这篇…

maven的坐标元素

maven的坐标&#xff1a;使用三个向量在Maven仓库中唯一的定位到一个jar包 * groupId&#xff1a;公司或组织的ID * artifactId&#xff1a;一个项目或者是项目中的一个模块的ID * version&#xff1a;版本号 <groupId>com.gz.maven</groupId> <artifactId&…

企业立案信息API的优势与应用场景

引言 随着科技的不断进步&#xff0c;创业者和企业家们在创办新企业时愈发依赖数字化工具。其中&#xff0c;企业立案信息API成为了一项重要的资源&#xff0c;它提供了有关企业立案的关键信息&#xff0c;为企业家们提供了许多优势和丰富的应用场景。本文将探讨企业立案信息A…

深度学习中需要固定的随机数种子

文章目录 前言random.seed()作用例子Reference np.random.seed()torch.manual_seed() 前言 主要是3个&#xff1a; random.seed()numpy.random.seed()torch.manual_seed() 三个的原理和作用都是相似的&#xff0c;所以接下来我只简单介绍random.seed()。 random.seed() 作…

Spark的数据输入、数据计算、数据输出

PySpark的编程&#xff0c;主要氛围三大步骤&#xff1a;1&#xff09;数据输入、2&#xff09;数据处理计算、3&#xff09;数据输出 1&#xff09;数据输入:通过SparkContext对象&#xff0c;晚上数据输入 2&#xff09;数据处理计算:输入数据后得到RDD对象&#xff0c;对RDD…

MybatisPlus多表关联分页返回结果异常

1. 按照该博客进行多表关联分页查询&#xff1a; https://blog.csdn.net/code_ang/article/details/116448694 2.在实际测试过程中&#xff0c;发现异常&#xff0c;分页返回的结果时而正确&#xff0c;时而错误。 count函数满足预期 count函数不满足预期 只是count了主表的…

竞赛 深度学习YOLOv5车辆颜色识别检测 - python opencv

文章目录 1 前言2 实现效果3 CNN卷积神经网络4 Yolov56 数据集处理及模型训练5 最后 1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; **基于深度学习YOLOv5车辆颜色识别检测 ** 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0…

C++之基于Winsock2封装UDPServer与UDPClient

文章目录 Socket过程UDPServer.hUDPServer.cppUDPClient.hUDPClient.cppmain.cppCMakeLists.txt测试截图 Socket过程 UDPServer UDPClient UDPServer.h #ifndef UDPSERVER_H_INCLUDED #define UDPSERVER_H_INCLUDED#include <iostream> #include <string> #inclu…

Rust-是否使用Rc<T>

Rust的所有权机制&#xff0c;数据允许通过借用的方式&#xff0c;在函数的上下文中传递数据。如果离开数据作用的有效范围&#xff0c;这个借用就会失效&#xff0c;编译就会报错。这也是我们不会将借用(引用&#xff09;作为函数的返回值的原因。下面的代码编译失败。 fn cr…

SAP-FI模块 处理自动生成会计凭证增强

2、固定资产业务过渡科目摘要增强功能-MIGO ENHANCEMENT 2 ZEHENC_SAPMF05A. "active version * FI 20221215&#xff1a;固定资产业务过渡科目摘要增强功能 WAIT UP TO 1 SECONDS.READ TABLE xbseg WITH KEY hkont 1601990001. IF sy-subrc 0.DATA: lt_bkdf TYPE …