Asp.net core应用在 Kubernetes上内存使用率过高问题分析

原文:https://blog.markvincze.com/troubleshooting-high-memory-usage-with-asp-net-core-on-kubernetes/

ps:我不是死板翻译原文的,尽量的通俗一点,如有不对欢迎指出,谢谢哈。

在生产环境中,我们把asp.net core api应用通过Kubernetes 部署在了Google Cloud (GCE—Google Container Engine)。我们发现大多数的组件(core应用)的内存使用率都不合理。我们把应用的内存限制设置成了500MB, 并且还发现了很多api应用实例因为超过了内存限制而被Kubernetes 不断的重启(应该docker设置了--restart)。

下面2张图是我们其中的2个api,当Kubernetes重启他们时,你会发现他们先是一直增长,然后到达了内存限制的点。

 针对于这个现象我们花了很多时间来调查这个issue,期间尝试过通过抓dumps来分析,但是并没有发现问题所在。

我们也尝试使用多种方式,在我们的开发环境来复现这个问题:

  • in dev configuration in VS

  • on Windows with a production build

  • on Ubuntu with a production build

  • in Docker, using the actual production image

但是上述环境下,他们都没有超过500mb的内存使用情况,都是增长到100-150mb左右就停止了。

期间,为了减轻容器因为超过限制的最大内存而频繁重启我们将内存限制从500mb增加到1000mb,在此之后,有趣的是内存的使用情况变得如下图所示:

测试下来发现内存的使用并不是无限制的增大的,但是也是封顶600mb左右,并且这个数字在不同的容器实例以及实例重启之后近乎保持一致。

这个现象清楚的表明我们的容器中的应用并没有内存泄漏,只是有一块内存被分配了而没有得到释放。所以我开始把关注点转移到“运行在Kubernetes的.net程序是如何限制内存的“。

事实上Kubernetes最终也是将程序运行在docker容器中的,并且docker容器可以通过docker run --memory参数来限制内存的使用。所以我怀疑也许是Kubernetes并没有传递任何有关内存限制的参数到docker容器实例中,所以.net程序理所当然的认为当前机器有好多好多的可用内存可以使用。

但是并不是这种情况,我们发现相反的内容(因为作者怀疑是Kubernetes没有传递和内存相关的参数)在the documentation.

The spec.containers[].resources.limits.memory is converted to an integer, and used as the value of the --memory flag in the docker run command.

(这句话的意思是Kubernetes的spec.containers[].resources.limits.memory会自动沿用docker run中的--memory参数所设置的整数值)

这似乎又到了另一个死胡同了。我也尝试在自己电脑里的docker中运行api程序,并且通过--memory参数传递多种内存限定值,但是1.我不能复现上述600mb内存使用的场景,内存只保持在150mb左右,2.也没有观察到容器实例运行的超过它的内存限制,即使我通过--memory参数来指定一个小于150mb的值,这个容器实例依然能够在这个更小的内存限定值下运行的完好。

 

很早的时候我也在github上提过一个关于内存泄漏的issue关联到Kestrel(core的一个基于libuv的新的服务器),并且在这一点上,Tim Seaward发了一个有趣的suggestion关于检查我的应用在不同环境下所打印出的cpu的个数,因为cpu的是影响内存使用的一个巨大因素。

我尝试在代码里通过Environment.ProcessorCount在不同的环境下打印出的数量如下:

  • On my machine, just doing dotnet run, the value was 4.

  • On my machine, with Docker, it was 1.

  • On Google Cloud Kubernetes it was 8.

这就能最终给我一个解释了,因为cpu的数量真的会影响内存的使用数量。cpu核数越多,内存使用量也就越多(对于作者来说,他还不是确切的了解gc的类型,cpu的核数,与.net程序所使用内存的大小之间的关系,虽然this post这个链接包含了有关GC的资料)。

最终的建议呢,就是把GC模式从Server GC(服务器模式)切换到Workstation GC(模式),这样就能达到低内存使用率的优化效果。只需要在csproj项目文件中做如下动作:

<PropertyGroup> <ServerGarbageCollection>false</ServerGarbageCollection></PropertyGroup>

做了这个改动后,重新发布我的api,结果就如乡下所示(蓝色的线):

workstation gc模式使得应用对于内存的使用变得更加”保守“,并且内存的使用从大约600mb降低到了100到150mb之间。假设工作站模式是通过牺牲一些性能和吞吐量来实现这个”600mb到150mb的效果“话(据官当服务器模式在某些场景下是相对优于工作站模式的),但是迄今为止我并没有发现任何api速度和吞吐量的衰减,虽然我的这个api并不是一个对性能有着及其苛刻的要求。

 

通过这个故事总结到:OS,可用内存,cpu核数都是定位内存问题的关键因素,因为他们会大量影响想着.net的GC。如果你被问题卡住了,请不要犹豫的把问题抛出来,并且在很多.net 社区里面有很多极好的人会很乐于助人。

 =============================================分割线========================================

小弟我们公司下的项目也是这个问题,当时困扰了好久,为什么呢,因为之前在windows下面,内存占用不会”太明显“,因为GC起到了决定性的作用,但是在core的环境下,在加之docker+linux,遇到这样的时当时一度怀疑是docker的问题,当时也没有像这位国外友人这样去分析这个问题。通过这个问题我学到了如下:

1.学到了这位老哥定位思考问题的步骤,从是否是k8s的问题-》多环境问题-》github issue-》自己动手去类比推测-》最终解决问题。

2.GC的知识点补充:this post

3.除此之外还有很多知识点都隐藏到了:suggestion(希望大家仔细再看看)

4.我没记错的之前英文的官档里,讲项目配置文件的一节中提到了GC的配置

一开始(对GC的2种类型还不了解的情况),正常人看到这个true指的是激活该应用程序的GC垃圾回收,而并没有注意到老外所调查的结果(true其实是指的激活服务器GC模式,false不是指不GC,而是指的使用工作站GC模式),我能说微软是否能够稍微“贴心点”指出true和false的真正区别(其实是我们自己.net研究的还不够透彻,哈哈哈),这样就不会有像我,像这个老外一样,对于跑在docker容器里的core应用内存占用率过高而表示“质疑”。

ps:我们生产已改成false,当然true也没问题,只不过服务器内存被“只吃不拉”而已。

原文地址:http://www.cnblogs.com/eastpig/p/7822892.html


.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/322914.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue cli 4.x打包后如何部署到tomcat服务器上

使用npm run build打包好dist后&#xff0c;不能直接打开里面的index.html&#xff0c;否则页面是一片空白 这时候我们就需要用服务器来代理我们的页面&#xff0c;可以使用ningx&#xff0c;tomcat&#xff0c;或者apache&#xff0c;这里我们使用tomcat当作范例 找到tomcat的…

欢乐纪中某B组赛【2019.1.26】

前言 空间开小导致无法AKQVQAKQVQAKQVQ 成绩 RankRankRank是有算别人的 RankRankRankPersonPersonPersonScoreScoreScoreAAABBBCCC6662017myself2017myself2017myself2102102101001001006060605050508882017zyc2017zyc2017zyc2002002001001001001001001000002323232017lw2017l…

依赖注入和控制反转

概念 IoC——Inversion of Control 控制反转 DI——Dependency Injection 依赖注入 要想理解上面两个概念&#xff0c;就必须搞清楚如下的问题&#xff1a; 参与者都有谁&#xff1f; 依赖&#xff1a;谁依赖于谁&#xff1f;为什么需要依赖&#xff1f; 注入&#xff1a;…

Hadoop生态Flume(一)介绍

一、概述 Apache Flume是一个分布式&#xff0c;可靠且可用的系统&#xff0c;用于有效地收集&#xff0c;聚合大量日志数据并将其从许多不同的源移动到集中式数据存储中。 Apache Flume的使用不仅限于日志数据聚合。由于数据源是可定制的&#xff0c;因此Flume可用于传输大量…

centos7安装最新版node

为了在linux服务端运行前端以及node后端项目&#xff0c;就必须在服务器上安装node了 但是想要运行前端项目版本就必须是8.x以上的&#xff0c;所以我们干脆安装最新的node 下载 进入下面的官方网站 https://nodejs.org/en/download/ 点击64位的Linux下载 复制该网址 这里以…

P3388-[模板]割点(割顶)【tarjan】

正题 题目大意 求所有割点 解题思路 跑tarjantarjantarjan&#xff0c;然后判断dfnx≤lowydfn_x\leq low_ydfnx​≤lowy​ codecodecode #include<cstdio> #include<algorithm> #define N 20100 #define M 100100 using namespace std; struct node{int to,next…

[译]ASP.NET Core 2.0 网址重定向

问题 如何在ASP.NET Core 2.0中实现网址重定向&#xff1f; 答案 新建一个空项目&#xff0c;在Startup.cs文件中&#xff0c;配置RewriteOptions参数并添加网址重定向中间件&#xff08;UseRewriter&#xff09;&#xff1a; public void Configure(IApplicationBuilder app, …

Hadoop生态Flume(二)安装配置

一、flume下载地址 列中的链接应显示可用镜像的列表&#xff0c;并根据您的推断位置进行默认选择。如果看不到该页面&#xff0c;请尝试使用其他浏览器。校验和和签名是主分发服务器上原始文件的链接。 Apache Flume二进制文件&#xff08;tar.gz&#xff09;apache-flume-1.…

小程序如何将wx.request里的数据传出去

设置一个事件&#xff0c;用来测试 用类似于vue中的this.msg result.data[1].receiver并不能把值传出去 但是用setData却可以&#xff0c;代码如下 btnclick:function(){var that this;wx.request({url: http://www.k1998.xyz/kjh/reciever.php,success: (result) > {cons…

纪中2019(上)游记+总结

目录之下 文章目录目录之下游记之下Day−1Day-1Day−1Day0Day0Day0Day1Day1Day1Day2Day2Day2Day3Day3Day3Day4Day4Day4Day5Day5Day5Day6Day6Day6Day7Day7Day7Day8Day8Day8Day9Day9Day9Day10Day10Day10Day11Day11Day11Day12Day12Day12Day13Day13Day13Day14Day14Day14比赛之下欢乐…

asp.net core WebAPI实现CRUD

本节用于构建一个简单的WebAPI来管理to-do列表。不会创建用户界面。 API Description Request body Response body GET /api/todo Get all to-do items NoneArray of to-do items GET /api/todo/{id} Get an item by ID NoneTo-do item POST /api/todo Add a new item To-do it…

Hadoop2.6.0的Intellij Idea 插件

一、Hadoop2.6.0的Idea Intellij插件下载 github源码地址 github插件压缩包 二、安装插件 setting》Plugins》install plugins from disk 选择压缩包&#xff0c;重启Idea就行 安装完的结果&#xff1a;

v-for指令案例详解

对于v-for指令&#xff0c;以前老是不能理解&#xff0c;经常记混&#xff0c;所以特地写篇笔记来加强下记忆&#xff0c;希望借此能学的更深刻一点 v-for顾名思义就是个for循环&#xff0c;是vue的一个循环。在遍历json字符串的时候有奇佳的效果&#xff0c;感觉就是为他们而造…

jzoj1273-袁绍的刁难【进制转换】

正题 题目大意 第iii个武将价值为3i−13^{i-1}3i−1&#xff0c;求第kkk大的选择武将价值之和 解题思路 因为∑i0n−13i<3n\sum_{i0}^{n-1}3^i<3^{n}∑i0n−1​3i<3n 所以其实答案就是kkk转成二进制之后强行转成3进制的值。 codecodecode #include<cstdio> …

Docker ASP.NET Core 2.0 微服务跨平台实践

本篇博文的目的&#xff1a;在 Mac OS 中使用 VS Code 开发 ASP.NET Core 2.0 应用程序&#xff0c;然后在 Ubuntu 服务器配置 Docker 环境&#xff0c;并使用 Docker 运行 Consul 和 Fabio 环境&#xff0c;最后使用 Docker 运行 ASP.NET Core 2.0 应用程序。 你要的项目源码&…

Vue之splice和push

methods:{getIt(){this.list.push({name:"aaa"}) },delIt(){this.list.splice(0,1)}}对于splice() 前面的是序列号&#xff0c;后面的是删除的个数 序列号为1的时候&#xff0c;从后面删 序列号为0的时候&#xff0c;从前面开始删 序列号为2或者2以上的时候&#xff…

微软Connect(); 2017大会梳理:Azure、数据、AI开发工具

在今天召开的 Connect(); 2017 开发者大会上&#xff0c;微软宣布了 Azure、数据、AI 开发工具的内容。这是第一天的 Connect(); 2017 的主题演讲。 在开场视频中霍金又来了。你记得这个Intel为他开发的系统使用了C#&#xff0c;而且是开源的&#xff0c;在Github上地址&#x…

jzoj5230-队伍统计【状压dp】

正题 题目大意 nnn个人排队&#xff0c;mmm个条件(u,v)(u,v)(u,v)表示uuu要排在vvv前&#xff0c;可以去掉kkk个&#xff0c;求方案总数 解题思路 考虑依次插入人在队头 对于状态1表示已经在队列里&#xff0c;0表示不在 fi,jf_{i,j}fi,j​表示iii表示状态,jjj表示违背了的条件…

Hadoop生态hive(五)Hive QL数据库

&#xff08;1&#xff09;查看数据库 show databases; &#xff08;2&#xff09;使用数据库 use db; &#xff08;3&#xff09;查看当前数据库 #与mysql的select database();不一样 select current_database(); &#xff08;4&#xff09;创建数据库 create database [if …

TypeError: Cannot set property 'msg' of undefined

在axios中想把数据取出来 this. msg “kkk” 但是却报TypeError: Cannot set property ‘msg’ of undefined的错误 后来找到&#xff0c;原来是自己没有函数不是箭头函数导致的 如果不是箭头函数的话&#xff0c;this的指向就会有问题&#xff0c;然后一直报错 将一下代码改为…