阿里云项目启动OOM问题解决

在这里插入图片描述

问题描述

随着项目业务的增长,系统启动时内存紧张,每次第一次启动的时候就会出现oom第二次或者第n的时候,就启动成功了。

带着这个疑问,我就在阿里云上提交了工单,咨询为什么第一次提交失败但是后面却能提交成功尼?

解决方案

就按照提交工单的时间线看看就行:

问题描述

[10018:0x1b45650]    64727 ms: Mark-sweep 863.6 (895.3) -> 857.2 (895.6) MB, 312.0 / 0.4 ms  (average mu = 0.272, current mu = 0.172) allocation failure scavenge might not succeed
[10018:0x1b45650]    65096 ms: Mark-sweep 865.3 (895.6) -> 858.1 (896.1) MB, 302.1 / 0.4 ms  (average mu = 0.229, current mu = 0.181) allocation failure scavenge might not succeed<--- JS stacktrace --->FATAL ERROR: Ineffective mark-compacts near heap limit Allocation failed - JavaScript heap out of memory

售后工程师
2024-09-22 00:02:10
已收到您提交的问题

售后工程师
2024-09-22 00:02:36
请问这个报错是什么地方输出的,麻烦详细描述下并提供服务器ip。

真累什么名字都不能用 – 这是我的用户名
2024-09-22 10:45:27
公网IP 00.100.100.00(这个我还是要处理下的)
启动node项目的时候报出来的

售后工程师
2024-09-22 11:11:12
从报错信息来看是内存不足,您可以free -m看下系统自身内存是否充足,系统内存充足的情况下,检查下程序是否有最大内存限制等导致启动报错,可以根据报错信息外站搜索相关参考案例排查下,修改程序之前建议优先做好备份

售后工程师
2024-09-22 14:39:32
您好,如您暂无其他问题,请关闭下工单。后续有新的问题可以提交新的工单联系我们,感谢您的支持。

真累什么名字都不能用
2024-09-23 17:55:24
swap 的内存很足,怎么swap到磁盘上

# free -mtotal        used        free      shared  buff/cache   available
Mem:           1756        1426          63           0         266         169
Swap:          2047          72        1975

售后工程师
2024-09-23 18:22:32
您好,请问您是指swap扩大?还是什么意思呢?能否详细描述下呢

售后工程师
2024-09-24 09:55:48
尊敬的客户,请您关注工单回复并进行验证,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改)

真累什么名字都不能用
2024-09-24 14:18:16
这个错误是项目启动的时候报的错误,内存不足溢了,为了解决内存不足可以使用swap机制,将部分数据swap到磁盘保证项目正常启动。

现在是我的项目启动的时候,第一次都会oom第二次就能正常启动成功,不符合常理。要么每次都失败要么一次就成功。

售后工程师
2024-09-24 14:48:23
您好,oom 是因为您的业务有内存溢出的问题,这个您得从业务侧去查看呢,从您上面命令反馈看配置了2G的Swap,swap使用并不多,有可能是swap分配的并不合理,您可以考虑增大swap,或者调整应用程序的内存使用策略进行优化的。

售后工程师
2024-09-25 01:01:10
尊敬的客户,一直未等到您的回复先将工单置为待确认状态,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改,同时建议定期做好数据备份)

真累什么名字都不能用
2024-09-26 15:59:33
Swap他是不用分配的,如果内存不足就会swap到磁盘。 第一次报错,第二次启动成功,这个也不正常呀!

售后工程师
2024-09-26 16:03:41
请稍等,这边看下。

售后工程师
2024-09-26 16:55:21
您好

1麻烦您在程序启动失败时在服务器内部执行下free -m

2然后请您在程序启动成功后,也在服务器内部执行下free -m

请您提供下两次的截图,这边看下,谢谢

真累什么名字都不能用
2024-09-28 15:28:40
第一次启动失败的报文:
在这里插入图片描述

第二次启动成功的报文
image.png

售后工程师
2024-09-28 16:14:49
您好,前后两次的swap分区使用情况看差异不大的,区别看是物理内存使用量不同,可用内存也不同

swap的使用是系统管理的,配置了swap分区,即使将vm.swappiness 设置为100 也并不能保证一定能使用到swap分区的,建议您可以考虑将swap分区增大下,并优化下node程序启动申请的内存最大大小再看下
在这里插入图片描述
在这里插入图片描述

真累什么名字都不能用
2024-10-02 16:35:31
我知道应该优化项目启动占用的内存大小,知识郁闷的是为什么第一次和第二次存在区别。

售后工程师
2024-10-02 17:09:05
您好,您也查看下问题时间服务器messages日志看有报错记录吗,此情况应是开始没有使用swap的,swap和真实内存使用是有区别的,是否使用swap是系统侧进行决定。

真累什么名字都不能用
2024-10-03 15:34:09
刚次1次启动就成功了,很奇怪

售后工程师
2024-10-03 15:56:59
您好,建议您使用观察下,如果后续启动报错您也检查下messages系统日志看下是否有错误记录。
真累什么名字都不能用

2024-10-04 10:31:16
大清早起来项目第一次崩掉了。。。。。
image.png

真累什么名字都不能用
2024-10-04 10:33:35
怎么演变成了,运行一段时间,自动oom了,这谁扛得住

<--- Last few GCs --->[25560:0x21b3650]  9596697 ms: Mark-sweep 876.0 (893.3) -> 874.5 (893.3) MB, 265.6 / 0.3 ms  (average mu = 0.931, current mu = 0.908) allocation failure scavenge might not succeed
[25560:0x21b3650]  9603818 ms: Mark-sweep 876.2 (893.3) -> 874.5 (893.6) MB, 351.2 / 0.4 ms  (average mu = 0.944, current mu = 0.951) allocation failure scavenge might not succeed<--- JS stacktrace --->FATAL ERROR: Reached heap limit Allocation failed - JavaScript heap out of memory1: 0x7fd1989ead78 node::Abort() [/lib64/libnode.so.93]2: 0x7fd1988d8a73  [/lib64/libnode.so.93]3: 0x7fd199be8a20 v8::Utils::ReportOOMFailure(v8::internal::Isolate*, char const*, bool) [/lib64/libnode.so.93]4: 0x7fd199be8de7 v8::internal::V8::FatalProcessOutOfMemory(v8::internal::Isolate*, char const*, bool) [/lib64/libnode.so.93]5: 0x7fd199da87e5  [/lib64/libnode.so.93]6: 0x7fd199dbe654  [/lib64/libnode.so.93]7: 0x7fd199dc0749 v8::internal::Heap::AllocateRawWithLightRetrySlowPath(int, v8::internal::AllocationType, v8::internal::AllocationOrigin, v8::internal::AllocationAlignment) [/lib64/libnode.so.93]8: 0x7fd199dc07d7 v8::internal::Heap::AllocateRawWithRetryOrFailSlowPath(int, v8::internal::AllocationType, v8::internal::AllocationOrigin, v8::internal::AllocationAlignment) [/lib64/libnode.so.93]9: 0x7fd199d80fcd v8::internal::Factory::NewFillerObject(int, bool, v8::internal::AllocationType, v8::internal::AllocationOrigin) [/lib64/libnode.so.93]
10: 0x7fd19a11958a v8::internal::Runtime_AllocateInYoungGeneration(int, unsigned long*, v8::internal::Isolate*) [/lib64/libnode.so.93]
11: 0x7fd199ae3d19  [/lib64/libnode.so.93]

售后工程师
2024-10-04 11:32:17
您好,查看报错是和内存不足有关的,您程序是java相关的话,java的XMX 参数设置的多少,有指定吗,如果是默认配置,可以考虑对XMX设置为1个G观察下

真累什么名字都不能用
2024-10-08 12:43:26
项目是vuepress项目

服务助手
2024-10-09 22:35:27
i-uf65h6i43ltlzhqolumy
d-uf6j9l10qgp2yr97o20n(系统盘). (这个时候给阿里云授权了)

真累什么名字都不能用
2024-10-09 22:35:27
已操作授权

售后工程师
2024-10-10 01:03:59
您好,请问您的这个程序如何启动,配置文件路径麻烦也提供一下,另外您的这个程序属于第三方软件超出了阿里云的服务范围这边会尽力帮您尝试排查下但是无法保证可以解决,这个请了解,谢谢

真累什么名字都不能用
2024-10-11 11:06:16
screen -r -d

npm run docs:dev
售后工程师
2024-10-11 11:44:13
您好,刚刚尝试与您电话,但是电话没有接通

screen -r -d后出现了附件中的提示,麻烦您看下,谢谢
在这里插入图片描述
真累什么名字都不能用
2024-10-11 20:19:02
你干啥了,搞坏了

真累什么名字都不能用
2024-10-11 20:19:53
刚他们说网站崩掉了

服务助手
2024-10-11 20:24:04
真累什么名字都不能用
2024-10-11 20:39:18
Ctrl+a+d 可以退出 窗口管理器,查看服务器的信息, screen -r -d 是打开我程序运行窗口,不能终止的,终止了系统就挂了。

售后工程师
2024-10-11 23:56:38
您好,抱歉给您使用带来不便,您提供启动程序命令后,没有和您确认执行命令的影响,执行 screen -r -d 后 没有什么反应,当时尝试电话联系您核实情况也没有联系通,不清楚是否会影响到您网站。
关于您反馈的网站情况,专员已和您电话沟通,给您带来不便请谅解。

真累什么名字都不能用
2024-10-12 21:38:00
造成的损失你我一块承担一些吧

售后工程师
2024-10-12 22:02:44
您好,您反馈的问题我们已经记录并转交给后端专项处理人员,核实需要些时间,请您耐心等待,有结果我们会第一时间反馈。

售后工程师
2024-10-13 11:32:17
您好,您反馈的问题预计周一工作时间专员会和您联系沟通。

真累什么名字都不能用
2024-10-13 15:10:29
好的

售后工程师
2024-10-13 15:16:43
届时会有专员跟您联系沟通,有其他问题您随时反馈。

售后工程师
2024-10-14 17:22:07
您好

1 关于损失的情况,专员已和您电话沟通好方案,给您账号补偿500元代金券,已经发放完成,请您查看。

2 服务器里网站应用程序出现out of memory的问题,建议优化程序的内存使用,或者考虑给服务器升级配置增加内存。

3 对于第一次启动程序会出现out of memory,第二次启动程序就正常的情况,目前还没有排查到原因,如果要继续排查,避免影响您网站使用,请您给服务器创建一个镜像,把镜像共享给我们的测试账号(1833241755205400),我们用测试账号创建服务器进行分析排查看看,因为升级到第三方应用程序,也不能保证一定可以查到原因。

使用实例创建自定义镜像 https://help.aliyun.com/zh/ecs/user-guide/create-a-custom-image-from-an-instance?spm=a2c4g.11186623.0.i0

共享自定义镜像 https://help.aliyun.com/zh/ecs/user-guide/share-a-custom-image?spm=a2c4g.11186623.0.i3

真累什么名字都不能用
2024-10-14 18:25:11
这个创建镜像的流程看着比较麻烦,我晚上搞一下,谢谢

售后工程师
2024-10-14 19:00:17
好的,有问题,请您再反馈,谢谢

真累什么名字都不能用
2024-10-14 23:24:28
镜像已经创建好了,镜像名:Created_from_i-uf65h6i43ltlzhqolumy
售后工程师
2024-10-15 00:38:41
您好

请您参考:https://help.aliyun.com/zh/ecs/user-guide/share-a-custom-image?spm=a2c4g.11186623.0.i3 将您创建的镜像共享到这个1833241755205400账号的上海地域,共享完成后,请您工单反馈下,谢谢
真累什么名字都不能用
2024-10-17 12:37:37
o , 已经创建好了,忘记回复了

售后工程师
2024-10-17 13:02:37
您好,您的问题正在核实,请您不要关闭工单,等待我们进一步答复,谢谢

售后工程师
2024-10-17 14:05:39
您好,npm run docs:dev 是需要先切换到某一路径下在执行吗,目前登录测试服务器后多次执行查看均提示报错。
image.png

服务助手
2024-10-20 14:05:39

真累什么名字都不能用
2024-10-21 11:01:15
打电话聊聊?

真累什么名字都不能用
2024-10-21 11:02:52
主窗口用来执行命令的,使用 screen -r -d 开启了一个新窗口用来启动服务的。这个窗口进去的时候,就是系统运行的窗口,ctrl+c停止运行,但是必须5分钟内启动起来。 npm run docs:dev 启动项目

售后工程师
2024-10-21 12:19:42
您好

刚刚与您电话,您目前不确定再测试机上执行命令是否会影响您的网站,需要执行命令前提前与您确认下.

后续这边操作前会提前与您联系的,您稍等
售后工程师
2024-10-21 12:47:02
.
售后工程师
2024-10-21 13:17:51
您好,您的问题正在为您处理中,请您耐心等待回复。

售后工程师
2024-10-21 13:51:02
您好,经排查分析结果如下:
原因分析:报错原因是Node.js 的 max_old_space_size 设置太小而无法构建此应用程序。 您可以尝试通过设置 NODE_OPTIONS 环境变量来增加 max_old_space_size。
max_old_space_size 以 MB 为单位,默认情况下 max_old_space_size 是机器内存大小的一半。该值可以大于你机器的实际内存大小。
全文核心
解决方法:
先执行export NODE_OPTIONS=–max_old_space_size=2048 后,再执行npm run docs:dev 启动项目

我们多次在测试机上测试,问题可以解决。

售后工程师
2024-10-21 14:55:38
尊敬的客户,请您关注工单回复并进行验证,您可以在3天内继续反馈此工单与我们联系。如遇其它问题您可以提交新工单反馈。感谢您的支持!(如果您在工单中提供了账号密码等敏感信息,请您及时修改)

真累什么名字都不能用
2024-10-22 09:55:10
好的,我今天操作一下,么问题的话,我就关了,非常感谢
售后工程师

2024-10-22 09:57:00
您好,不客气。

真累什么名字都不能用
2024-10-23 22:12:02
嗯,可以了,谢谢

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/56821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS 组件样式@Style 、 @Extend、自定义扩展(AttributeModifier、AttributeUpdater)

1. HarmonyOS Style 、 Extend、自定义扩展&#xff08;AttributeModifier、AttributeUpdater&#xff09; Styles装饰器&#xff1a;定义组件重用样式   ;Extend装饰器&#xff1a;定义扩展组件样式   自定义扩展&#xff1a;AttributeModifier、AttributeUpdater 1.1. 区…

SpringBoot 下的Excel文件损坏与内容乱码问题

序言 随着打包部署的方式的改变&#xff0c;原本正常运行的代码可能带来一些新的问题&#xff0c;比如我们现在使用SpringBoot 的方式生成Jar包直接运行&#xff0c;就会对我们再在Resource下的Excel文件产生影响&#xff0c;导入与预期不符的情况发生cuiyaonan2000163.com 比…

Anchor DETR论文笔记

原文链接 [2109.07107] Anchor DETR: Query Design for Transformer-Based Object Detection (arxiv.org)https://arxiv.org/abs/2109.07107 原文笔记 What 提出了一种新的基于锚点的查询设计&#xff0c;即将锚点编码为对象查询。 Why 对象检测任务是预测图像中每个对象…

el-table相关的功能实现

1. 表格嵌套表格时&#xff0c;隐藏父表格的全选框 场景&#xff1a;当table表格设置复选&#xff08;多选&#xff09;功能时&#xff0c;如何隐藏表头的复选框&#xff0c;不让用户一键多选。 <el-table :header-cell-class-name"cellClass">// 表头复选框禁…

机器视觉-相机、镜头、光源(总结)

目录 1、机器视觉光源概述 2、光源的作用 3、光谱 4、工业场景常见光源 4.1、白炽灯 4.2、卤素灯 4.3、 荧光灯 4.4、LED灯 4.5、激光灯 5、光源的基本性能 5.1、光通量 5.2、光效率 5.3、发光强度 5.4、光照度 5.5、均匀性 5.6、色温 5.7、显色性 6、基本光学…

【Linux | 网络I/O模型】五种网络I/O模型详解

1、数据传输过程 在 Linux 系统中&#xff0c;数据传输是通过 I/O 操作来实现的。I/O 操作是指数据从应用程序到内核&#xff0c;再到硬件设备&#xff08;如磁盘、网络接口&#xff09;的过程。 操作系统为了保护自己&#xff0c;设计了用户态、内核态两个状态。应用程序一般工…

基于云平台的智能家居管理系统设计与通信协议分析

案例 阅读以下关于 Web 系统架构设计的教述&#xff0c;在答题纸上回答问题1至问题3。 【说明】 某公司拟开发一个智能家居管理系统&#xff0c;该系统的主要功能需求如下: 1)用户可使用该系统客户端实现对家居设备的控制&#xff0c;且家居设备可向客户端反馈实时状态&#x…

Redis 线程控制 总结

前言 相关系列 《Redis & 目录》&#xff08;持续更新&#xff09;《Redis & 线程控制 & 源码》&#xff08;学习过程/多有漏误/仅作参考/不再更新&#xff09;《Redis & 线程控制 & 总结》&#xff08;学习总结/最新最准/持续更新&#xff09;《Redis &a…

JavaScript part2

一.前言 前面我们讲了一下js的基础语法&#xff0c;但是这些还是远远不够的&#xff0c;我们要想操作标签&#xff0c;实现一个动态且好看的页面&#xff0c;就得学会BOM和DOM&#xff0c;这些都是浏览器和页面的&#xff0c;这样我们才能实现一个好看的页面 二.BOM对象 BOM…

Radar Fields: Frequency-Space Neural Scene Representations for FMCW Radar 笔记

Code 主要思想 文章提出了一种新的神经场表示方法——Radar Fields&#xff0c;用于从FMCW&#xff08;调频连续波&#xff09;雷达数据中恢复场景几何信息。与以往的依赖于光学成像&#xff08;如RGB相机和LiDAR&#xff09;的神经场方法不同&#xff0c;该研究利用了雷达的…

高级网络互联技术:AS3001与AS3000的路由交换方案

✅作者简介&#xff1a;2022年博客新星 第八。热爱国学的Java后端开发者&#xff0c;修心和技术同步精进。 &#x1f34e;个人主页&#xff1a;Java Fans的博客 &#x1f34a;个人信条&#xff1a;不迁怒&#xff0c;不贰过。小知识&#xff0c;大智慧。 &#x1f49e;当前专栏…

基于SSM的智能养生平台管理系统源码带本地搭建教程

技术栈与架构 技术框架&#xff1a;采用SSM&#xff08;Spring Spring MVC MyBatis&#xff09;作为后端开发框架&#xff0c;结合前端技术栈layui、JSP、Bootstrap与jQuery&#xff0c;以及数据库MySQL 5.7&#xff0c;共同构建项目。 运行环境&#xff1a;项目在JDK 8环境…

HarmonyOS 5.0应用开发——应用打包HAP、HAR、HSP

【高心星出品】 目录 应用打包HAP、HAR、HSPModule类型HAPHAR创建HAR建立依赖HAR共享内容 HSP创建HSP建立依赖同上HSP共享内容同上 HAR VS HSP 应用打包HAP、HAR、HSP 一个应用通常会包含多种功能&#xff0c;将不同的功能特性按模块来划分和管理是一种良好的设计方式。在开发…

【mysql】4-2. MySQL存储结构

MySQL存储结构 1 什么是表空间⽂件&#xff1f; 解答问题 表空间⽂件是⽤来存储表中数据的⽂件&#xff0c;表空间⽂件的⼤⼩由存储的数据多少决定&#xff0c;不同的表空间⽂件存储数据的种类也有所不同&#xff0c;在MySQL中表空间分为五类&#xff0c;包括&#xff1a;系统…

Python | Leetcode Python题解之第514题自由之路

题目&#xff1a; 题解&#xff1a; Test "godding" target "d"i 0left i lc 0 right i rc 0while Test[left] ! target:left - 1lc 1if left -1:left len(Test) - 1while Test[right] ! target:right 1rc 1if right len(Test):right 0prin…

vue3报错:找不到模块“element-plus”或其相应的类型说明

1.问题复现 2.首先去检查一下package.json中是否安装了element-plus 3.存在&#xff0c;就是另一个问题&#xff0c;模块没有被导出来 a.此时需要建立一个.d.ts文件&#xff08;在package.json同级目录下&#xff09; 4.写入代码保存&#xff0c;即可解决报错问题 declare mo…

安卓在windows连不上fastboot问题记录

fastboot在windows连不上fastboot 前提是android studio安装 google usb driver 搜索设备管理器 插拔几次找安卓设备 在其他设备 或者串行总线设备会出现安卓 右键更新驱动 下一步下一步然后可以了

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-21

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-21 目录 文章目录 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-21目录1. The Fair Language Model Paradox摘要研究背景问题与挑战如何解决创新点算法模型实验效果重要数据与结论推荐阅读指数&…

海外媒体发稿:如何打造媒体发稿策略

新闻媒体的发稿推广策略对于提升品牌知名度、吸引流量以及增加收入非常重要。本文将介绍一套在21天内打造爆款新闻媒体发稿推广策略的方法。 第一天至第七天&#xff1a;明确目标和定位 在这个阶段&#xff0c;你需要明确你的目标和定位&#xff0c;以便为你的新闻媒体建立一个…

群晖系统基本命令

切换超级管理员 sudo -i 查询系统 运行的所有服务 synoservicecfg --list 启动服务命令(该命令需要使用超级管理员) #老版本群晖使用synoservice命令 synoservice --start 服务名称#新版本群晖使用systemctl命令 systemctl start 服务名称 synoservice所管理的服务配置文…