IBM Spectrum LSF 常见问题

IBM Spectrum LSF 常见问题

1、随此产品一起部署的集群中包含哪些 Spectrum LSF 软件包?

包含以下 Spectrum LSF 程序:

IBM Spectrum LSF Standard Edition
IBM Spectrum LSF 许可证调度程序
IBM Spectrum LSF 数据管理器

2、哪些位置可用于部署 VPC 资源?

可以在 资源部署的位置中找到用于部署 VPC 资源的可用区域和区域以及这些资源到城市位置和数据中心的映射。

3、我需要哪些许可权才能使用该产品创建集群?

有关为产品用于创建集群的 IBM Cloud 服务设置相应许可权的指示信息可以在 授予用户对 VPC 资源的许可权, 管理对 Schematics的用户访问权和 分配对 Secrets Manager的访问权中找到。

4、如何在节点之间进行 SSH?

HPC 集群中的所有节点都具有在集群创建时注册的相同公用密钥。 您可以使用 ssh-agent 转发,这是访问具有相同公用密钥的远程节点的常用方法。 它可自动将专用密钥安全地转发到远程节点。 在会话关闭后,将立即删除转发的密钥。

要将专用密钥安全地转发到远程节点,需要执行 ssh-add 和 ssh -A。

[your local PC]~$ ssh-add {id_rsa for lsf cluster}
[your local PC]~# ssh -A -J root@jumpbox_fip root@management_private_ip

[root@management]~# ssh -A worker_private_ip

对于 Mac OS X ,您可以通过向 .ssh/config添加以下配置来持久存储 ssh-add :
Host *
UseKeychain yes
AddKeysToAgent yes

您甚至可以通过向 .ssh/config添加 “ForwardAgent yes” 来除去 -A 。

5、可以通过此产品在 Spectrum LSF 集群中部署多少个工作程序节点?

在部署集群之前,请务必确保 VPC 资源配额设置适合于您要创建的集群的大小 (请参阅 配额和服务限制)。

部署值 worker_node_max_count 支持的最大工作程序节点数为 500 (请参阅 部署值)。 worker_node_min_count 变量指定在创建集群时供应的工作程序节点数,这些节点将存在于集群的整个生命周期中。 这两个变量之间的变化量指定可由 LSF 资源连接器自动缩放功能创建或销毁的最大工作程序节点数。 在该增量超过 250 的配置中,如果期望工作负载的特征在单个时间点导致> 250 个集群节点连接或移除操作请求,那么建议谨慎操作。 在这些情况下,建议同步作业启动和停止请求 (如果可能)。 否则,您可能会在加入集群或从集群中除去的部分节点中看到明显的延迟。

6、为什么可以在 IBM Cloud 目录磁贴中指定两个不同的资源组参数?

IBM Cloud 目录中的 配置工作空间 部分中的第一个资源组参数条目适用于在 IBM Cloud 帐户上供应 Schematics 工作空间的资源组。 此参数的值可以与目录中 具有缺省值的参数 部分中用于第二个条目的值不同。 第二个条目适用于供应 VPC 资源的资源组。 如此第二个 resource_group 参数的描述中所指定,请注意,仅支持使用缺省资源组来使用 LSF 资源连接器自动缩放功能。

7、IBM Spectrum LSF 磁贴使用的 Terraform 文件位于何处?

可以在此 GitHub 存储库中找到基于 Terraform 的模板。

8、在何处可以找到每个云区域的定制映像名称到映像标识的映射?

可以在此 GitHub 存储库中的 image-map.tf 文件中找到映射。

9、在使用此产品部署的集群节点中使用哪些 Spectrum LSF 和 Spectrum Scale 版本?

随此产品一起部署的集群节点包括 IBM Spectrum LSF 10.1 Standard Edition 以及 Data Manager 和 License Scheduler。 请参阅以下内容以获取其中每个程序的简要描述: IBM Spectrum LSF 10 系列产品

如果集群使用 Spectrum Scale 存储器,那么存储节点将包含 IBM Spectrum Scale 5.1.3.1 软件。 有关更多信息,请参阅 IBM Spectrum Scale 产品文档。

10、启用 spectrum_scale 后,可以通过此产品在 Spectrum LSF 集群中部署多少计算工作程序和存储节点?

在部署集群之前,请务必确保 VPC 资源配额设置适合于您要创建的集群的大小 (请参阅 配额和服务限制)。

部署值 total_compute_cluster_instances 支持的最大计算节点数为 64。 部署值 total_storage_cluster_instances 支持的最大存储节点数为 18。

11、为什么 LSF 工作程序节点上显示的 CPU 号与 LSF Application Center GUI 中显示的不同?

在 LSF 工作程序节点上运行 lscpu 命令时, LSF Application Center GUI 中的 CPU 列和 ncpus 列可能未显示相同的值。

通过在 LSF 工作程序节点上运行 lscpu | egrep ‘Model name|Socket|Thread|NUMA|CPU(s)’ 而获得的 CPU 列输出将显示该计算实例上的 CPU 线程数 (非物理核心数)。

如果 EGO_DEFINE_NCPUS=threads,那么 “ncpus=number of processor x number of cores x number of threads” 和 LSF Application Center GUI 中的 CPU 列值将与您在 LSF 工作程序节点上运行 lscpu 时看到的值匹配。

如果 EGO_DEFINE_NCPUS=cores,那么 “ncpus=number of processor x number of cores” 和 LSF Application Center GUI 中的 CPU 列值将是您在 LSF 工作程序节点上运行 lscpu 时看到的值的一半。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/607430.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

yolo v7支持的设备

将一个深度学习模型(在这里是YOLOv7,一个目标检测模型)从PyTorch导出到不同的格式,以便在不同平台上进行推理(inference)。列出的方法包括: PyTorch 转 CoreML(适用于 macOS/iOS&am…

C++PDF书籍下载

[提高C.性能的编程技术].左飞.扫描版[www.ed2kers.com].pdf 链接: https://pan.baidu.com/s/1uA-oDGYhtAHmGZsbcr_Eow 密码: abv1 深度探索C对象模型.pdf 链接: https://pan.baidu.com/s/1uG9FDIq7T9EZIbjrfAVQaw 密码: gqaj C和C编码安全.pdf 链接: https://pan.baidu.com/s…

0003__WebAssembly完全入门——了解wasm的前世今身

WebAssembly完全入门——了解wasm的前世今身_webassembly.instantiate env-CSDN博客 WebAssembly初级——认识WebAssebmly(一)-CSDN博客

Hystrix服务熔断机制

熔断机制 熔断机制是应对雪崩效应的一种微服务链路保护机制,当系统链路中的某个微服务出现错误不可用或者响应时间太长的时候就会进行服务的降级,进而熔断该服务的调用,快速返回熔断的响应信息。当检测到该节点微服务调用正常后,…

Ansible自动化运维(二)ad-hoc 模式详解

👨‍🎓博主简介 🏅云计算领域优质创作者   🏅华为云开发者社区专家博主   🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入! 🐋 希望大家多多支…

506 - System Dependencies (UVA)

题目链接如下: Online Judge 这道题有个小细节,explicitly installed的component,不能被implicitly removed. 有一点拓扑排序的思想,用in[component]代表目前depend on在这个component上的component数量。 我的代码如下&…

秒杀相关问题及答案(2024)

1、描述一个秒杀系统的基本架构,并解释其中的关键组件 一个基本的秒杀系统架构通常由以下关键组件构成: 前端界面:用户与系统交互的界面,提供产品页面、秒杀开始倒计时、按钮等,用于发起秒杀请求。 反向代理和负载均…

【Linux】Linux系统编程——Linux常用快捷键

在 Linux 中,特别是在使用命令行界面时,有许多快捷键可以提高你的工作效率。以下是一些常用的快捷键: 命令行编辑: Ctrl A:移动光标到行首。Ctrl E:移动光标到行尾。Ctrl U:删除光标之前到行…

PLC期末速成——顺序功能图转梯形图

一、根据顺序功能图写出梯形图程序 顺序功能图: 梯形图: 1、程序段1,系统运行标志M0.0的启-保-停控制电路。 2、程序段2,PLC上电与逆行,初始化脉冲M1.0激活初始化步M2.0。 3、程序段3,当M2.0初始化步为活…

使用Dependency Walker和Process Explorer排查瑞芯微工具软件RKPQTool.exe启动报错的问题

目录 1、问题说明 2、使用Dependency Walker查看工具程序的库依赖关系

jupyter内核错误

1、在dos窗口输入以下命令激活环境:anaconda activate 【py环境名,比如py37】(目的是新家你一个虚拟环境) 2、在虚拟环境py37下安装jupyter notebook,命令:pip install jupyter notebook 3、安装ipykerne…

Unity C# 枚举多选

枚举多选 &#x1f96a;例子&#x1f354;判断 &#x1f96a;例子 [System.Flags]public enum TestEnum{ None 0,Rooms 1 << 1,Walls1<<2,Objects1<<3,Slabs 1 << 4,All Rooms|Walls|Objects|Slabs}&#x1f354;判断 TestEnum test TestEnum.R…

ArcGIS中style文件的导入及lyr的文件的使用

地图是地理信息的重要载体&#xff0c;科学的配色方案可以有效地传递地理信息&#xff0c;而美观协调的配色方案也是我们进行地图符号化设计的重要内容。在日常工作中&#xff0c;我们常常苦恼于自带颜色不能满足需要或是希望使用现成的颜色模板&#xff0c;自定义配色方案导入…

Ceph源码分析-在C++中,符号““和“*“有不同的用法。

在C中&#xff0c;符号"&"和"*"有不同的用法。 "&"符号&#xff1a; 在变量声明时&#xff0c;"&"用于定义引用类型。例如&#xff1a;int a 10; int& ref a; 这里的"ref"是一个引用&#xff0c;它引用了…

css选择器有哪些?优先级?哪些属性可以继承?

面试官&#xff1a;css选择器有哪些&#xff1f;优先级&#xff1f;哪些属性可以继承&#xff1f; 一、选择器 CSS选择器是CSS规则的第一部分 它是元素和其他部分组合起来告诉浏览器哪个HTML元素应当是被选为应用规则中的CSS属性值的方式 选择器所选择的元素&#xff0c;叫做…

百度吉利合作造车生态,极越“智价比”能否带来科技平权?

文|AUTO芯球 作者|文泽 临近年关&#xff0c;车企迎来“降价潮”。为了获得更好的年终成绩单&#xff0c;包括上汽大众、比亚迪、长安汽车、智己汽车等20多家品牌推出了购车补贴、限时优惠等措施&#xff0c;优惠幅度最高近20万元。 在此背景下&#xff0c;新车发布一个多月…

深度解析分布式锁及实现方案

&#x1f604; 19年之后由于某些原因断更了三年&#xff0c;23年重新扬帆起航&#xff0c;推出更多优质博文&#xff0c;希望大家多多支持&#xff5e; &#x1f337; 古之立大事者&#xff0c;不惟有超世之才&#xff0c;亦必有坚忍不拔之志 &#x1f390; 个人CSND主页——Mi…

Spark MLlib ----- ALS算法

补充 在谈ALS(Alternating Least Squares)之前首先来谈谈LS,即最小二乘法。LS算法是ALS的基础,是一种数优化技术,也是一种常用的机器学习算法,他通过最小化误差平方和寻找数据的最佳匹配,利用最小二乘法寻找最优的未知数据,保证求的数据与已知的数据误差最小。LS也被用…

Web开发:SQLsugar的安装和使用

一、安装 第一步&#xff0c;在你的项目中找到解决方案&#xff0c;右键-管理解决方案的Nuget 第二步&#xff0c;下载对应的包&#xff0c;注意你的框架是哪个就下载哪个的包&#xff0c;一个项目安装一次包即可 点击应用和确定 安装好后会显示sqlsugar的包 二、使用&#xf…

聚类分析 | Matlab实现基于RIME-DBSCAN的数据聚类可视化

聚类分析 | Matlab实现基于RIME-DBSCAN的数据聚类可视化 目录 聚类分析 | Matlab实现基于RIME-DBSCAN的数据聚类可视化效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.聚类分析 | Matlab实现基于RIME-DBSCAN的数据聚类可视化&#xff08;完整源码和数据) 2.多特征输入&…