E-HPC自动伸缩可以根据您配置的伸缩策略动态分配计算节点实例,系统可以根据实时负载自动增加或减少计算节点。
前提条件
集群所有节点操作系统为Linux,且调度器为pbs、slurm、deadline才支持自动伸缩。
背景信息
自动伸缩功能可以帮您完成以下操作,降低成本,提高集群可用性。
自动伸缩功能可以在保证集群可用性的前提下,自动减少计算节点,降低集群成本。
自动伸缩功能可以根据实时负载,自动增加计算节点,提高集群的可用性。
自动伸缩功能可以停止异常状态下的节点,创建新节点,提高集群容错能力。
操作步骤
登录弹性高性能计算控制台。
在顶部菜单栏左上角处,选择地域。
在左侧导航栏,选择弹性 > 自动伸缩。
在自动伸缩页面,从集群列表中选择需要要配置伸缩策略的集群。
在全局配置区域完成参数配置。
配置
描述
开关设置
为集群内所有队列开启自动扩容和自动缩容。
说明当队列配置和全局配置中配置不一致时,以队列设置为优先。
集群计算节点数
仅显示集群可以扩容的计算节点数量范围。上限值为集群中各队列配置的最大节点数总和,下限值为各队列配置的最小节点数总和。
缩容时间
一个计算节点连续空闲时间超过缩容时间,就会被释放。
连续空闲时间=缩容时间间隔 * 连续空闲次数。其中,缩容时间间隔默认为2分钟,节点连续空闲次数指资源收缩检查时,一个节点连续处于空闲的次数。
镜像类型
扩容的节点的镜像类型,仅支持和集群原计算节点镜像匹配的镜像。支持以下镜像:
公共镜像
自定义镜像
共享镜像
镜像市场镜像
例外节点列表
不参与自动伸缩的节点。如果您希望一直保留某个节点,可以设置为例外节点,空闲时不被释放。
在队列配置区域,单击编辑完成参数配置。
配置
描述
队列名称
扩容计算节点的队列名称。
队列节点数
队列允许的计算节点数范围。包括以下选项:
最大节点数:最大允许扩容的计算节点数为0~500。
最小节点数:最小允许保留的计算节点数为0~50。
启动扩容和启动缩容
是否开启自动扩容和自动缩容,默认关闭。
说明当队列配置和全局配置中配置不一致时,以队列设置为优先。
主机名前缀
用以区分标记不同队列节点实例的标志。
镜像类型
单个队列扩容的节点配置镜像类型,不同队列可单独配置不同镜像类型。支持以下镜像:
公共镜像
自定义镜像
共享镜像
镜像ID
单个队列扩容ECS实例所属的镜像ID,不同队列可单独配置不同镜像ID。
说明该配置项只针对当前队列,若队列中不指定镜像类型和镜像ID,则扩容ECS实例镜像由全局配置中的镜像类型配置决定,若全局配置中也没有指定镜像类型,则扩容ECS实例镜像保持和集群默认镜像类型一致。
配置清单
每个配置清单包括扩容计算节点的配置信息。包括以下信息:
可用区:集群所在地域的不同可用区。
交换机ID:可用区内与集群VPC绑定的可选交换机ID。
实例类型:单个队列中扩容计算节点的实例规格。
抢占式策略:扩容实例配置的竞价方式。
每小时最高价格:仅抢占式策略设置为设置上限价格的抢占实例时设定每小时最高价格的区间。
阅读并选中《E-HPC服务条款》,单击确认。
(可选)查看集群自动伸缩示意图。
您可以通过集群自动伸缩示意图了解您配置的伸缩策略在自动伸缩的过程中,节点数随时间推移的变化,以及在关键时间点实例缩容和扩容所耗费时间。
说明您也可以在集群自动伸缩示意图区域设置模拟并发节点数,来手动模拟自动伸缩过程中计算节点的变化。