IDC

GPU 云服务器 使用 GPU 监控 - 操作指南

作者:admin 2021-09-09 我要评论

NVIDIA GPU 系列实例提供了监控 GPU 使用率,显存使用量,功耗以及温度等参数的能力。 GPU 监控工作条件 GPU 监控是通过在 GPU 云服务上部署安装相关 GPU 驱动 ...

在说正事之前,我要推荐一个福利:你还在原价购买阿里云、腾讯云、华为云服务器吗?那太亏啦!来这里,新购、升级、续费都打折,能够为您省60%的钱呢!2核4G企业级云服务器低至69元/年,点击进去看看吧>>>)

NVIDIA GPU 系列实例提供了监控 GPU 使用率,显存使用量,功耗以及温度等参数的能力。

GPU 监控工作条件

GPU 监控是通过在 GPU 云服务上部署安装相关 GPU 驱动 和 云服务器监控组件 来实现的,使用不同的镜像需要不同的处理方式:

  • 使用公共镜像:公共镜像默认包含云服务器监控组件,只需安装 GPU 驱动。
  • 使用镜像市场GPU驱动预装镜像:无需任何安装。
  • 使用导入镜像:需手动安装云服务器监控组件和 GPU 驱动。

查看 GPU 工作参数

单击 GPU 列表中的 “” 监控图标, 访问 控制台 GPU 实例的监控页面,查看 GPU 监控,移动鼠标到指标曲线上将显示对应 GPU 设备的 BDF 和监控数据。如下图所示:

参数说明:

指标名称 含义 单位 维度
GPU 使用率 评估负载所消耗的计算能力,非空闲状态百分比 % per-GPU
GPU 显存使用量 评估负载对显存占用 MBytes per-GPU
GPU 功耗 评估 GPU 耗电情况 W per-GPU
GPU 温度 评估 GPU 散热状态 摄氏度 per-GPU

无监控数据原因

  • 只支持 NVIDIA GPU 实例。
  • 只支持 Linux 操作系统。
  • 没有安装 GPU 驱动或监控组件。
  • 其他原因分析可参考 云服务器无监控数据。

版权声明:本文转载自网络,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本站转载出于传播更多优秀技术知识之目的,如有侵权请联系QQ/微信:153890879删除

相关文章
腾讯云代理商
精彩导读
海外云服务器
热门资讯
腾讯云代理商