一.账号管理
角色 | 权限说明 | 用户组 |
---|---|---|
总体云运维 | 管理所有阿里云资源的权限 | ops |
网络运维 | 管理NAT网关(NATGateway)权限<br/>管理专有网络(VPC)的权限管理VPN网关(VPNGateway)<br/>权限管理弹性公网IP(EIP)权限<br/>管理共享带宽的权限管理云企业网(CEN)的权限 | network |
数据库运维 | 管理云数据库服务(RDS)的权限<br/>管理云数据库Redis版(Kvstore)的权限<br/>管理数据传输服务(DTS)的权限 | dba |
安全运维 | 管理云安全中心(SAS)的权限、管理操作审计(ActionTrail)的权限<br/>管理云盾云防火墙(CloudFirewall)、管理云盾应用防火墙(WAF)的权限<br/>管理云监控(CloudMonitor)的权限 | security |
应用部署 | 管理日志服务(Log)的权限<br/>管理容器服务(CS)的权限<br/>管理容器镜像服务(ContainerRegistry)的权限<br/>管理消息队列(MQ)的权限、管理消息队列Kafka的权限<br/>管理Elasticsearch的权限 | deploy |
开发人员 | 只读访问所有阿里云资源的权限 | developer |
二.资源组管理
根据应用环境现分为 : 开发测试和生产资源组
开发测试资源组 | 开发与测试环境公用 |
---|---|
生产环境资源组 | 用于生产环境 |
三.云监控
1.云产品监控
云资源 | 监控项 | 报警规则 |
---|---|---|
ECS | 内网流入带宽 | 内网流入流量 >=2048Mbytes 连续3次 1分钟 |
内网流出带宽 | 内网流入流量 >=2048Mbytes 连续3次 1分钟 | |
进程总数 | 进程总数 >=10240Count 连续3次 1分钟 | |
负载 | 负载 >=5 连续3次 1分钟 | |
磁盘读IO | 读 >=25 连续3次 1分钟 | |
磁盘写IO | 写 >=25 连续3次 1分钟 | |
磁盘使用率 | 磁盘使用率 >=80% 连续3次 1分钟 | |
inode使用率 | inode使用率 >=80% 连续3次 1分钟 | |
CPU使用率 | CPU使用率 >=80% 连续3次 1分钟 | |
内存使用率 | 内存使用率 >=80% 连续3次 1分钟 | |
Redis标准版 | 连接数使用率 | 连接数使用率 >=80% 连续3次 1分钟 |
内存使用率 | 内存使用率 >=80% 连续3次 1分钟 | |
CPU使用率 | CPU使用率 >=80% 连续3次 1分钟 | |
CDN | 返回码4xx占比 | 返回码4XX占比 >=5% 连续3次 1分钟 |
返回码5xx占比 | 返回码5XX占比 >=5% 连续3次 1分钟 | |
命中率 | 命中率 <=95% 连续3次 1分钟 | |
RDS | 内存使用率 | 内存使用率 >=80% 连续3次 1分钟 |
CPU使用率 | CPU使用率 >=80% 连续3次 1分钟 | |
磁盘使用率 | 磁盘使用率 >=80% 连续3次 1分钟 | |
IOPS使用率 | IOPS使用率 >=80% 连续3次 1分钟 | |
连接数使用率 | 连接数使用率 >=80% 连续3次 1分钟 | |
弹性公网IP | 流出带宽 | 流出带宽 >=2048Mbits/s 连续3次 1分钟 |
流入带宽 | 流出带宽 >=2048Mbits/s 连续3次 1分钟 | |
负载均衡 | 最大连接数使用率 | 最大连接数使用率 >=80% 连续3次 1分钟 |
每秒新建连接数使用率 | 每秒新建连接数使用率 >=80% 连续3次 1分钟 | |
对象存储OSS | 可用性 | 可用性 <=95% 连续3次 1分钟 |
NAT网关 | SNAT连接数 | 连接数 >=100/min 连续3次 1分钟 |
2.站点监控
响应时间 | ResponseTime | ResponseTime >2000 秒 Info 连续3次 |
---|---|---|
可用性 | Availability | Availability <90% Info 连续3次 |