一.账号管理
| 角色 | 权限说明 | 用户组 |
|---|---|---|
| 总体云运维 | 管理所有阿里云资源的权限 | ops |
| 网络运维 | 管理NAT网关(NATGateway)权限<br/>管理专有网络(VPC)的权限管理VPN网关(VPNGateway)<br/>权限管理弹性公网IP(EIP)权限<br/>管理共享带宽的权限管理云企业网(CEN)的权限 | network |
| 数据库运维 | 管理云数据库服务(RDS)的权限<br/>管理云数据库Redis版(Kvstore)的权限<br/>管理数据传输服务(DTS)的权限 | dba |
| 安全运维 | 管理云安全中心(SAS)的权限、管理操作审计(ActionTrail)的权限<br/>管理云盾云防火墙(CloudFirewall)、管理云盾应用防火墙(WAF)的权限<br/>管理云监控(CloudMonitor)的权限 | security |
| 应用部署 | 管理日志服务(Log)的权限<br/>管理容器服务(CS)的权限<br/>管理容器镜像服务(ContainerRegistry)的权限<br/>管理消息队列(MQ)的权限、管理消息队列Kafka的权限<br/>管理Elasticsearch的权限 | deploy |
| 开发人员 | 只读访问所有阿里云资源的权限 | developer |
二.资源组管理
根据应用环境现分为 : 开发测试和生产资源组
| 开发测试资源组 | 开发与测试环境公用 |
|---|---|
| 生产环境资源组 | 用于生产环境 |
三.云监控
1.云产品监控
| 云资源 | 监控项 | 报警规则 |
|---|---|---|
| ECS | 内网流入带宽 | 内网流入流量 >=2048Mbytes 连续3次 1分钟 |
| 内网流出带宽 | 内网流入流量 >=2048Mbytes 连续3次 1分钟 | |
| 进程总数 | 进程总数 >=10240Count 连续3次 1分钟 | |
| 负载 | 负载 >=5 连续3次 1分钟 | |
| 磁盘读IO | 读 >=25 连续3次 1分钟 | |
| 磁盘写IO | 写 >=25 连续3次 1分钟 | |
| 磁盘使用率 | 磁盘使用率 >=80% 连续3次 1分钟 | |
| inode使用率 | inode使用率 >=80% 连续3次 1分钟 | |
| CPU使用率 | CPU使用率 >=80% 连续3次 1分钟 | |
| 内存使用率 | 内存使用率 >=80% 连续3次 1分钟 | |
| Redis标准版 | 连接数使用率 | 连接数使用率 >=80% 连续3次 1分钟 |
| 内存使用率 | 内存使用率 >=80% 连续3次 1分钟 | |
| CPU使用率 | CPU使用率 >=80% 连续3次 1分钟 | |
| CDN | 返回码4xx占比 | 返回码4XX占比 >=5% 连续3次 1分钟 |
| 返回码5xx占比 | 返回码5XX占比 >=5% 连续3次 1分钟 | |
| 命中率 | 命中率 <=95% 连续3次 1分钟 | |
| RDS | 内存使用率 | 内存使用率 >=80% 连续3次 1分钟 |
| CPU使用率 | CPU使用率 >=80% 连续3次 1分钟 | |
| 磁盘使用率 | 磁盘使用率 >=80% 连续3次 1分钟 | |
| IOPS使用率 | IOPS使用率 >=80% 连续3次 1分钟 | |
| 连接数使用率 | 连接数使用率 >=80% 连续3次 1分钟 | |
| 弹性公网IP | 流出带宽 | 流出带宽 >=2048Mbits/s 连续3次 1分钟 |
| 流入带宽 | 流出带宽 >=2048Mbits/s 连续3次 1分钟 | |
| 负载均衡 | 最大连接数使用率 | 最大连接数使用率 >=80% 连续3次 1分钟 |
| 每秒新建连接数使用率 | 每秒新建连接数使用率 >=80% 连续3次 1分钟 | |
| 对象存储OSS | 可用性 | 可用性 <=95% 连续3次 1分钟 |
| NAT网关 | SNAT连接数 | 连接数 >=100/min 连续3次 1分钟 |
2.站点监控
| 响应时间 | ResponseTime | ResponseTime >2000 秒 Info 连续3次 |
|---|---|---|
| 可用性 | Availability | Availability <90% Info 连续3次 |