一.账号管理

角色权限说明用户组
总体云运维管理所有阿里云资源的权限ops
网络运维管理NAT网关(NATGateway)权限<br/>管理专有网络(VPC)的权限管理VPN网关(VPNGateway)<br/>权限管理弹性公网IP(EIP)权限<br/>管理共享带宽的权限管理云企业网(CEN)的权限network
数据库运维管理云数据库服务(RDS)的权限<br/>管理云数据库Redis版(Kvstore)的权限<br/>管理数据传输服务(DTS)的权限dba
安全运维管理云安全中心(SAS)的权限、管理操作审计(ActionTrail)的权限<br/>管理云盾云防火墙(CloudFirewall)、管理云盾应用防火墙(WAF)的权限<br/>管理云监控(CloudMonitor)的权限security
应用部署管理日志服务(Log)的权限<br/>管理容器服务(CS)的权限<br/>管理容器镜像服务(ContainerRegistry)的权限<br/>管理消息队列(MQ)的权限、管理消息队列Kafka的权限<br/>管理Elasticsearch的权限deploy
开发人员只读访问所有阿里云资源的权限developer

二.资源组管理

根据应用环境现分为 : 开发测试和生产资源组

开发测试资源组开发与测试环境公用
生产环境资源组用于生产环境

三.云监控

1.云产品监控

云资源监控项报警规则
ECS内网流入带宽内网流入流量 >=2048Mbytes  连续3次  1分钟
内网流出带宽内网流入流量 >=2048Mbytes  连续3次  1分钟
进程总数进程总数 >=10240Count  连续3次  1分钟
负载负载 >=5 连续3次 1分钟
磁盘读IO读 >=25 连续3次 1分钟
磁盘写IO写 >=25 连续3次 1分钟
磁盘使用率磁盘使用率 >=80%  连续3次  1分钟
inode使用率inode使用率 >=80%  连续3次  1分钟
CPU使用率CPU使用率 >=80%  连续3次  1分钟
内存使用率内存使用率 >=80%  连续3次  1分钟
Redis标准版连接数使用率连接数使用率 >=80%  连续3次 1分钟
内存使用率内存使用率 >=80%  连续3次  1分钟
CPU使用率CPU使用率 >=80%  连续3次  1分钟
CDN返回码4xx占比返回码4XX占比 >=5%  连续3次 1分钟
返回码5xx占比返回码5XX占比 >=5%  连续3次 1分钟
命中率命中率 <=95%  连续3次 1分钟
RDS内存使用率内存使用率 >=80%  连续3次  1分钟
CPU使用率CPU使用率 >=80%  连续3次  1分钟
磁盘使用率磁盘使用率 >=80%  连续3次  1分钟
IOPS使用率IOPS使用率 >=80%  连续3次 1分钟
连接数使用率连接数使用率 >=80%  连续3次 1分钟
弹性公网IP流出带宽流出带宽 >=2048Mbits/s  连续3次  1分钟
流入带宽流出带宽 >=2048Mbits/s  连续3次  1分钟
负载均衡最大连接数使用率最大连接数使用率 >=80%  连续3次 1分钟
每秒新建连接数使用率每秒新建连接数使用率 >=80%  连续3次 1分钟
对象存储OSS可用性可用性 <=95%  连续3次 1分钟
NAT网关SNAT连接数连接数 >=100/min  连续3次  1分钟

2.站点监控

响应时间ResponseTimeResponseTime >2000 秒 Info 连续3次
可用性AvailabilityAvailability <90% Info 连续3次
END
本文作者:
文章标题: 基于阿里云运维的基础规划建设
本文地址: https://blog.imwlw.com/archives/27/
版权说明:若无注明,本文皆 ITShare Studio 原创,转载请保留文章出处。
最后修改:2024 年 11 月 13 日
如果觉得我的文章对你有用,请随意赞赏