【AWS】什么是AWS Systems Manager
AWS Systems Manager 是一项由 AWS提供的管理服务,
它帮助您在 AWS、本地和多云环境中大规模地集中查看、管理和操作您的节点
(包括 Amazon EC2 实例、本地服务器和虚拟机)。
您可以将 AWS Systems Manager 想象成一个**“统一的运维管理平台”**。它整合了各种工具,旨在简化日常操作任务,提高运营效率,增强基础设施的可见性和控制力,而无需您登录到每台服务器。
AWS Systems Manager 的核心功能和优势
Systems Manager 的设计目标是自动化和简化运维任务,让您能够专注于更高价值的活动。
统一的控制台体验:
提供一个集中视图,让您能够轻松查看和管理跨 AWS 账户、区域以及混合和多云环境中的所有节点。
快速访问节点信息,例如 ID、名称、操作系统详细信息、已安装的代理和标签。
自动化操作:
自动化 (Automation): 允许您定义和执行自动化工作流,以安全地执行常见的 IT 任务,例如修补、更新应用程序、启动和停止实例等。这些自动化可以按计划运行,也可以由 CloudWatch 事件触发。
运行命令 (Run Command): 允许您无需登录服务器即可大规模地远程执行命令和脚本。这消除了使用堡垒主机或 SSH 的需求,提高了安全性。
简化节点管理:
补丁管理器 (Patch Manager): 自动化操作系统和应用程序的补丁管理,帮助您保持软件的最新状态并符合安全基准。
会话管理器 (Session Manager): 提供基于浏览器的交互式 Shell 或远程桌面会话,安全地连接到您的实例,无需打开入站端口或管理 SSH 密钥。
状态管理器 (State Manager): 帮助您定义和维护服务器的配置一致性,例如防病毒定义、防火墙设置等。
清单 (Inventory): 自动收集和审计您的实例上安装的软件清单信息,包括应用程序、文件、网络配置等。
增强可见性:
资源管理器 (Explorer): 提供一个仪表板,显示您的运营数据,帮助您快速了解系统运行状况和性能。
OpsCenter: 集中查看、调查和解决与 AWS 资源相关的操作问题。
安全性和合规性:
通过自动化安全最佳实践、集中管理配置和补丁,帮助您保持系统符合安全和合规性标准。
所有操作都可以通过 AWS CloudTrail 进行审计和记录。
混合云和多云支持:
Systems Manager Agent (SSM Agent) 可以安装在 AWS EC2 实例、本地服务器和虚拟机上,甚至在其他云环境中,从而实现对整个混合和多云基础设施的统一管理。
AWS Systems Manager 的工作原理
安装 SSM Agent: 要使用 Systems Manager,您需要在要管理的每个节点上安装 SSM Agent。这个代理负责与 Systems Manager 服务通信并执行管理任务。
节点注册: SSM Agent 安装后,节点会向 Systems Manager 服务注册,并变为“托管”状态。
定义操作: 您在 Systems Manager 控制台或通过 API 定义您想要执行的操作,例如:
自动化文档 (Automation Documents): 编写 JSON 或 YAML 格式的文档,定义一系列要执行的步骤。
补丁基准 (Patch Baselines): 定义哪些补丁应该被批准或拒绝。
关联 (Associations): 在 State Manager 中创建关联,定义要应用于一组节点的配置状态。
执行操作:
您可以手动触发操作(例如,通过 Run Command)。
可以安排操作在维护时段 (Maintenance Windows) 内执行,以尽量减少对业务的影响。
可以通过 CloudWatch Events 触发操作,响应基础设施中的变化。
监控和报告: Systems Manager 会监控操作的执行情况,并提供详细的日志和报告,以便您跟踪合规性、故障排除和分析。
AWS Systems Manager 的典型用例
大规模补丁管理: 自动为数百甚至数千台服务器打补丁,确保系统安全。
配置管理: 确保所有服务器都具有一致的配置,并自动纠正配置偏差。
自动化日常运维任务: 自动化软件安装、服务重启、文件传输、用户管理等重复性任务。
安全远程访问: 无需 SSH 密钥或堡垒机,安全地远程连接到服务器进行故障排除或管理。
软件清单收集: 自动收集和审计所有服务器上的软件和应用程序信息。
混合云管理: 统一管理 AWS 云中的 EC2 实例和本地数据中心的服务器。
事件响应自动化: 结合 CloudWatch Events,自动响应基础设施事件(例如,当 CPU 利用率过高时自动运行诊断脚本)。
总结来说,AWS Systems Manager 是一个强大的、多功能的管理服务,它通过自动化、集中化和增强可见性,帮助企业高效、安全地管理其在 AWS、本地和多云环境中的大规模基础设施。
过去考试题
AWSリソースの運用状態を包括的に監視し、パフォーマンスの問題や潜在的なセキュリティリスクを事前に特定するとともに、複数のAWSサービスにわたるリソースの自動化された管理を提供するAWSサービスはどれですか?この選択には、リソースの可視性、インシデント対応能力、コンプライアンス管理、および運用効率の向上が含まれます。
正解はB(AWS Systems Manager)です。AWS Systems Managerは、AWSリソースの運用状態を包括的に監視し、パフォーマンスの問題や潜在的なセキュリティリスクを事前に特定する機能を提供します。さらに、複数のAWSサービスにわたるリソースの自動化された管理を可能にし、運用効率を向上させます。Systems Managerには、パッチ管理、インベントリ追跡、設定管理、自動化タスク、セキュリティ管理などの機能が含まれており、問題文で述べられている要件を最も包括的に満たしています。
選択肢 A:AWS CloudWatchは主にモニタリングとアラートに特化しており、リソースの自動管理や包括的な運用管理機能は提供していません。
選択肢 C:AWS Configは主にリソースの設定変更の追跡と評価に焦点を当てていますが、Systems Managerほど包括的な運用管理やセキュリティ機能は提供していません。
選択肢 D:AWS CloudTrailは主にAWSアカウント内のアクティビティの監査に使用されますが、リソースの直接的な管理や自動化機能は提供していません。