Amazon EC2

개요

Amazon EC2(Amazon Elastic Compute Cloud)는 클라우드에서 조정 가능한 컴퓨팅 용량을 제공하는 웹 서비스입니다. 개발자를 위한 웹 규모 클라우드 컴퓨팅이 더 쉽게 가능하도록 설계되었습니다.

이 통합을 활성화해 Datadog에서 모든 EC2 메트릭과 함께 유지관리 일정과 같은 추가 이벤트를 활성화할 수 있습니다.

설정

설치

이미 하지 않은 경우 먼저 Amazon Web Services 통합을 설정하세요.

설정

  1. AWS 통합 페이지에서 EC2Metric Collection 탭에서 활성화되어 있는지 확인하세요.

  2. Amazon EC2 메트릭을 수집하려면 Datadog IAM 정책에 다음 필수 권한을 추가하세요. 자세한 정보는 AWS 웹사이트의 EC2 정책을 참조하세요.

    AWS 권한설명
    ec2:DescribeInstanceStatusELB 통합에서 사용되며, 인스턴스의 상태를 확인합니다. EC2 통합에서 사용되며 모든 인스턴스의 상태를 설명합니다.
    ec2:DescribeSecurityGroupsSecurityGroup 이름과 커스텀 태그를 ec2 인스턴스에 추가합니다.
    ec2:DescribeInstancesec2 인스턴스 및 ec2 클라우드와치 메트릭에 태그를 추가합니다.
  3. Datadog - Amazon EC2 통합을 설치합니다.

참고: Datadog를 통해 EC2 인스턴스의 하위 집합을 모니터링하려면 datadog:true와 같은 AWS 태그를 EC2 인스턴스에 할당합니다. 그런 다음 Datadog AWS 통합 페이지메트릭 수집 탭의 특정 리소스로 메트릭 수집 제한에 해당 태그를 지정합니다.

EC2 자동 음소거

Datadog는 선제적으로 클라우드와치(CloudWatch) API의 호스트 상태를 기준으로 EC2 인스턴스의 수동 종료와 AWS 오토스케일링으로 트리거된 인스턴스 종료를 조용히 모니터링할 수 있습니다. 자동 음소거된 EC2 인스턴스는 자동 음소거된 호스트 표시에 확인 표시하여 다운타임 모니터링에 목록화됩니다. 

EC2 통합은 자동 음소거를 실행하려면 반드시 설치해야 하니 참고하세요. 메트릭 수집이 태그 포함 호스트로 제한되면 태그와 일치하는 인스턴스만 자동 음소거됩니다.

예상되는 EC2 인스턴스 종료에 대한 모니터를 음소거하려면 AWS 통합 페이지에서 EC2 음소거 상자를 확인 표시합니다.

Amazon EC2 자동 음소거

AWS SSM(Systems Manager)를 사용해 에이전트 설치

아래 단계에 따라 AWS Systems Manager를 사용해 EC2 인스턴스에서 Datadog 에이전트를 설치합니다. 클라우드 인스턴스에 Datadog 에이전트를 설치해야 하는 이유를 참조해 Amazon EC2 인스턴스에 에이전트를 설치하면 좋은 이유를 알아보세요.

Amazon Systems Manager UI(권장)를 통한 에이전트 설치

  1. EC2 인스턴스에서 IAM 역할을 설정하여 AmazonSSMManagedInstanceCore 권한을 활성화합니다.

  2. AWS SSM 설명서 탭으로 이동합니다.

  3. datadog를 검색합니다. 참고: AWS 관리 콘솔의 상위 탐색 모음에서 지역을 전환하여 해당 지역의 올바른 설명서를 찾을 수 있습니다.

  4. 필요에 따라 Linux 또는 Windows 설명서 중 하나를 선택하세요.

  • Linux: datadog-agent-installation-linux
  • Windows: datadog-agent-installation-windows
  1. 명령 파라미터를 채웁니다.
  2. 에이전트를 설치할 대상 인스턴스를 선택합니다.
  3. 실행을 클릭합니다.
  4. 확인 상태가 완료될 때까지 기다린 다음 Datadog에서 인프라스트럭처 목록을 점검합니다.

대체 커스텀 에이전트 설치

파라미터 스토어

파라미터 스토어에서 다음을 사용해 파라미터를 생성합니다.

  • 이름: dd-api-key-for-ssm
  • 설명: (선택 사항)
  • 유형: SecureString
  • KMS 핵심 소스: My current account
  • KMS 키 ID: 선택한 기본값을 사용합니다.
  • 값: Datadog API 키
문서

시스템 관리자에서 새로운 문서를 생성합니다.

  • 이름: dd-agent-install
  • 대상 유형: (선택 항목)
  • 문서 유형: Command document
  • 콘텐츠: JSON

Datadog 미국 사이트에 있는 경우 us-east-1runCommand 아래서 <AWS_REGION>으로 업데이트된 파일 dd-agent-install-us-site.json을 사용합니다. Datadog 유럽 사이트에 있는 경우 대신 dd-agent-install-eu-site.json을 사용합니다.

명령 실행

명령 실행에서 명령 실행 버튼을 클릭한 다음 아래 단계를 따릅니다.

  • 명령 설명서:
    • 검색 상자를 클릭한 다음 _소유자 -> 내 소유_를 선택합니다.
    • 문서 옆의 라디오 버튼을 클릭합니다.
    • 필요한 경우 문서 버전을 선택합니다.
  • 대상:
    • 대상 EC2 인스턴스를 선택합니다.
  • 출력 옵션(선택 항목):
    • 클라우드와치 출력 확인란을 선택해 모든 문제를 기록합니다.
  • 기타 섹션(선택 항목)
    • 설정에 필요한 대로 다른 섹션을 수정합니다.

실행 버튼을 클릭하면 상태가 표시된 확인 페이지가 나타납니다. 완료될 때까지 기다린 다음 Datadog에서 [인프라 목록]을 확인하세요.

로그 수집

Datadog 에이전트 또는 또 다른 로그 전달자를 사용하여 Datadog에 로그를 전송합니다.

수집한 데이터

메트릭

aws.ec2.cpucredit_balance
(gauge)
Number of CPU credits that an instance has accumulated.
Shown as unit
aws.ec2.cpucredit_usage
(gauge)
Number of CPU credits consumed.
Shown as unit
aws.ec2.cpusurplus_credit_balance
(gauge)
The number of surplus credits that have been spent by an unlimited instance when its CPUCreditBalance value is zero.
Shown as unit
aws.ec2.cpusurplus_credits_charged
(gauge)
The number of spent surplus credits that are not paid down by earned CPU credits, and which thus incur an additional charge.
Shown as unit
aws.ec2.cpuutilization
(gauge)
Average percentage of allocated EC2 compute units that are currently in use on the instance.
Shown as percent
aws.ec2.cpuutilization.maximum
(gauge)
Maximum percentage of allocated EC2 compute units that are currently in use on the instance.
Shown as percent
aws.ec2.disk_read_bytes
(gauge)
Bytes read from all ephemeral disks available to the instance.
Shown as byte
aws.ec2.disk_read_ops
(gauge)
Completed read operations from all ephemeral disks available to the instance.
Shown as operation
aws.ec2.disk_write_bytes
(gauge)
Bytes written to all ephemeral disks available to the instance.
Shown as byte
aws.ec2.disk_write_ops
(gauge)
Completed write operations to all ephemeral disks available to the instance.
Shown as operation
aws.ec2.ebsbyte_balance
(gauge)
Percentage of throughput credits remaining in the burst bucket for Nitro-based instances.
Shown as percent
aws.ec2.ebsiobalance
(gauge)
Percentage of I/O credits remaining in the burst bucket for Nitro-based instances."
Shown as percent
aws.ec2.ebsread_bytes
(gauge)
Average bytes read from all EBS volumes attached to the instance for Nitro-based instances.
Shown as byte
aws.ec2.ebsread_bytes.sum
(gauge)
Total bytes read from all EBS volumes attached to the instance for Nitro-based instances.
Shown as byte
aws.ec2.ebsread_ops
(count)
Average completed read operations from all Amazon EBS volumes attached to the instance for Nitro-based instances.
Shown as operation
aws.ec2.ebsread_ops.sum
(count)
Total completed read operations from all Amazon EBS volumes attached to the instance for Nitro-based instances.
Shown as operation
aws.ec2.ebswrite_bytes
(gauge)
Average bytes written to all EBS volumes attached to the instance for Nitro-based instances.
Shown as byte
aws.ec2.ebswrite_bytes.sum
(gauge)
Total bytes written to all EBS volumes attached to the instance for Nitro-based instances.
Shown as byte
aws.ec2.ebswrite_ops
(gauge)
Average completed write operations to all EBS volumes attached to the instance for Nitro-based instances.
Shown as operation
aws.ec2.ebswrite_ops.sum
(gauge)
Total completed write operations to all EBS volumes attached to the instance for Nitro-based instances.
Shown as operation
aws.ec2.host_ok
(gauge)
1 if the instance's system status is ok.
aws.ec2.instance_age
(gauge)
Time since instance launch
Shown as second
aws.ec2.network_address_usage
(gauge)
The maximum number of NAU units for a VPC.
Shown as unit
aws.ec2.network_address_usage_peered
(gauge)
The maximum number of NAU units for a VPC and all of its peered VPCs.
Shown as unit
aws.ec2.network_in
(gauge)
Average number of bytes received on all network interfaces by the instance.
Shown as byte
aws.ec2.network_in.maximum
(gauge)
Maximum number of bytes received on all network interfaces by the instance.
Shown as byte
aws.ec2.network_out
(gauge)
Average number of bytes sent out on all network interfaces by the instance.
Shown as byte
aws.ec2.network_out.maximum
(gauge)
Maximum number of bytes sent out on all network interfaces by the instance.
Shown as byte
aws.ec2.network_packets_in
(gauge)
Number of packets received on all network interfaces by the instance
Shown as packet
aws.ec2.network_packets_out
(gauge)
Number of packets sent out on all network interfaces by the instance
Shown as packet
aws.ec2.status_check_failed
(gauge)
1 if one of the status checks failed.
aws.ec2.status_check_failed_instance
(gauge)
0 if the instance has passed the EC2 instance status check.
aws.ec2.status_check_failed_system
(gauge)
0 if the instance has passed the EC2 system status check.

AWS에서 검색된 각 메트릭에는 AWS 콘솔에 나타나는 것과 동일한 태그가 할당됩니다, 호스트 이름, 보안 그룹 등을 포함하되 이에 국한되지 않습니다.

참고:

  • aws.ec2.instance_age는 기본적으로 Datadog - EC2 통합에서 수집되지 않습니다. Datadog 지원에 문의하여 이 메트릭 수집을 활성화하세요.
  • aws.ec2.host_ok는 기본적으로 수집됩니다. Amazon EC2 통합 메트릭 수집을 비활성화한 경우에도 인프라스트럭처 목록에 예기치 않은 호스트가 나타날 수 있습니다. 원치 않는 호스트를 필터링하려면 datadog:true 등 AWS 태그를 해당 EC2 인스턴스에 할당합니다. 그런 다음 Datadog AWS 통합 페이지메트릭 수집 탭의 메트릭 수집을 특정 리소스로 제한에서 해당 태그를 지정합니다.

서비스 검사

aws.ec2.host_status
Returns your EC2 instance statuses as reported by the AWS console. Returns CRITICAL when there is a problem with your instance. Returns UNKNOWN when AWS does not have sufficient data to run a status check. Returns OK when your instance is running or is shut down properly.
Statuses: ok, critical, unknown

즉시 사용 가능한 모니터링

Amazon EC2 통합은 바로 사용 가능한 모니터링 기능을 제공해 성능을 모니터링하고 최적화할 수 있도록 해줍니다.

  • Amazon EC2 개요 대시보드: 바로 사용 가능한 Amazon EC2 개요 대시보드를 사용해 EC2 인스턴스에 대한 종합적인 개요를 확보하세요.
  • 권장 모니터: 권장 Amazon EC2 모니터를 사용해 선제적으로 문제를 감지하고 시기 적절하게 도착하는 알림을 수신합니다.

트러블슈팅

도움이 필요하세요? Datadog 지원에 문의하세요.

참고 자료

PREVIEWING: mervebolat/span-id-preprocessing