Algorithmia

Supported OS Linux

개요

Algorithmia는 데이터 과학자, 애플리케이션 개발자, IT 전문가가 프로덕션 과정에서 기계 학습과 기타 예측 모델을 배포, 관리, 통제, 보안 처리할 수 있도록 도와주는 기능을 갖춘 MLOps 플랫폼입니다.

Datadog 내의 Algorithmia Insights

Algorithmia Insights는 Algorithmia Enterprise 기능으로, 기계 학습 모델을 계측, 측정, 모니터할 수 있는 메트릭 파이프라인을 제공합니다. 기계 학습 분야 모니터링 추론 관련 메트릭 사용 사례에는 모델 드리프트, 데이터 드리프트, 모델 바이어스 등이 있습니다.

이 통합을 이용하면 작동 메트릭은 물론, 사용자 정의, 추론 관련 메트릭을 Algorithmia에서 Kafka로, 또 Datadog 메트릭 API로 스트림할 수 있습니다.

설정

  1. Algorithmia 인스턴스에서 Kafka 브로커(Algorithmia 외부)로 연결되도록 Algorithmia Insights를 구성하세요.

  2. 이 통합에 사용된 Datadog 메시지 전송 서비스를 설치, 구성, 사용해 Kafka 토픽에서 Datadog의 메트릭 API로 메트릭을 전송하려면 Algorithmia 통합 리포지토리를 참고하세요.

검증

  1. Algorithmia에서 Insights가 활성화된 알고리듬을 쿼리합니다.
  2. Datadog 인터페이스에서 Metrics 요약 페이지로 이동하세요.
  3. Insights의 메트릭이 Datadog에 존재하는지 algorithmia로 필터링해 확인하세요.

메트릭 스트리밍

이 통합에서는 Insights가 활성화된 모델이 쿼리되었을 때 Algorithmia에서 메트릭이 스트리밍됩니다. 각 로그 항목에는 작동 메트릭과 추론 관련 메트릭이 포함되어 있습니다.

duration_milliseconds 메트릭은 Algorithmia의 기본 페이로드에 포함되어 있는 작동 메트릭입니다. 처음 시작할 때 이용 편의를 위해 이 기본 메트릭의 대시보드와 모니터도 포함되어 있습니다.

추가 메트릭으로 알고리듬 개발자가 Algorithmia에서 지정한 사용자 정의, 추론 관련 메트릭을 포함할 수 있습니다. 사용자 정의 메트릭은 특정 기계 학습 프레임워크와 사용 사례에 따라 다르지만, scikit-learn의 예측 가능성 값, TensorFlow의 이미지 분류자, 또는 수신 API 요청의 입력 데이터 등과 같은 값을 포함할 수 있습니다. 참고: 이 통합에서 제공하는 메시지 전달 스크립트는 Datadog로 전달될 때 사용자 정의 메트릭에 접두사 algorithmia.를 추가합니다.

수집한 데이터

메트릭

algorithmia.duration_milliseconds
(gauge)
Duration of algorithm run
Shown as millisecond

서비스 점검

Algorithmia 점검에는 서비스 점검이 포함되지 않습니다.

이벤트

Algorithmia 점검에는 이벤트를 포함하지 않습니다.

트러블슈팅

도움이 필요하신가요? Algorithmia 지원팀에 문의하세요.

PREVIEWING: alai97/reorganize-some-sections-in-dora-metrics