lynx   »   [go: up one dir, main page]

Close

빠른 속도의 팀을 위한 인시던트 관리

서비스 수준 목표(SLO)란 무엇입니까? SLO, SLA, SLI 비교

서비스를 제공할 때는 긍정적인 사용자 경험을 만드는 것이 필수적이며 이는 책임감에서 시작됩니다. 서비스 공급자로서 여러분의 역할은 고객이 회사에 기대하는 수준의 서비스를 받을 수 있도록 하는 것입니다.

고객과 약속을 할 때는 성과를 측정하고 그 약속을 이행했는지 여부를 판단할 방법이 필요합니다. 바로 이 부분에서 다양한 서비스 수준, 특히 SLO가 도움이 됩니다.

SLO, SLA 및 SLI에 대해 들어 보셨을 수도 있지만 SLO가 정확히 무엇인지 알고 계십니까? SLO의 의미 및 SLO가 고객에게 최상의 서비스를 제공하는 데 어떤 도움이 될 수 있는지 알아보세요.

SLO란 무엇입니까?

서비스 수준 목표(SLO)는 제공하는 서비스가 고객의 기대를 충족하는지 확인하기 위해 설정하는 내부 목표입니다. 이 고객 기대치는 여러분과 고객 간의 계약인 서비스 수준 계약(SLA)에 설명되어 있습니다.

SLO가 실제로 어떤 모습인지 궁금하실 수도 있습니다. 스트리밍 서비스를 예로 들어 보겠습니다. 웹 사이트를 통해 동영상 스트리밍 서비스를 제공하는 경우 SLA에 99.9%의 가동 시간이 포함될 수 있습니다. 즉, 스트리밍 서비스가 한 달에 약 43.2분 동안만 가동 중지될 수 있다는 뜻입니다.

SLO는 고객과의 약속이 반영된 내부 목표를 설정할 수 있도록 하여 여기서 중요한 역할을 합니다. SLO가 있으면 팀은 문제에 대한 책임 의식을 가지고 문제가 고객 경험에 영향을 미치기 전에 문제를 식별하고 해결할 수 있습니다.

SLO의 구성 요소

SLO에는 메트릭, 목표기간이라는 세 가지 주요 구성 요소가 있습니다. 메트릭은 가동 중지 시간 또는 대기 시간과 같이 측정 가능한 수치이며 목표는 달성하려는 특정 숫자(예: 99.9%의 가동 중지 시간)입니다. 기간은 1달에서 1년 사이의 범위에서 메트릭을 측정하는 데 걸리는 시간을 나타냅니다.

특정 기간 동안 추적하는 목표 및 메트릭이 있으면 성과를 구체적으로 측정할 수 있습니다. 그러면 인시던트 대응 프로세스의 속도가 빨라져 잠재적인 서비스 문제가 고객에게 영향을 미치기 전에 해결할 수 있습니다.

SLO, SLA, SLI 비교

SLA의 과제

SLO, SLA 및 SLI는 모두 다르지만 서로와 밀접하게 연결되어 있습니다. 이 프로세스는 여러분과 고객이 동의하는 SLA로 시작됩니다. 예를 들어, 24시간 이내에 고객 지원 문의에 응답하겠다고 약속할 수 있습니다.

이 약속을 충족하도록 SLO를 다음과 같이 정의할 수 있습니다. "특정 기간 동안 24시간 이내에 고객 지원 문의에 응답(예: 특정 월에서 90%의 경우)."

이 예시에서는 고객 지원 대응 시간에 해당하는 SLI를 목표로 하고 있습니다.

서비스 수준 목표(SLO)

서비스 수준 목표(SLO)는 일정한 기간 동안 특정 메트릭의 목표 값을 정의합니다. SLO의 실제 예시로는 30일 동안 99.99%의 가동 시간을 들 수 있습니다. 그 결과로 한 달 동안 서비스에 발생하는 가동 중지 시간을 측정하여 4.32분 미만이 되도록 해야 합니다.

서비스 수준 계약(SLA)

서비스 수준 계약(SLA)는 가동 시간, 대응 시간 및 특정 책임과 같은 측정 가능한 메트릭을 설명하는 공급자와 고객 간의 계약입니다.

이 계약은 일반적으로 회사의 법률 및 비즈니스 개발 팀이 작성하며 고객에 대한 공식적인 약속 및 해당 약속을 이행하지 못할 경우 발생할 수 있는 결과를 나타냅니다. 일반적으로 결과에는 재정적 불이익, 서비스 크레딧 또는 라이선스 연장이 포함됩니다.

SLI는 SLO에서 목표로 삼는 메트릭으로, 성과를 추적하기 위해 설정하고 측정하는 내부 목표입니다. 서비스와 이 서비스를 사용하는 고객 간에 체결한 계약인 SLA를 충족하기 위해 이 SLO를 만들 수 있습니다.

Jira Service Management에서는 SLA를 빠르게 만들어 해당 계약을 기반으로 내부 목표를 설정할 수 있습니다.

서비스 수준 지표(SLI)

서비스 수준 지표(SLI)는 SLO를 실제로 얼마나 준수했는지 측정합니다. 예를 들어, SLA에서 99.95%의 가동 시간을 보장하는 경우 SLO에도 동일한 목표가 반영될 수 있습니다. 그러면 SLI는 가동 시간을 실제로 측정한 결과이며 99.9% 또는 99.95%가 될 수 있습니다. SLA를 준수하려면 SLI가 해당 문서에 설명된 약속 수준을 충족하거나 초과해야 합니다.

오류 예산

서비스를 항상 사용할 수 있도록 보장하는 데만 집중할 수는 없으므로 SLO에서 오류 예산은 필수입니다. 가동 시간은 필수적이지만 제품을 혁신하고 업데이트할 시간을 찾아야 합니다. 오류 예산은 오류의 여지가 얼마나 있는지 알려주며 이것을 통해 얼마나 실험하고 혁신할 수 있는지 알 수 있습니다.

SLO가 30일 동안 99.99%의 가동 시간인 경우 그 30일 이내에 허용되는 가동 중지 시간은 약 4분입니다. 그러면 애자일 팀은 서비스 계약을 위반하지 않고 혁신할 수 있습니다.

SLO는 어떻게 작동합니까?

SLO의 작동 방식을 더 명확하게 이해할 수 있도록 SLO의 간단한 예시를 살펴보겠습니다.

추적하려는 주요 메트릭을 파악하는 것부터 시작하세요. 일반적으로 가장 중요한 메트릭 중 하나는 가동 시간이지만 인시던트 관리 시간, 정확도 및 처리량과 같은 메트릭을 사용할 수도 있습니다. 이 예시에서는 가동 중지 시간을 주요 메트릭으로 사용하겠습니다.

SLA에 99.9%의 가동 시간 보장이 포함된 경우 SLO에 반영되어야 합니다. 30일 동안 99.9%의 가동 시간을 목표로 하는 경우 한 달 동안 가동 중지 시간은 43.2분으로 제한됩니다. 가동 시간 모니터링 서비스를 사용하여 한 달 전반의 가동 시간 및 가동 중지 시간을 추적할 수 있습니다.

월말에 SLO를 충족했는지 또는 그러지 못했는지 확인할 수 있습니다. SLO를 충족하지 못한 경우 문제의 원인을 조사하고 해결하는 것이 필수입니다. 오류 예산도 영향을 받지만 그 영향은 인시던트 심각도 수준에 따라 달라집니다.

SLO가 중요한 이유는 무엇입니까?

SLO는 고객에게 최고의 서비스를 제공하는 것의 핵심입니다. SLO는 더 효과적인 고객 경험으로 이어질 뿐만 아니라 성과를 개선하고 공동 작업을 향상하고 계획을 단순화하기도 합니다.

목표를 중심으로 팀 정렬

고객에게 최고의 서비스를 제공하려면 팀워크가 필수입니다. SLO로 명확한 기대치를 설정하면 제품, 엔지니어링 및 비즈니스 팀이 집중할 수 있는 공유 목표를 가지게 됩니다. 모두가 협력하여 달성할 수 있는 공유 벤치마크가 있으면 팀이 계속하여 단합되고 단일 목표, 즉 고객에게 더 나은 서비스를 제공하도록 노력할 수 있습니다.

제품 및 고객 경험 개선

제품 또는 서비스를 제공할 때 중요한 것은 고객 경험입니다. 혁신적인 회사는 스트리밍 서비스의 가동 중지 시간을 최소화하거나 인시던트 커뮤니케이션 및 대응 시간을 향상하는 등 SLO를 사용하여 고객에게 더 효과적인 제품 및 서비스를 제공합니다. SLO는 서비스 문제가 고객에게 영향을 미치기 전에 해결하도록 문제를 식별하는 데도 도움이 됩니다.

더 많은 자동화

자동화는 IT 서비스 관리(ITSM)의 가장 큰 트렌드 중 하나로, 더 효과적인 고객 경험을 제공하면서 비즈니스의 시간 및 비용을 절약해 줍니다. SLO는 자동 모니터링 및 알림을 지원하므로 가동 시간 및 기타 주요 메트릭을 지속적으로 추적할 수 있습니다.

오늘날의 비즈니스 세계에서 경쟁하려면 자동화는 필수입니다. 반복적인 작업을 자동화하면 수동 업무의 필요성이 줄어들어 시간 및 비용을 절약하는 동시에 인적 오류의 위험을 최소화할 수 있습니다.

가동 중지 시간 감소

가동 중지 시간은 비즈니스에만 나쁜 것이 아니라 고객을 경쟁업체에 빼앗기게 되는 부정적인 고객 경험을 만들 수 있습니다. SLO를 사용하면 간단하고 구체적인 메트릭으로 신뢰성을 측정할 수 있으므로 가동 중지 시간을 모니터링하고 이것을 유발하는 문제를 해결할 수 있습니다. 오류 예산은 팀이 감수할 수 있는 위험을 명확히 하여 혁신 및 신뢰성 간의 균형을 맞추는 데 도움이 됩니다.

SLO 모범 사례

SLO는 유용할 수 있지만 몇 가지 간단한 모범 사례를 따르면 DevOps를 간소화하고 SLO의 이점을 최대화하는 데 도움이 될 수 있습니다. 몇 가지 팁은 다음과 같습니다.

  • SLA를 뒷받침: 가동 중지 시간과 같은 메트릭을 추적하고 최적화하여 고객과 맺은 서비스 계약을 준수할 수 있도록, SLO는 SLA를 뒷받침해야 합니다.
  • 단순하게 유지: SLO를 긴 목록으로 정의하는 것은 좋은 아이디어처럼 보일 수 있지만 단순하게 유지하고 중요한 메트릭에 집중하는 것이 좋습니다.
  • 적응: SLO는 확정된 것이 아니므로 고객의 변화하는 요구 사항에 맞게 SLO를 조정하는 것을 두려워하지 마세요.

Jira Service Management로 SLO 관리

SLO는 어떻게 사용하는지 알고 있을 때 강력한 리소스가 됩니다. SLA에 정렬되는 SLO를 만들면 최고의 서비스 및 고객 경험을 제공하도록 보장할 수 있습니다. 가동 중지 시간을 최소화하고 대응 시간을 줄이면 전반적인 서비스가 개선됩니다.

Jira Service Management를 사용하면 소프트웨어 개발 및 IT 팀을 안내하는 SLA 및 SLO를 쉽게 만들 수 있습니다. Jira를 사용하면 팀이 실시간으로 공동 작업할 수도 있어 생산성 및 공동 작업이 향상됩니다. SLO를 시작하는 데 Jira Service Management가 어떤 도움이 될 수 있는지 알아보세요.

다음 단계
Error budget
Лучший частный хостинг