로그 분석이란?

로그 분석은 네트워크, 운영 체제, 컴퓨터에서 IT 에코시스템에 포착되는 이벤트에서 수집된 정보입니다.

로그 분석을 통해 사용자 행동의 패턴 또는 예외를 파악하고, 이슈를 식별하며, 보안 이슈를 확인할 수 있습니다.

모니터링

로그 분석을 통해 애플리케이션 전반의 성능, 동작, 예외를 적극적으로 모니터링할 수 있습니다. 선제적인 모니터링을 통해 경보를 트리거하지 않았거나 특이한 설명이 있는 이슈를 식별할 수 있습니다. 경보를 트리거하는지 여부와 상관없이 로그 데이터에 나타납니다.

문제 해결

집계되어 구조화된 데이터를 통해 모든 수준의 문제를 해결할 수 있습니다. 로그 분석은 표준 활동의 기준선을 제공하여 기준선에서 벗어나는 데이터가 발생하는 이유를 파악할 수 있습니다.

보고

IT 팀은 분석 용이성을 위해 정보의 통합 뷰를 제공하는 간략한 대시보드를 사용하여 로그와 메트릭에 대한 가시성을 확보합니다. 대시보드를 통해 로그 분석의 데이터를 사용하여 KPI, SLA, 기타 통계를 강조할 수 있습니다.

트렌드 데이터

로그 분석을 통해 트렌드 데이터와 성장률에 대한 통찰력을 활용할 수 있습니다. 히스토그램을 통해 성장률을 시각화하여 수명주기 관리와 용량 계획에 활용할 수 있습니다.

로그 분석을 위한 소프트웨어는 보안 위반, 앱 설치, 시스템 설정/시작 운영과 같은 IT 에코시스템 전반의 이벤트로부터 정보를 수집합니다.

데이터 정리

활용 가능하고 정확한 데이터를 사용하는 것이 중요합니다. 다음의 경우 데이터가 손상될 수 있습니다.

  • 저장소 디스크가 충돌하는 경우
  • 애플리케이션이 정상적으로 종료되지 않은 경우
  • 시스템이 바이러스에 감염된 경우
  • 입력/출력 구성 이슈가 있는 경우

데이터 구조화

데이터는 다양한 소스로부터 수집되기 때문에 다양한 명명 규칙을 사용하는 경우가 많습니다. 다양한 소스에서 수집한 데이터의 상관관계를 분석하고 용어를 표준화하여 분석 시 혼동과 오류를 줄여야 합니다.

데이터 분석

데이터는 수집, 정리, 구조화를 거쳐야만 검토가 가능합니다. 프로세스, 데이터의 의도된 사용, 데이터 세트의 크기에 따라 분석 방식이 다양합니다. 옵션은 다음과 같습니다.

  • 분류: 데이터를 여러 범주로 분류하는 키워드 태그로 레이블을 적용하면 데이터를 필터링하고 조정하기 편리할 수 있습니다.
  • 패턴 인식: 메시지를 필터링하여 패턴을 탐지하면 데이터 패턴을 인식하여 예외를 탐지할 수 있습니다.
  • 인공 무시: 정기적인 로그 메시지로 인해 밀도가 높아지면 데이터를 분석하기 더 어려울 수 있습니다. 인공 무시는 정기적인 업데이트가 발생하지 않은 경우 추가적인 정기 업데이트를 무시하는 머신 러닝 시스템입니다.
  • 상관관계 분석: 시스템 전체에 걸친 이벤트가 없어 데이터 비교가 불가능한 경우에는 서버, 운영 체제, 네트워크 장치에서 데이터를 수집하는 것은 효과적이지 않을 수 있습니다. 상관관계 분석은 이벤트와 관련된 모든 구성요소의 메시지를 분석합니다.

이는 다각적인 예외 탐지라고도 불립니다.

DevOps

개발자는 지연 및 성능 이슈 문제 해결에 시간을 쓰는 대신 기능성에 중점을 두고 애플리케이션의 가치를 높이는 데 더 많은 시간을 투자할 수 있습니다. 릴리스가 가속화되고 갑작스러운 이슈로 인해 발생하는 지연이 줄어듭니다.

규정 준수

많은 기업은 내부 규정 준수 요구 사항 외에도 HIPAA, PCI DSS, GDPR 등과 같은 표준과 규정을 준수해야 합니다. 로그 분석을 사용하여 정기적인 감사를 실시하여 향후 감사에 실패하지 않도록 하여 조직이 규정을 준수하지 않는 경우 발생하는 벌금을 방지할 수 있습니다.

보안 위협 탐지

기업들은 침입자와 DOS 위협을 비롯한 보안 위협에 더욱 빠르게 대응하고 더욱 효율적으로 근본 원인을 파악할 수 있습니다. 근본 원인을 파악하여 이슈를 해결하면 향후 이벤트를 방지할 수 있습니다.

운영

많은 부서가 IT를 통해 작업과 책임을 수행합니다. 로그 분석을 사용하면 시스템 오류와 이슈로 인해 중단이 발생하기 전에 발견하여 효율적이고 신속하게 해결할 수 있습니다. 로그 분석은 IT 팀, 기타 부서, 고객 간 서비스 수준 계약 유지의 일부이기도 합니다. 선제적인 조치를 통해 서비스 중단 및 제품 다운타임으로 인해 발생하는 수익 손실을 방지할 수 있습니다.

인사이트

조직과 개별 팀은 로그 분석을 통해 의사 결정 프로세스를 개선하고 전략을 평가하며 필요에 따라 조정할 수 있습니다.

판매 및 마케팅 효과 증진

로그를 통해 변환, 트래픽 양, 방문객이 사이트를 탐색하는 방식에 대한 정보를 수집할 수 있습니다. 이를 통해 고객 상호작용을 분석하고 고객 경험에 개선의 여지가 있었는지 또는 판매 팀이 메시징을 조정해야 하는지 여부를 판단할 수 있습니다.

문제 해결

장애가 발생하면 가능한 많은 정보에 액세스해야 합니다. 모니터링 애플리케이션에는 다음의 두 가지 유형이 있습니다.

  • 규칙 기반: 모니터링해야 하는 대상이 파악되면, 로그 분석 도구를 사용하여 애플리케이션 최적화에 대한 오류를 식별할 수 있습니다. 팀은 내부 규칙을 수립하여 여러 채널을 사용하여 경보를 생성할 수 있습니다. 하지만 규칙 기반 유형의 경우, 발생할 수 있는 모든 이슈에 대해 사람들이 알고 있어야 하기 때문에 현재 디지털 서비스 환경에서 확장할 수 없습니다.
  • 머신 러닝 로그 분석: 머신 러닝 도구는 IT 에코시스템 전체에 걸쳐 애플리케이션 동작과 같은 문제와 예외를 자동으로 탐지할 수 있습니다. 이 도구는 데이터를 스캔하고 발생할 가능성이 있는 이슈를 해석합니다.

표준 데이터 분석 도구는 빠르게 확산되는 머신 데이터의 다양한 볼륨을 처리할 수 없습니다. 로그 분석은 IT 시스템이 통찰력을 얻기 위해 생성하는 머신 데이터를 분석하고 시각화합니다.

ServiceNow의 로그 분석

ServiceNow Health Log Analytics는 ITOM Predictive AIOps의 일부로서, 잠재적인 중단의 초기 신호에 대한 경보를 제공합니다.

ServiceNow ITOM Health Log Analytics를 통해 다음을 수행할 수 있습니다.

비즈니스에 따라 확장되는 역량

ServiceNow를 사용하여 문제가 발생하기 전에 문제를 예측할 수 있습니다.