웹서비스 성능관리 시스템 SmartSQM 소개서5.5

Download Report

Transcript 웹서비스 성능관리 시스템 SmartSQM 소개서5.5

최종 사용자 관점의 웹 서비스 성능 관리
SmartSQM
실시간 전구간 성능 모니터링
Agentless
최종 사용자 체감 성능 측정
성능 저하 원인 파악
November 2013
http://www.yire.net Tel:02-2118-7114~5
Contents
1
제안 배경
2
제품 개요
3
주요 기능
4
주요 특장점
5
상세기능소개
6
도입 효과
7
주요 성공사례
8
주요 고객
1. 제안 배경
전통적인 웹 서비스 성능 관리 체계
각각의 고유 영역만을 관리하는 포인트 솔루션으로 전체적인 웹 성능을 관리
인프라의 시스템 자원만을 모니터링 하고 있음
인
프
라
중
심
의
성
능
관
리
애플리케이션 성능 관리
시스템 리소스 관리
네트워크 트래픽 관리
WAS, DB트랜잭션 성능 문제
SMS
시스템 부하
NMS
과도한 트래픽
Last-Mile
User
APM
Middle-Mile
Network
데이터센터
현재
Front-Mile
Server, DB, APP
1. 제안 배경
인프라 중심의 성능 관리 체계의 현실
실제 최종 사용자가 체감하고 있는 서비스 성능 수준을 알 수 없음
Real End-User
Internet
Router
Firewall
NMS로 모니터링
Switch
Web
Tier
SMS로 모니터링
Application
Tier
Database
Tier
APM 솔루션, DB 모니터링 솔루션
불만 지속
국가/지역
디바이스별
 고사양 서버
 고가용성 시스템
 최신 OS
인프라 관점의 성능관리
환경별
다양한 문제 발생
 Network: 정상
 System: 정상
 App & DB: 정상

장애가 발생 하였는데 WAS나 DB 모니터링 만으로는 원인이 명확하지 않음.

홈페이지 응답속도가 늦다고 장애가 접수 되었는데 네트웍 문제인지, 웹서버 문제인지, 사용자 PC의
문제인지 원인을 알 수 없음.

특정한 사용자만 인터넷 접속이 안 되거나 응답속도가 늦다고 하는데 도저히 원인을 찾을 수 없음

장애가 발생 했는데 그 당시의 상황을 그대로 재현 하여 원인을 찾아야 함
1. 제안 배경
효율적인 웹 서비스 성능 관리를 위한 관점의 변화가 요구됨
최종 사용자의 성능이 서비스의 성능 기준이 되야 하며 사용자까지 모니터링 영역 확대 필요
사용자 관점의 성능 관리
인프라 중심의 성능 관리
최종 사용자의 성능 기준
 어플리케이션 성능 관리
 시스템 리소스 관리
 네트워크 트래픽 관리
성능 관리 방안의
변화 필요
실제 사용자가 체감하는 속도가
웹 서비스의 성능 기준이 됨
서비스 가시성 확장
전구간 모니터링을 통한 사용자
의 성능과 서비스 성능 현황을
파악
 전구간의 성능을 모니터링 할 수 있는 End-to-End 성능 관리 필요
요구 사항
 사용자가 성능 불만을 제기하기 전에 먼저 인지하고 신속히 해결할 수 있는 능력이 요구
 사용자와 서버간의 영향도를 상관 분석하여 서비스 가용성 분석이 요구
 최종 사용자의 성능 문제를 비즈니스에 반영할 수 있는 도구 필요
2. 제품 개요
SmartSQM 소개
SmartSQM은 사용자와 서버간 상호 작용시 발생되는 행위를 기반으로 전체 구간의 웹 서비스 성능을
포괄적으로 관리하는 최종 사용자 관점의 성능 관리 솔루션입니다.
트랜잭션 추적
서비스 성능/상태 모니터링
App 응답속도
구간별 응답속도
Visibility
Availability
전구간 성능 모니터링
성능/행위 분석
사용자 체감 속도 측정
트래픽 분석
위협, 유해 사용자 경고
Real End-User
Internet
Router
Firewall
Web Server
SmartSQM
NMS로 모니터링
SMS로 모니터링
Application
Server
Database
Server
APM 솔루션, DB 모니터링 솔루션
2. 제품 개요
SmartSQM의 설치 구성
Agentless방식으로 쉽고 빠른 구성이 가능하며 운영 시스템에 영향을 주지 않습니다.
스위치의 포트 미러링 사용
Switch
Internet
Port mirroring
WEB
SmartSQM
TAP 스위치 사용
TAP
Internet
Mirroring
SmartSQM
WEB
3. 주요 기능
주요기능 요약
End-to-End
실시간 모니터링
•
•
•
•
모든 영역의 관점(사용자, 네트워크, 서버)에서 접근할 수 있는 통합 모니터링
비즈니스 관점의 서비스 현황 모니터링
사용자, 서버 상태 모니터링
서비스 이상 징후 실시간 모니터링
성능 분석
•
•
•
국가별/지역별/사용자 환경별(OS, 브라우저, 모바일 기기) 성능
URL 서비스, 서버, 사용자, 세션별 성능
구간별 응답속도 측정
원인 분석
•
•
•
•
사용자 트랜잭션 추적을 통한 불만 해결
위협, 유해 요소 실시간 탐지 및 경고
트랜잭션 성능 로그 저장, 재현 분석(타임 머신 회귀 분석)
이벤트 시점의 드릴다운 분석
최종 사용자
체감 속도 측정
•
•
•
실제 최종 사용자 관점의 로딩 시간을 측정
웹 서비스 가용성 분석 및 성능 수준 검증
각 컴포넌트별 서비스 성능 분석
통계 및 보고서
•
•
•
국가별/지역별/사용자 환경별 성능 통계 지표
서버, URL, 응답코드, 브라우저, 국가, 지역별 보고서
다양한 포맷 형태의 파일 추출 및 기간별 통계
4. 주요 특장점
실시간 사용자 행위 분석(UBA)을 통한 웹 서비스 성능관리 특허 획득
• 1초당 실시간 성능 모니터링
- 서비스 상태를 1초당 실시간 모니터링
- 최종 사용자 관점의 성능 분석
• 유연한 설치 구성
Service
Quality
Managent
- Agentless 방식의 구성으로 기존 서비스에 영향이 없음
- 유지보수가 쉬우며 관리가 매우 용이함
• L7기반 DDoS 탐지
- Slowrolis, RUDY, HTTP flooding등 L7기반의 공격 탐지 경고
- 사용자 행위 분석을 통한 악의적인 행위 실시간 확인
• 다양한 성능 분석 도구 제공
- 트랜잭션 실시간 추적
- 대용량 데이터 분석을 통한 이벤트 시점의 회귀 분석
SmartSQM
Agentless
Insightful
Analysis
• 강력한 커스터마이징
-
120여 가지의 기초 데이터를 이용한 다양한 대시보드 제공
HTTP, HTTPS외 SAP, RTSP, SIP등 비디오, 보이스 프로토콜 지원 가능
마이플랫폼 환경 커스터마이징 지원
APM 솔루션 통합 연동 지원
Real-time
Performance
Monitor
5. 상세 기능 소개 – 통합 대시보드
실시간 대시보드
운영자는 성능 저하 문제 발생시 모든 관리 영역(N/W, SERVER, APP, USER)의 관점에서 통합 분석이
가능합니다.
실시간 대시보드
모든 관리 영역의 관점에서 접근
1
서비스의 이상
징후 인지
사용자
네트워크 구간
의 상태와 추
이를 분석
네트워크
서버 상태 상
세 모니터링
2
3
4
사용자의 영향
도 및 연관성
을 분석
커스터마이징 대시보드
서버
5. 상세 기능 소개 –통합 모니터링
실시간 서비스 전구간의 성능 및 사용자 행위 모니터링
사용자가 어떤 서버에 접속해 있고 제공받는 서비스 품질이 어떠한지, 사용자의 행위가 인프라에 어떠
한 영향을 주고 있는지에 대한 성능 저하 요인을 실시간 모니터링 합니다.
엔드-투-엔드 통합 모니터링
웹서버의 문제인지?
어플리케이션 서버의 문제인지?
특정 사용자가 서버에 부하를 주고 있는지?
세션별 내부 네트워크 문제인
지, 외부 네트워크 문제인지?
가장 성능이 저하되는 서비스는?
5. 상세 기능 소개 – 구간별 응답속도
구간별 성능 모니터링
어느 구간에 성능 문제가 발생하는지 각 구간에 대한 응답 속도를 측정하여 분석 할 수 있습니다.
4
3
Request time
단말기의 성능이 좋지 않
거나 네트워크 성능이 좋
지 않을 경우
4
WAS와 DB의 트
랜잭션 성능이
좋지 못할 경우
App(µ) latency
Dynamic Content
WEB
1 Client RTT
외부 네트워크
구간이 느릴 경우
WAS
2 Server RTT
내부 네트워크
구간이 느릴 경우
5
Web(µ) latency
Static Content
6
Download (Response) time
1
5
2
3
6
DB
웹서버 성능이 좋
지 못할 경우
5. 상세 기능 소개 – 사용자 체감 속도 측정
사용자 관점의 서비스 응답속도 모니터링
한 페이지를 로딩하는 속도와 컴포넌트별 로딩 속도를 분석하여 사용자가 체험하는 웹 서비스 성능 수
준을 파악할 수 있습니다.
페이지 로딩 시간 측정
최종 사용자 관점의 성능 분석
사용자 체감 속도
•
•
•
사용자 환경별 페이지 로딩 타임 측정
컴포넌트별 성능 분해 분석
서버별 가용성 측정
Delay
Loading………….
Loading complete.
사용자 체감 속도를 저하
시킨 원인 확인
사용자 컴포넌트별 상세 분해 분석
5. 상세 기능 소개 – 사용자 체감속도 측정(계속)
단위 서비스, 업무별 체감 성능 분석
단위업무를 구성하는 컴포넌트를 그룹핑하여 서비스 페이지의 실제 체감 성능과 성능 문제를 실시간
모니터링 합니다.
페이지 로딩 시간 측정
단위 업무별 체감속도 분석
•
•
•
단위 서비스별 성능
모니터링
서비스별 실제 체감 속도 측정
단위 업무별 성능 저하 원인 분석
서비스 성능 수준 파악(SLA)
서비스별/업무별 그룹핑
메인 화면
회원가입
서비스1
서비스1-1
서비스1-2
서비스 목록 설정
사용자의 체감 속도 단위: 한 페이지
구성 컴포넌트
5. 상세 기능 소개 – 사용자 성능 추적 및 분석
사용자 성능 문제, 행위 정밀 추적 분석
어떤 컴포넌트가 느린지, 어떤 구간이 느린지 해당 사용자의 트랜잭션을 정밀 분석하여 고객 불만에 대
한 업무 대응력을 크게 향상시킬 수 있습니다.
사용자 단말의 지연 현상 확인
특정 사용자의 성능 불만 해결
•
•
•
세션별 응답 지연 구간 확인
단말기의 지연 현상 확인
상위 장비로부터의 세션 종료 현상 확인
 특정 사용자만 문제가 되는 경우
 특정 세션만 문제가 되는 경우
 사용자의 성능 문제를 분석해야 할
경우
비정상적으로 세션이
종료될 경우 확인
어떤 세션에서 지연이
되었는지 확인
 사용자 단말의 지연 현상 확인
Bar 상태의 간격이 비정상적으로 길고 Client
RTT값이 높으면 사용자 단말의 성능저하나 네
트워크 문제로 인한 지연상태로 간주
각 세션별 응답시간을
표현색에 따라 출력
Client RTT
Server RTT
Request Time
Latency Time
Response Time
5. 상세 기능 소개 – 서비스 가용성
서비스 성능 모니터링
서비스의 성능, 각 컴포넌트별 가용성을 모니터링 하여 해당 서비스의 성능 수준을 확인할 수 있습니다.
서비스 지연을 경험한 비율
서비스 성능 수준 분석
서비스 성능 저하 요인
컴포넌트 확인
5. 상세 기능 소개 – 성능 통계 지표
사용자 환경별 성능 통계 분석
사용자의 환경적 요소별 성능 문제를 모니터링하고 분석하여 향후 비즈니스 전략에 반영할 수 있는 정
량화된 지표를 생성합니다.
어떤 국가가 느린지?
영향을 받았던 지역은?
가장 느린 ISP는?
가장 느렸던 사용자는?
모바일 디바이스별 속도는?
OS에 따른 서비스 연관성은?
브라우져별 성능 및 에러는?
5. 상세 기능 소개 – 장애 모니터링
서비스 이상 징후 예측
서비스 이상 징후를 실시간 탐지, 예측하여 심각한 문제가 발생하기 전 사전 대응을 할 수 있습니다.
사용자의 비정상 행위
서버 응답 지연 발생
성능 추이 실시간 모니터링
응답시간, 데몬, OS의 문제
5. 상세 기능 소개 – L7 DDoS탐지/경고
위협 요소 실시간 탐지 및 경고
방화벽, IPS를 통과한 지능적인 L7기반의 위협 요소를 최종 단계에서 탐지하여 최적의 운영 환경을 유
지할 수 있도록 합니다.
성능 저하 요소 경고
•
•
•
•
•
•
•
•
•
Layer 7 기반의 유해요소 탐지 경고
Slow HTTP Post(RUDY)
HTTP Slowloris
HTTP Slow Read
HTTP CC Attack
HTTP GET Flooding
Fast Attack
Syn Flooding
Slowloris
SCAN
RUDY
방화벽
IPS
www
 방화벽과 IPS 모두 있지만 외부로 부
터 지속적인 공격이 의심되는 경우
 정상 트래픽이지만 사용자의 악위적
인 행위에 의해 발생되는 서버 위협
트래픽 감지
5. 상세 기능 소개 – 회귀 분석
사후 정밀 원인 분석
단순 로그 저장이 아닌 서비스 상태에 대한 해당 시점의 분석된 성능 데이터를 저장, 재현 하여 과거 시
점의 성능 문제를 분석합니다.
특정 시점의 성능을 재현/분석
•
•
타임 머신 분석
대용량 데이터 초고속 검색
대용량 데이터의 초고속 검색
과거
1
2
3
4
성능 로그 포맷
이벤트 시점
현재
 과거 시점의 성능 상태를 재현하여
문제점을 명확히 분석
 서버와 사용자간 영향도 상관 분석
1 서버의 부하, 리소스는?
2 사용자 행위로 인한 영향도는?
3 서비스 성능, 상태는?
4 정상적으로 서비스 완료되었나?
5. 상세 기능 소개 – 통계 및 리포트
통계 데이터 및 분석 리포트
성능 요소별, 서버별 다양한 성능 통계 리포트를 제공합니다.
유연한 리포트 제공
•
•
•
14가지의 보고서 파일 포멧 지원
(pdf, xls, hwp, html, txt, doc, jpg등)
데이터 Export기능
요소별 사용자 지정 리포트 생성
6. 도입 효과
운영자
관리자
경영자
• 사용자 구간의 가시성 확장을 통한 효율적인 웹 서비스 성능 관리
• 신속한 원인 파악을 통해 인적, 물적 자원 낭비 방지
• 성능 저하 문제를 신속하게 식별, 사전 예방함으로써 고객의 불만 해결
• IT 인프라 투자 대비 서비스 성능 향상 효과 검증 및 효율성 판단
• 장애 징후의 신속한 탐지로 서비스 품질 연속성 및 안정성 향상
• 불필요한 중복투자 방지 및 유지보수 비용 감소
• 서비스 성능 지표를 통한 IT 운영 자원의 최적화 및 향후 투자 계획 수립
SmartSQ
M
성능관리
7. 주요 성공사례 - 공공기관
서울시청 전산센터에 8월 웹 서비스의 성능향상을 위하여 모니터링 시스템을 도입함.
대민서비스와 내부업무시스템의 품질 향상과 운영효율화 및 안정성 확보가 추진 목표.
시스템 구성도 – 내부업무 및 대민 서비스망에 적용
현재상황
 SMS, NMS, ESM 관제툴이 도입되어 운영중
 WAS 모니터링, DB 모니터링 솔루션이 도입되어 있음.
 외산의 관제툴 도입되어 있음
방화벽
추진 배경 및 필요성
패킷 미러링
Collector Port
MGMT
 정보서비스 인프라 중심에서 다양한 분야로 관제포인트
확대
 다양한 장애에 대한 원인파악에 장시간 소요
TAP
Switch
기대효과
저장관리 서버
패킷 수집 및
분석 서버
SmartSQM
웹 서버
WAS
DB
모니터링
 원활한 시스템 운영을 통해 서비스의 품질에 대한 신뢰도
확보
 사후 정밀 분석을 통한 IT인프라 구축에 활용
 사용자관점의 응답시간 모니터링으로 성능지연의 문제점
해결로 고객 만족도 향상
7. 주요 성공사례 - 지자체
추진 배경
도입 효과

서비스 접속 현황에 대한 통계 데이터 추출을 위한 방안 부재

운영 환경 변화에 따라 분리된 환경의 다수의 통계 로그 서버를 추
가 증설해야 하는 상황으로 환경 변화시 마다 불필요한 예산 낭비
발생
 한 대로 운영되고 있는 모든 웹 서비스 성능 통계와 접속 통계를 분
석할 수 있게 되었으며 IT 운영을 위한 예산을 절감시킴
 분리된 웹 서비스 성능 관리의 통합하여 제한된 운영 인력의 업무
효율성을 향상시킴
7. 주요 성공사례 - 기업

스마트TV를 이용하여 다양한 컨텐트를(인터넷, VOD, 펌 웨어 업데
이트 등) 사용하는 최종 사용자의 실제 체감 성능 파악과 성능이 저
하시 문제의 원인을 파악하기 위해 도입

관계사에 제공하는 인프라 서비스의 서비스 성능 관리 방안 부재
추진 배경
도입 효과
 사용자별 성능을 실시간 모니터링 하고 지연 원인을 분석, 개선하여
고객 서비스 품질 혁신에 기여하고 있음
 복잡한 웹 서비스 구간의 성능 관리를 단일화 하므로 써 각 관리영역
에서 발생되는 성능 문제에 대해 신속하게 대응하고 있음
8. 주요 고객
감사합니다.
제품문의 : 이래정보시스템㈜
(02) 2118-7115
www.yire.net