XEST Information

타미스는 안정적이고 효울적인 IT 서비스 운영을 위한 다양한 기능을 제공합니다.

클라우드 및 컨테이너 환경이나 MSA와 같은 매우 복잡한 IT환경에서 대규모 서버의 가동상황을 대시보드 및 경보기능을 이용해 효율적으로 모니터링 할 수 있으며,

원격지 서버에서 생산되는 주요 로그파일을 브라우저에서 확인하거나 대용량 로그 파일에 대한 작업을 쉽고 빠르게 수행할 수 있습니다.

Interface Flow Map

서비스에 참여하는 서버와 프로세스들의 관계를 가독성이 높은 토폴로지 행태로 제공
합니다. 실시간으로 연결관계를 손쉽게 파악할 수 있으며, 다양한 성능지표를 즉시
확인 할 수 있습니다. 또한 과거 특정시점의 서버 및 프로세스 상태를 재현하고,
그 시점의 성능지표 분석도 가능합니다.

- 특정 서버 및 프로세스의 성능지표를 실시간으로 확인할 수 있는 매트릭스 정보 제공

- 네트워크 상태(Netstat) 정보 및 해당 서버에서 발생한 경보(Alert) 내역 제공

- 실시간으로 발생하는 경보 확인 및 외부 알람(E-mail, Slack)으로 연계 가능

- 특정시점을 기준으로 서버 및 프로세스들의 연결관계 토폴로지와 성능정보 재현

- 프로세스 로그파일의 내용 확인 또는 실시간 테일(Tail)을 브라우저에서 수행 가능

Service Interface & Tracing Processes

특정 서비스에 연결된 프로세스들을 연결 상태를 인터페이스 플로우 맵으로 제공합니다. In-bound 및 Out-bound 연결정보를 제공하고, 서비스 연결 상황을 과거 특정
시점을 기준으로 재현할 수 있습니다. 또한 특정 프로세스의 이러한 연결 상태를
추적하면서 성능 및 상태를 분석할 수 있습니다.

- 서비스(Listen) 포트를 소유한 프로세스들에 대한 상태 모니터링

- 주요 서비스(Listen) 포트가 Listen 되지 않는 상황에 대한 실시간 경보 제공

- 과거 시점을 기준으로 서비스 프로세스들의 In/Out-bound 상황을 재현하여 분석

- 서비스 프로세스의 성능지표를 실시간으로 확인 가능

- 특정 서비스에 연관되어 있는 프로세스를 추적하면서 성능 및 상태 분석 가능

성능 Metrics

서버와 프로세스의 성능 및 상태를 신속하게 파악할 수 있는 메트릭스를 실시간으로 제공하며, 이를 이용하여 과거 특정 시점에 대한 서버 및 프로세스의 상태 재현과 성능 분석이 가능합니다. 또한 텍스트 기반의 Top 기능을 브라우저에서 제공합니다.

- 서버의 OS 정보, CPU Spec, 네트워크 설정 정보 제공

- CPU, 메모리, 디스크 I/O, 네트워크 I/O 및 CPU 상위 5개의 프로세스 정보 제공

- 특정 프로세스의 기본 정보와 CPU, 메모리 사용량 추이 및 프로세스 명령어 제공

- 실시간 모니터링 및 과거 특정 시점의 상황을 재현 및 분석 기능 제공

- Top 기능으로 서버의 전체적인 성능 정보를 사용자가 익숙한 텍스트 형태로 제공

Docker & Container 모니터링

서버 인터페이스 플로우 맵에서 도커가 동작 중인 서버를 한 눈에 파악할 수 있으며, 운영 중인 도커와 가동 중인 컨테이너의 성능과 상태를 실시간으로 확인 할 수 있습니다. 또한 컨테이너 내에서 수행 중인 프로세스의 상태와 성능도 확인 가능합니다.

- 서버 토폴로지에서 도커 구동 여부를 손쉽게 파악하고 성능 지표와 정보 확인 가능

- 서버 목록 테이블에도 도커가 구동 중인 서버는 도커 아이콘을 표시하여 신속 파악

- 서버에서 동작 중인 컨테이너의 상태 및 성능 정보 제공

- 서버에서 동작 중인 컨테이너 내에서 실행된 프로세스와 성능 정보 제공

- 특정 컨테이너 내에서 동작 중인 프로세스들의 성능 정보 제공

실시간 로그 텍스트 감지

가동 중인 서버의 로그파일에서 특정 로그 텍스트를 실시간으로 감지하여 경보를 비롯한 다양한 부분에 활용할 수 있습니다.
- 주요 로그파일에서 발생하는 로그 텍스트를 실시간으로 감지하여 통지 가능

- 정규식(Regular Expression)이나 문장 파싱을 이용하여 다양한 감지 조건 설정 가능

- 로그 경보는 발생시간, 발생서버, 발생위치 등의 정보와 로그 텍스트를 함께 제공

- 해당 로그 텍스트가 발생한 시점의 일부(4KB) 로그 텍스트 다운로드 기능 제공

원격지 로그 읽기

원격지에 있는 로그파일을 시스템 로그인 없이 브라우저에서 확인할 수 있으며,
라이브 테일(Tail)을 통해 실시간으로 추가되는 로그 내용을 추적할 수 있습니다.

- 프로세스가 사용하는 로그파일들의 목록을 확인하고, 파일을 선택하여 내용 확인

- 시스템 로그인 없이 브라우저에서 주요 로그파일에 대한 라이브 테일(Tail) 기능 제공

- 로그 파일에 기록된 보안정보(개인정보)의 패턴을 마스킹(Masking)처리하여 제공

- 보안정보 마스킹은 로그파일 보기, 라이브 테일, 로그파일 다운로드 등에 모두 적용

이벤트 로그 연관 분석

웹 서버, 애플리케이션 서버, 데이터베이스 등 서로 다른 솔루션에서 발생한 이벤트
로그들을 동일한 이벤트를 기준으로 연결하여 분석할 수 있습니다.

- 주요 솔루션의 로그 파일에서 감지된 특정 이벤트 로그의 발생 횟수를 시간대 별로
비교하며 분석 가능

- 병목 또는 장애 발생 시점에 솔루션의 로그파일에서 오류 관련 내용의 발생 빈도와
시간 차이를 분석할 수 있어 효율적인 장애 예방과 신속한 복구 계획 수립 가능

원격지 대용량 로그 텍스트 분석

원격지에 있는 대용량 로그파일에서 특정 로그 텍스트의 발생빈도를 효율적으로 추출
하고 분석할 수 있는 방법을 제공합니다.

- 로그 파일 20개의 블록으로 분리하여 로그 텍스트의 발생빈도를 분석하고,
특정 블록을 다시 20개의 블록으로 분리하여 분석하는 작업을 반복하여 수행

- 로그파일에 대한 전체 다운로드 또는 블록 단위로 다운로드가 가능하며, 대용량 로그
파일에 대한 텍스트 분석 및 필요 부분의 다운로드 작업을 빠르고 효과적으로 수행

서비스 장애예방 경보

서비스에 관여하는 포트와 프로세스 등의 상태를 실시간으로 감지하여 경보를 발생 시킬 수 있으며, 필요한 경우 외부 경보 시스템(E-mail, Slack)과 연계할 수 있습니다.

- 서비스에서 사용하는 서비스 포트가 준비(Listen) 상태가 아닐 경우 경보 발생

- 프로세스가 실행 중이지 않거나 실행 중인 프로세스의 개수가 다를 경우 경보 발생

- 연결되어 있어야 하는 외부 서비스가 연결 되어 있지 않은 상황에 대한 경보 발생

- 경보 발생 시 사용자 메시지를 지정할 수 있으며, 외부 알람으로 연계 가능

- 경보 발생 시 수행할 스크립트 및 Command 지정 가능

성능지표 임계치 경보

운영 중인 서버의 다양한 성능지표 및 상태지표에 대하여 임계값을 정의할 수 있으며,
조건을 만족할 경우 경보를 발생 시킬 수 있습니다.

- 서버의 시스템 자원, 파일시스템, 네트워크 등 성능 및 상태에 대한 임계값 적용 가능

- 실시간 성능 매트릭스와 지난 요일 통계값 기준의 임계값 적용 가능

- 지난 요일의 상태와 비교하여 특별한 차이가 있을 때 경보 발생 가능

- 경보 발생 시 사용자 메시지를 지정할 수 있으며, 외부 알람으로 연계 가능

- 경보 발생 시 수행할 스크립트 및 Command 지정 가능

3rd-party 솔루션 연계

타미스는 RestAPI를 이용하여 외부 솔루션으로 로그 텍스트를 제공할 수 있으며, 현재 제니퍼(APM)와 연계하여 토폴로지 대시보드에서 AP모니터링 정보를 제공합니다.
- 트랜잭션 실행시간에 발생한 WAS 로그의 텍스트 내용을 제니퍼 화면에서 확인 가능
- 원격지 서버에 접속할 필요 없이 로그 텍스트를 확인할 수 있으므로 사용자는
트랜잭션 성능분석 시간을 획기적으로 절감할 수 있음

과거 장애시점 운영상황 재현 및 분석

1. 서비스와 연계된 서버들에 대한 과거 장애시점의 토폴로지 재현 분석
2. 장애 시점의 네트워크 연결관계 및 서버 성능정보와 Netstat 정보 확인
3. 장애 시점에 서비스에 참여한 프로세스들의 성능정보와 자원 사용량 분석
4. 특정 서버와 특정 프로세스의 장애시점 이전 최대 1시간의 자원사용량 추이 분석
5. 해당 서버에서 장애 시점에 발생한 매트릭스 경보 및 로그 텍스트 내역 확인

[과거 장애시점 서버 토폴로지 재현 분석]

[과거 시점 프로세스 성능정보 재현 분석]

[과거 시점 특정 프로세스에서 발생한 경보 분석]

CPU/Memory 과다 사용 프로세스 추적

1. 서버 토폴로지에서 메모리 과다사용 서버를 확인하고 프로세스 토폴로지로 이동
2. 현재 메모리를 가장 많이 사용하고 있는 프로세스를 찾아 메트릭스 확인
3. 프로세스 매트릭스에서 프로세스 실행 커맨드(Command)로 실행 인자를 확인하고
실시간으로 CPU 와 메모리의 추이를 확인
4.현재 프로세스에서 사용하고 있는 로그 파일의 내용을 라이브 테일로 실시간 추적

[메모리 과다사용 서버 확인]

[자원 과다사용 프로세스 확인]

[프로세스의 로그파일 추적]