What is TAMIS ?


타미스(TAMIS)는 복잡하고 다양한 IT 운영 환경에서 안정적인 서비스 운영에 필요한 기능들을 제공하는 새로운 관점의 서비스 인터페이스 모니터링 솔루션입니다.

전사적 규모의 서비스 모니터링과 장애예방이 가능한 환경을 합리적인 비용으로 구축할 수 있으며, 효율적인 기능을 통해 높은 ROI를 획득할 수 있습니다.

  • Interface Flow Map 기반 서비스 통합 모니터링 솔루션

    서비스에 참여하는 서버와 프로세스에 대한 연결관계(인터페이스) 관점의 모니터링 환경을 제공합니다. 사용자는 서버와 프로세스들의 관계를 직관적으로 추적 · 확인함으로써 취약점을 빠르게 파악하고 문제상황을 선제적으로 조치할 수 있습니다.
  • 효율적인 통합 로그 모니터링 솔루션 

    서비스에 참여하는 서버와 솔루션들이 생산하는 주요 로그 텍스트를 실시간으로
    사용자에게 전달하고, 원격지 서버의 로그파일을 별도 로그인 절차 없이 브라우저에서 테일(Tail) 하거나 내용을 확인(Reader)할 수 있습니다.
  • 강력하고 효과적인 장애예방 도구

    서버의 주요 성능 · 상태 지표 및 서비스 포트, 네트워크 연결, 서비스 프로세스의 상태, 로그 텍스트 등 다양한 상황에 대한 경보를 제공합니다. 이러한 강력한 경보기능을 통해 문제 상황을 신속하게 인식하고 조치함으로써 장애를 예방할 수 있습니다.

  • 사후 성능분석 및 외부 솔루션 연계

    실시간으로 수집하는 성능 · 상태 정보를 이용하여 다양한 분석정보를 제공하고, 과거
    시점의 서버 및 프로세스, 인터페이스 상황을 재현하여 분석할 수 있습니다. 외부 솔루션(APM, DPM등)과 기능연계를 통해 안정적이고 효율적인 서비스 운영이 가능합니다.

제품 특징


Interface Flow Map기반 토폴로지를 이용하여 복잡한 IT환경의 성능 및 상태에 대한 직관적인 모니터링 방법을 제시합니다.

또한 편리한 로그관리와 신속한 경보발송, 정확한 사후분석 등 차별화된 기능을 통해 IT 운영환경에 대한 효율적인 관리방법을 제시합니다.

  • TOPOLOGY of Hosts & Processes

    관리되는 서버들간의 네트워크 연결관계와 프로세스들의 네트워크 연결관계에 대한 직관적인 토폴로지 제공

  • Trace TOPOLOGY of Processes

    특정 프로세스를 기준으로 네트워크로 연결된 다른 프로세스들 추적하여 서비스에 참여하는 프로세스 관계 분석 토폴로지 제공


  • Docker Container Monitoring

    도커를 운영 중인 서버의 파악과 도커 컨테이너 운영 상황 및 성능 분석

  • Point-in-time Analysis

    과거 특정시점의 서버 및 프로세스 토폴로지와 리소스 사용 현황을 재현하여 분석
  • Log Read & Live Tail, Event Log Monitoring

    이슈 및 장애분석을 위한 이벤트 로그 기반의 실시간 로그 모니터링 및 분석 방법 제공
    원격지 서버 프로세스에서 사용되고 있는 로그파일을 브라우저에서 실시간으로 확인
  • Provide Log Text to 3rd-party Solutions 

    3rd-Party 솔루션과 연계하여, 원격지 서버에 분산되어 있는 로그파일의 로그 텍스트를 타미스(TAMIS)가 RestAPI 방식으로 제공
    (예시: Jennifer v5.5 의 Transaction Profile)


주요 기능


타미스는 안정적이고 효울적인 IT 서비스 운영을 위한 다양한 기능을 제공합니다.

 클라우드 및 컨테이너 환경이나 MSA와 같은 매우 복잡한 IT환경에서 대규모 서버의 가동상황을 대시보드 및 경보기능을 이용해 효율적으로 모니터링 할 수 있으며,

원격지 서버에서 생산되는 주요 로그파일을 브라우저에서 확인하거나 대용량 로그 파일에 대한 작업을 쉽고 빠르게 수행할 수 있습니다.

토폴로지 대시보드

  • Interface Flow Map

    서비스에 참여하는 서버와 프로세스들의 관계를 가독성이 높은 토폴로지 행태로 제공
    합니다. 실시간으로 연결관계를 손쉽게 파악할 수 있으며, 다양한 성능지표를 즉시
    확인 할 수 있습니다. 또한 과거 특정시점의 서버 및 프로세스 상태를 재현하고,
    그 시점의 성능지표 분석도 가능합니다.

    - 특정 서버 및 프로세스의 성능지표를 실시간으로 확인할 수 있는 매트릭스 정보 제공

    - 네트워크 상태(Netstat) 정보 및 해당 서버에서 발생한 경보(Alert) 내역 제공

    - 실시간으로 발생하는 경보 확인 및 외부 알람(E-mail, Slack)으로 연계 가능

    - 특정시점을 기준으로 서버 및 프로세스들의 연결관계 토폴로지와 성능정보 재현

    - 프로세스 로그파일의 내용 확인 또는 실시간 테일(Tail)을 브라우저에서 수행 가능

  • Service Interface & Tracing Processes

    특정 서비스에 연결된 프로세스들을 연결 상태를 인터페이스 플로우 맵으로 제공합니다. In-bound 및 Out-bound 연결정보를 제공하고, 서비스 연결 상황을 과거 특정
    시점을 기준으로 재현할 수 있습니다. 또한 특정 프로세스의 이러한 연결 상태를
    추적하면서 성능 및 상태를 분석할 수 있습니다.

    - 서비스(Listen) 포트를 소유한 프로세스들에 대한 상태 모니터링

    - 주요 서비스(Listen) 포트가 Listen 되지 않는 상황에 대한 실시간 경보 제공

    - 과거 시점을 기준으로 서비스 프로세스들의 In/Out-bound 상황을 재현하여 분석

    - 서비스 프로세스의 성능지표를 실시간으로 확인 가능

    - 특정 서비스에 연관되어 있는 프로세스를 추적하면서 성능 및 상태 분석 가능

  • 성능 Metrics

    서버와 프로세스의 성능 및 상태를 신속하게 파악할 수 있는 메트릭스를 실시간으로 제공하며, 이를 이용하여 과거 특정 시점에 대한 서버 및 프로세스의 상태 재현과 성능 분석이 가능합니다. 또한 텍스트 기반의 Top 기능을 브라우저에서 제공합니다.

    - 서버의 OS 정보, CPU Spec, 네트워크 설정 정보 제공

    - CPU, 메모리, 디스크 I/O, 네트워크 I/O 및 CPU 상위 5개의 프로세스 정보 제공

    - 특정 프로세스의 기본 정보와 CPU, 메모리 사용량 추이 및 프로세스 명령어 제공

    - 실시간 모니터링 및 과거 특정 시점의 상황을 재현 및 분석 기능 제공

    - Top 기능으로 서버의 전체적인 성능 정보를 사용자가 익숙한 텍스트 형태로 제공

  • Docker & Container 모니터링

    서버 인터페이스 플로우 맵에서 도커가 동작 중인 서버를 한 눈에 파악할 수 있으며, 운영 중인 도커와 가동 중인 컨테이너의 성능과 상태를 실시간으로 확인 할 수 있습니다. 또한 컨테이너 내에서 수행 중인 프로세스의 상태와 성능도 확인 가능합니다.

    - 서버 토폴로지에서 도커 구동 여부를 손쉽게 파악하고 성능 지표와 정보 확인 가능

    - 서버 목록 테이블에도 도커가 구동 중인 서버는 도커 아이콘을 표시하여 신속 파악

    - 서버에서 동작 중인 컨테이너의 상태 및 성능 정보 제공

    - 서버에서 동작 중인 컨테이너 내에서 실행된 프로세스와 성능 정보 제공

    - 특정 컨테이너 내에서 동작 중인 프로세스들의 성능 정보 제공

통합 로그 모니터링

  • 실시간 로그 텍스트 감지

    가동 중인 서버의 로그파일에서 특정 로그 텍스트를 실시간으로 감지하여 경보를 비롯한 다양한 부분에 활용할 수 있습니다.

    - 주요 로그파일에서 발생하는 로그 텍스트를 실시간으로 감지하여 통지 가능

    - 정규식(Regular Expression)이나 문장 파싱을 이용하여 다양한 감지 조건 설정 가능

    - 로그 경보는 발생시간, 발생서버, 발생위치 등의 정보와 로그 텍스트를 함께 제공

    - 해당 로그 텍스트가 발생한 시점의 일부(4KB) 로그 텍스트 다운로드 기능 제공

  • 원격지 로그 읽기

    원격지에 있는 로그파일을 시스템 로그인 없이 브라우저에서 확인할 수 있으며,
    라이브 테일(Tail)을 통해 실시간으로 추가되는 로그 내용을 추적할 수 있습니다.

    - 프로세스가 사용하는 로그파일들의 목록을 확인하고, 파일을 선택하여 내용 확인

    - 시스템 로그인 없이 브라우저에서 주요 로그파일에 대한 라이브 테일(Tail) 기능 제공

    - 로그 파일에 기록된 보안정보(개인정보)의 패턴을 마스킹(Masking)처리하여 제공

    - 보안정보 마스킹은 로그파일 보기, 라이브 테일, 로그파일 다운로드 등에 모두 적용

  • 이벤트 로그 연관 분석

    웹 서버, 애플리케이션 서버, 데이터베이스 등 서로 다른 솔루션에서 발생한 이벤트
    로그들을 동일한 이벤트를 기준으로 연결하여 분석할 수 있습니다.

    - 주요 솔루션의 로그 파일에서 감지된 특정 이벤트 로그의 발생 횟수를 시간대 별로
       비교하며 분석 가능

    - 병목 또는 장애 발생 시점에 솔루션의 로그파일에서 오류 관련 내용의 발생 빈도와
      시간 차이를 분석할 수 있어 효율적인 장애 예방과 신속한 복구 계획 수립 가능

  • 원격지 대용량 로그 텍스트 분석

    원격지에 있는 대용량 로그파일에서 특정 로그 텍스트의 발생빈도를 효율적으로 추출
    하고 분석할 수 있는 방법을 제공합니다.

    - 로그 파일 20개의 블록으로 분리하여 로그 텍스트의 발생빈도를 분석하고,
     특정 블록을 다시 20개의 블록으로 분리하여 분석하는 작업을 반복하여 수행

    - 로그파일에 대한 전체 다운로드 또는 블록 단위로 다운로드가 가능하며, 대용량 로그
     파일에 대한 텍스트 분석 및 필요 부분의 다운로드 작업을 빠르고 효과적으로 수행

실시간 경보(Alert) 및 솔루션 연계

  • 서비스 장애예방 경보

    서비스에 관여하는 포트와 프로세스 등의 상태를 실시간으로 감지하여 경보를 발생 시킬 수 있으며, 필요한 경우 외부 경보 시스템(E-mail, Slack)과 연계할 수 있습니다.

    - 서비스에서 사용하는 서비스 포트가 준비(Listen) 상태가 아닐 경우 경보 발생

    - 프로세스가 실행 중이지 않거나 실행 중인 프로세스의 개수가 다를 경우 경보 발생

    - 연결되어 있어야 하는 외부 서비스가 연결 되어 있지 않은 상황에 대한 경보 발생

    - 경보 발생 시 사용자 메시지를 지정할 수 있으며, 외부 알람으로 연계 가능

    - 경보 발생 시 수행할 스크립트 및 Command 지정 가능

  • 성능지표 임계치 경보

    운영 중인 서버의 다양한 성능지표 및 상태지표에 대하여 임계값을 정의할 수 있으며,
    조건을 만족할 경우 경보를 발생 시킬 수 있습니다.

    - 서버의 시스템 자원, 파일시스템, 네트워크 등 성능 및 상태에 대한 임계값 적용 가능

    - 실시간 성능 매트릭스와 지난 요일 통계값 기준의 임계값 적용 가능

    - 지난 요일의 상태와 비교하여 특별한 차이가 있을 때 경보 발생 가능

    - 경보 발생 시 사용자 메시지를 지정할 수 있으며, 외부 알람으로 연계 가능

    - 경보 발생 시 수행할 스크립트 및 Command 지정 가능

  • 경보발생 내역 보고서

    발생된 경보에 대한 내역을 다양한 형태의 분석 화면으로 제공하며, 이를 통해 시스템
    전반에 대한 운영 상황을 신속하게 파악할 수 있습니다.
    - 서버 그룹 별 또는 특정 서버에서 일자별/시간별로 발생한 경보 내역 제공
    - 경보 메트릭스 별 발생률 분석과 Critical/Warning 분포를 그룹 별 서버 별로 확인
      가능
  • 3rd-party 솔루션 연계

    타미스는 RestAPI를 이용하여 외부 솔루션으로 로그 텍스트를 제공할 수 있으며, 현재 제니퍼(APM)와 연계하여 토폴로지 대시보드에서 AP모니터링 정보를 제공합니다.
    - 트랜잭션 실행시간에 발생한 WAS 로그의 텍스트 내용을 제니퍼 화면에서 확인 가능
    - 원격지 서버에 접속할 필요 없이 로그 텍스트를 확인할 수 있으므로 사용자는
      트랜잭션 성능분석 시간을 획기적으로 절감할 수 있음

제품 활용


타미스는 IT 운영환경의 다양한 상황에서 장애감지 또는 성능 분석 등에 효과적으로 활용할 수 있습니다.

다음은 사용 방법의 이해를 돕기 위해 토폴로지 대시보드를 활용하는 일부 예시 입니다.

  • 과거 장애시점 운영상황 재현 및 분석

    1. 서비스와 연계된 서버들에 대한 과거 장애시점의 토폴로지 재현 분석
    2. 장애 시점의 네트워크 연결관계 및 서버 성능정보와 Netstat 정보 확인
    3. 장애 시점에 서비스에 참여한 프로세스들의 성능정보와 자원 사용량 분석
    4. 특정 서버와 특정 프로세스의 장애시점 이전 최대 1시간의 자원사용량 추이 분석
    5. 해당 서버에서 장애 시점에 발생한 매트릭스 경보 및 로그 텍스트 내역 확인

    [과거 장애시점 서버 토폴로지 재현 분석]


    [과거 시점 프로세스 성능정보 재현 분석]


    [과거 시점 특정 프로세스에서 발생한 경보 분석]
  • CPU/Memory 과다 사용 프로세스 추적 

    1. 서버 토폴로지에서 메모리 과다사용 서버를 확인하고 프로세스 토폴로지로 이동
    2. 현재 메모리를 가장 많이 사용하고 있는 프로세스를 찾아 메트릭스 확인
    3. 프로세스 매트릭스에서 프로세스 실행 커맨드(Command)로 실행 인자를 확인하고
        실시간으로 CPU 와 메모리의 추이를 확인
    4.현재 프로세스에서 사용하고 있는 로그 파일의 내용을 라이브 테일로 실시간 추적

    [메모리 과다사용 서버 확인]


    [자원 과다사용 프로세스 확인]


    [프로세스의 로그파일 추적]