본문 바로가기
BigData/Druid

Driud란?

by 푸푸망나뇽 2021. 11. 22.
반응형

 

Druid란?

공식문서에 의하면 아래와 같이 정의한다.

Apache Druid is a real-time analytics database designed for fast slice-and-dice analytics ("OLAP" queries) on large data sets.

대용량 데이터를 실시간으로 빠르게 분석 및 처리(OLAP쿼리)할수있는 대용량 데이터베이스 

 

Druid의 구성요소

 

Master: Data Availability(가용성) 와 Ingestion(가져오기) 관리

  • Coordinator: 데이터 가용성 관리
  • Overlord: 데이터 삽입 워크로드 할당을 관리

 

Query: 외부 유입 쿼리 처리

  • Broker: 외부 유입 쿼리 처리
  • Router(Optional): Brokers, Coordinators와 Overlords로 리퀘스트를 라우팅.

 

Data: 데이터 삽입 워크로드 실행과 데이터 저장을 담당

  • MiddleManager: 데이터 삽입을 담당
  • Historical: 데이터들을 딥스토리지에 저장을 담당

 

External Dependencies

  • Deep Storage: 데이터 저장소
  • Metadata Storage: 가용 세그먼트 정보, Task 정보등 다양하게 공유되는 메타데이터를 저장. 
  • ZooKeeper: 내부적인 서비스 discovery, coordination 그리고  leader election을 담당.
반응형

'BigData > Druid' 카테고리의 다른 글

Druid Kubernetes Log 설정하기  (0) 2022.03.22
Druid on Kubernetes  (0) 2022.03.21

댓글