본문 바로가기

BigData/Druid

Driud란?

by 푸푸망나뇽 2021. 11. 22.

Druid란?

공식문서에 의하면 아래와 같이 정의한다.

Apache Druid is a real-time analytics database designed for fast slice-and-dice analytics ("OLAP" queries) on large data sets.

대용량 데이터를 실시간으로 빠르게 분석 및 처리(OLAP쿼리)할수있는 대용량 데이터베이스

Druid의 구성요소

Master: Data Availability(가용성) 와 Ingestion(가져오기) 관리

Coordinator: 데이터 가용성 관리
Overlord: 데이터 삽입 워크로드 할당을 관리

Query: 외부 유입 쿼리 처리

Broker: 외부 유입 쿼리 처리
Router(Optional): Brokers, Coordinators와 Overlords로 리퀘스트를 라우팅.

Data: 데이터 삽입 워크로드 실행과 데이터 저장을 담당

MiddleManager: 데이터 삽입을 담당

Historical: 데이터들을 딥스토리지에 저장을 담당

External Dependencies

Deep Storage: 데이터 저장소
Metadata Storage: 가용 세그먼트 정보, Task 정보등 다양하게 공유되는 메타데이터를 저장.
ZooKeeper: 내부적인 서비스 discovery, coordination 그리고 leader election을 담당.

'BigData > Druid' 카테고리의 다른 글

Druid Kubernetes Log 설정하기 (0)	2022.03.22
Druid on Kubernetes (0)	2022.03.21

댓글

티스토리툴바