반응형
Druid란?
공식문서에 의하면 아래와 같이 정의한다.
Apache Druid is a real-time analytics database designed for fast slice-and-dice analytics ("OLAP" queries) on large data sets.
대용량 데이터를 실시간으로 빠르게 분석 및 처리(OLAP쿼리)할수있는 대용량 데이터베이스
Druid의 구성요소
Master: Data Availability(가용성) 와 Ingestion(가져오기) 관리
- Coordinator: 데이터 가용성 관리
- Overlord: 데이터 삽입 워크로드 할당을 관리
Query: 외부 유입 쿼리 처리
- Broker: 외부 유입 쿼리 처리
- Router(Optional): Brokers, Coordinators와 Overlords로 리퀘스트를 라우팅.
Data: 데이터 삽입 워크로드 실행과 데이터 저장을 담당
- MiddleManager: 데이터 삽입을 담당
- Historical: 데이터들을 딥스토리지에 저장을 담당
External Dependencies
- Deep Storage: 데이터 저장소
- Metadata Storage: 가용 세그먼트 정보, Task 정보등 다양하게 공유되는 메타데이터를 저장.
- ZooKeeper: 내부적인 서비스 discovery, coordination 그리고 leader election을 담당.
반응형
'BigData > Druid' 카테고리의 다른 글
Druid Kubernetes Log 설정하기 (0) | 2022.03.22 |
---|---|
Druid on Kubernetes (0) | 2022.03.21 |
댓글