기업들의 데이터플랫폼 구축사례

하둡에코시스템을 기반으로 데이터파이프라인을 구축할때

너무나 많은 오픈소스가 있어 어떤식으로 구축하는것이 일반적인지 추세를 알기위해 사례를 모아봤다.

Kafka Airflow Hive Spark Tableau Zeppelin 구축이 일반적이며

추가로 실시간 빅데이터 쿼리엔진으로 Presto를 추가하여 사용하는 추세이다.

더불어 Tableau를 대체할 무료 시각화툴로 Superset을 사용하는 경우가 있었다.

Hadoop 2,3버전 port list 정리 (0)	2021.10.05
Hadoop single node install 설치 (0)	2021.10.05
MapReduce? YARN? (0)	2021.09.30

자라나는 나무 개발일기