하둡(Hadoop)은 방대한 양의 비정형 및 정형 데이터(빅데이터)를 여러 대의 저렴한 컴퓨터(클러스터)에 분산하여 저장하고, 이를 병렬로 빠르게 처리할 수 있도록 지원하는 오픈소스 자바 프레임워크입니다.동작 원리: 고가의 대형 서버(Scale-up) 한 대를 사용하는 대신, 저렴한 범용 서버(Commodity Hardware) 수십~수천 대를 네트워크로 연결(Scale-out)하여 하나의 거대한 컴퓨터처럼 작동하게 만듭니다.주요 특징: 데이터 서버가 고장 나더라도 시스템이 멈추지 않도록 데이터를 여러 서버에 복제해 두는 결함 내성(Fault Tolerance)과, 연산을 데이터가 저장된 곳으로 보내서 처리하는 데이터 지역성(Data Locality)을 갖추고 있습니다.1. 하둡의 핵심 구성요소하둡은 크..