분산파일시스템의 큰 데이터를 맵리듀스로 분석, 변환 - 데이터, 연산을 많은 호스트들에 분산해서 실행 - 앱의 연산(task) 를 병렬실행 close to data 평범한 서버를 계속 추가하면 연산능력을 늘릴 수 있다. 맵리듀스는 프로그래밍 모델 키/밸류 형태 동기 : 계산들이 여러 머신들에 분산돼서 실행됨. -> 오버헤드가 큼. -> 추상화 레벨 높여 시스템이 알아서 해줘 -> 맵리듀ㅜ스 탄생 단순 계산의 추상화. 복잡한 부분은 뒤로 숨김. 논리 레코드(텍스트 한 줄 등)에 map 적용 -> 키 밸류 생성 같은 키의 값들은 같은 reduce로 묶임 적용 -> combine map 과 reduce만 만들면 됨. 데이터가 한 블록의 크기보다 크면 여러 블록으로 나누어 처리 input -> splitting..