맵리듀스1 하둡(Hadoop)이란? 하둡(Hadoop) 대규모 검색 색인을 구축하기 위해 자바로 개발된 오픈 소스 분산 컴퓨팅 플랫폼 초창기 개발 목적은 검색 색인 이였으나 이후 일반적인 다른 문제에도 폭넓게 적용되어 사용되고 있음. 여러 개선 과정을 거쳐 현재는 대규모 rawdata를 처리하고 분석하는 데이터 센터 운영 시스템의 핵심 소프트웨어 생태계이다. 하둡의 구성 요소 1/ 분산 파일 시스템 : HDFS HDFS(Hadoop Distributed File System)이 가장 널리 사용되고 있으며 데이터의 중복 저장이란 개념을 바탕으로 한 대규모 분산 파일 시스템 일반적인 파일 시스템을 가진 여러 노드를 묶어 하나의 분산 파일 시스템을 구축하도록 설계되어 파일 시스템을 손쉽게 확장해 몇 페타바이트에 이르는 대용량 데이터까지 저장이 .. 2020. 11. 8. 이전 1 다음