2014년 3월 12일 수요일

하둡이 뭐야? (What is Hadoop?)

빅데이터라는 이야기를 들으면서 항상 함께 들려오는 소리가 하둡(Hadoop)이다. 귀엽게 생긴 노란 코끼리가 나오는 하둡이 도대체 뭐하는 것일까?

하둡은 대용량 데이터를 분산처리할 수 있는 기술이다. 대표적인 기능으로는 대용량 파일을 분산 저장할 수 있는 분산파일 시스템과 데이터를 분산되어있는 여러 컴퓨터의 자원을 이용하여 빠르게 분석할 수 있는 맵리듀스(MapReduce) 엔진을 들 수 있다.

더구나 하둡은 오픈소스소프트웨어이다. 누구나 자유롭게 사용할 수 있다. 물론 자유롭게 사용은 가능하지만 오픈소스에도 라이선스 규칙이 있기 때문에 이에 대해서 유의해야할 것이다.

하둡에 대한 자세한 글

Apache Hadoop


댓글 없음:

댓글 쓰기