P2P는 인터넷에서 이루어지는 개인 대 개인의 정보공유 기술 및 행위로서, 기존 서버-클라이언트 구조에서는 HTTP, FTP(file transfer protocol)등을 통하여 파일 등 정보를 주고받았다면, P2P 방식에서는 기본적으로 두 사용자를 연결하기만 하고 정보교환은 개인 대 개인으로 하는 것을 말한다. 즉, 인터넷에서 다운로드 할 때에는 서버가 있어야 하고 서버에 있는 파일 등 정보를 다운로드 하여야 하지만 P2P 방식에서는 자신의 컴퓨터가 서버가 될 수도 있고 클라이언트도 될 수 있다는 것을 의미한다. 이러한 P2P 네트워크에 Peer는 자율적으로 관리되고 네트워크 내에 존재하는 데이터와 서비스는 네트워크내의 모든 Peer에서 접속 가능하다.
1990년에 들어 인터넷 사용자의 증가, 인터넷의 상업화 바람과 함께 등장한 웹 브라우저, 여러 애플리케이션들, 그에 따른 당시의 비즈니스 모델들로 인해 클라이언트/서버 환경으로의 변화를 가져왔다. 서버-클라이언트 모델은 서버에 상당히 의존적이기 때문에 서버로의 병목(bottleneck)현상이 자주 발생하였고, 데이터의 교환에 있어서도 매우 제한적이었다. 인터넷 사용자들은 정보습득과 정보가공에 대한 욕구가 증가하면서 직접 정보를 생산하고 공유하고자 하는 필요성이 점점 커지게 되었다.1)
1999년 미국의 Napster의 등장으로 시작된 P2P 네트워킹 기술은 분산 컴퓨팅, VoIP(Voice over IP)에 성공적으로 적용됨에 따라, 현재 가장 널리 쓰이는 정보공유 통신방식이 되었다. 국내에서도 2000년 5월 국내 소리바다가 개발되면서 피디박스, 클럽박스와 같은 P2P 응용들이 대규모로 등장하였고, 이후 많은 P2P시스템과 관련된 연구들이 시작되었다. 집중화 구조 없이 분산시스템의 자율 구성을 목표로 하는 P2P시스템에서 원하는 데이터를 쉽게 검색하여 찾고 관리하는 것이 가장 큰 문제점이다. 이러한 관리의 문제점을 해결하기 위한 방식으로 크게 두 가지접근 방식의 P2P가 있는데, 비구조화(unstructured) P2P와 구조화(structured) P2P이다.
1. 비구조화 P2P
비구조화(Unstructured)방식은 피어와 자원 간 연관성 설정이 없는 구조로써, 중앙 서버 또는 인접 피어로 검색 task를 분산시키는 쿼리 flooding 방법을 이용하여 리소스와 피어를 탐색한다. 이러한 P2P의 초기 모델은 리소스를 보유한 피어의 IP 주소를 중앙 서버에 의해서 관리하는 집중화된 형태로 시작되었다. 이 모델은 공유 파일의 저작권에 따른 법적인 문제, 중앙 서버에 의한 확장성 제한 등으로 사용이 제한되었으며, 대안으로 원하는 자원이나 피어를 찾을 때 까지 중앙 장치 없이 인접 피어로 검색 쿼리를 flooding 시키는 방식인 pure P2P 모델이 널리 사용 된다. 그러나 flooding에 따른 신호 트래픽이 과다 발생하는 문제점이 제기 되어, 이를 보완하기 위해 제안된 하이브리드 P2P 모델에서는 시스템을 여러 개의 슈퍼 피어를 이용한 계층적 구조로 구성하고 자원 검색 쿼리를 슈퍼 피어 간에 효율적으로 flooding함으로써 신호 트래픽을 감소시킨다
2. 구조화 P2P
이 방식에서는 분산 인덱싱을 제공하는 분산 해시 테이블(DHT)로 콘텐츠와 피어 정보들을 공통의 단일 주소 공간으로 맵핑하여 콘텐츠 저장 및 검색이 이루어지는 분산 구조의 콘텐츠-어드레싱 기반 데이터 저장 기법을 사용한다. 이 방법을 사용하면, 검색 효율에 영향 없이 피어 개수를 임의로 증가시킬 수 있다. 또한, 각각의 노드에서 검색을 위해 필요한 정보의 양이 기존의 중앙 서버기반의 P2P보다 적고, 검색을 위한 통신 오버헤드가 flooding 기반의P2P 방식보다 적다. 따라서 비구조화 P2P에 비하여 상대적으로 대규모 네트워크에 적용이 가능하다. 그러나 비구조화 P2P에서 다양한 데이터의 속성 값을 이용하여 복잡한 쿼리가 가능했던 반면에, 분산 해시 테이블을 사용함으로 인하여 특정 키 값만을 사용한 검색을 함으로써 쿼리가 단순화되는 단점이 있다.
3. P2P 의 자원 구조별 분류
P2P(Peer-to-Peer)시스템은 네트워킹 기술로 네트워크 환경에서 집중화된 서비스 개념 없이 분산 자원의 공유를 목적으로 동등한 자격을 가진 자율적 객체로 이루어진 자율 구성 시스템으로 정의된다. 즉 공급자와 소비자가 개념에서 벗어나 각 개인 컴퓨터를 직접 연결함으로써 모든 참여자가 공급자인 동시에 수요자가 되는 형태이다. P2P 시스템의 특성으로 참여자가 원하는 자원은 분산된 형태로 이용되고 피어 즉, 객체 집합 내 각 피어는 상대 피어가 제공하는 자원을 이용하고 별도의 중앙 집중형 제어 없이 피어간 직접 네트워크로 상호 연결, 작용되며 어느 곳으로든 분산이 가능하다. 보통 이용되는 자원은 음악파일 같은 오디오 데이터, 영화와 같은 비디오 데이터, 어플리케이션 등이 있다. 각 피어가 보유한 자원의 공유 여부는 피어의 자율적 결정에 따릅니다. 그러므로 자율조직 또는 ad-hoc방식으로 제어된다.
P2P의 구조별 종류로는 첫째, Centralized P2P 모델은 P2P 네트워킹의 초기 모델로 서비스 제공을 위해 중앙 서버의 관리 제어가 필요한 모델이다. 이 모델의 종류로는 미국의 Napster가 있다. 하지만 이 모델은 공유 파일의 저작권법에 따른 문제와 중앙 서버에 의한 확장성 제한 등으로 사용이 제한되어 있다. 둘째, Pure P2P 모델은 앞에 Centralized P2P 모델의 중앙 서버와 저작권법에 따른 문제로 인한 대안 방안으로 원하는 자원이나 피어를 찾을 때 까지 중앙 장치 없이 인접한 피어와의 상호연결로 자원 공유가 이루어진다. 이 모델의 종류로는 Geutella 0.4, Freenet이 있으며, Pure P2P 모델은 flooding에 따라 과다한 신호 트래픽 발생 문제가 있다. 셋째, Hybrid P2P 모델은 앞선 Pure P2P 모델과 달리 동적 중앙 서버가 필요하며, Hybrid P2P모델의 종류로는 Gnutella 0.6 JXTA가 있다. 넷째, DHT-Based가 있습니다. DHT-Based 모델은 중앙 서버가 없고 분산 해시 테이블 (DHT)로 자원과 피어 정보를 공통의 단일 주소 공간에 매핑하여 콘텐츠 저장 및 검색이 이루어진다. 이 모델은 최대 검색 횟수를 0(logN)으로 데이터 검색이 가능하기 때문에 검색 효율에 영항 없이 피어 개수 N을 임의로 증가 시킬 수 있다. 앞에 모델들과 비교하여 상대적으로 대규모 네트워크에 적용이 가능하며, DHT를 사용함으로써 쿼리가 단순화되는 단점이 있다. 이 모델의 종류로는 Chord, CAN이 있다.2)
1) 김은정(2002) : P2P서비스를 이용한 저작권 침해행위에 관한 연구
2) 이진순(2002), Peer to Peer 방식의 디지털콘텐츠 유통과 저작권 분쟁에 관한 연구, 연세대 언론홍보대학원 석사논문
댓글 없음:
댓글 쓰기