딥 웹
1. 설명
네이버, 구글, 다음 같은 일반 검색 엔진으로 검색이 가능한 웹을 표면 웹(surface web)이라 하며, 그 대치 용어로 검색 엔진에 걸리지 않는 곳을 '''딥 웹'''(deep web)이라고 한다. 출처 다만 Grams처럼 딥 웹에서 쓰는 검색엔진도 존재한다. 다크 웹을 '''딥 웹'''이라고 잘못 부르는 경우가 많다.
인터넷 하면 흔히 웹이라고 줄여 부르는 월드 와이드 웹(www)만 생각하기 쉽지만 인터넷은 월드 와이드 웹, 전자 메일, 파일 공유(토렌트, eMule 등), 웹캠, 동영상 스트리밍, 온라인 게임, VoIP, 모바일 앱 등 다양한 서비스들을 포함한다. 딥 웹(deep web)은 이름에 웹(web)이 들어가지만 월드 와이드 웹뿐만 아니라 위와 같은 다양한 서비스들 중 검색 엔진에 걸리지 않는 컨텐츠들도 포함한다. 웹뿐만 아니라 다양한 서비스들을 포함하고 있기 때문에 딥 웹(deep web)보다 딥넷(deepnet)이 더 정확한 표현이다. 영어 위키백과에서 deepnet으로 검색하면 deep web으로 문서를 넘겨준다.
접속 허가가 필요한 네트워크나 특정 소프트웨어로만 접속할 수 있는 오버레이 네트워크(overlay network)는 다크넷(darknet)이라고 부른다.
다크넷 중 웹만을 따로 다크 웹(dark web)이라고 부른다. 출처 딥 웹에 다크넷이 포함되고, 다크넷에 다크 웹이 포함된다. '''딥 웹이라는 용어를 다크넷이나 다크 웹을 가리키는데 잘못 사용하는 경우가 있다.'''
2. 딥 웹은 범죄와 관련된 사이트들이다?
아니다. '''딥 웹은 단순히 검색에 걸리지 않는 모든 사이트들을 포괄하는 단어'''이다. 이러한 사이트들은 기업의 내부 정보 페이지, 웹 관리 페이지일 수도 있고, 전자 도서관의 데이터베이스 같은 것일 수도 있다. 혹은 단순히 검색 엔진의 기술적인 문제 때문에 잡히지 않는 웹페이지를 뜻하는 것일 수도 있다. 그냥 더 단순하게 '''당신의 이메일 페이지도 딥 웹이다.'''[1]
아니면, 이런 식으로 생각해 봐도 좋다. 나무위키의 기반이 된 리그베다 위키도 일종의 딥 웹이었다. 예전에는 검색 포탈 등으로 검색해 보더라도 리그베다 위키 내의 자료들은 검색되지 않았으니까. 반면, 엔하위키 미러나 나무위키는 표면웹이다. 이 두 곳의 자료는 검색 가능하다. 나아가, 지금은 국내 주요 포탈 사이트로 검색하면 사이트 대표 주소는 뜨지만, 엔하위키 시절에는 아예 대표주소도 나오지 않았는데... 이 경우, 해당 사이트에 접속하려면 주소창에 직접 주소를 입력해야 했다. 즐겨찾기 해 놓았을 수도 있지만, 이건 말하자면 주소 입력 과정을 생략시켜주는 매크로와 비슷한 것이니 패스.
위의 특징이 바로 딥 웹의 정확한 정의다. 검색엔진에 노출되는 사이트라면 검색을 통해 찾아 들어갈 수 있다. 하지만 검색을 막아버리면? 이런 사이트는 검색을 통해 찾을 수 없고, 그 사이트의 주소를 아는 사람만 찾아갈 수 있다. 전자가 표면웹, 후자가 딥 웹이며, 어떠한 이유로든 자신이 개설하거나 운영하는 사이트가 대중에게 노출되기를 원치 않는 사람들은 검색봇을 거절해 버릴 수 있고, 딥 웹의 정의 자체는 이런 사이트들의 통칭인 것.
또한 딥 웹에서는 보다 더 질이 높은 전문적인 자료도 구할 수가 있는데, 딥 웹의 정의는 생각보다 포괄적이라 포털에서 포착되지 않는 전공 지식만 모은 전문 사이트도 딥 웹의 일종이다. 구체적으로 설명하자면 박사급 연구자들의 연구자료를 주로 필요로 하는 사람들 역시 같은 박사급 연구자들일 것이고, 이런 자료를 모아 놓은 논문 페이지를 굳이 검색 엔진에 노출시켜 트래픽을 만들 필요가 없으니 검색 노출을 차단하고 내부에서만 검색 가능한 독자적인 네트워크를 형성하여 연구자들끼리만 이용한다면 이 또한 딥 웹의 정의에 부합한다.
즉, 딥 웹이라고 해서 세간의 인식처럼 꼭 더러운 치부 같은 것들만 모아 놓은 사이트는 아니라는 것이다. 대표적으로 국회도서관의 자료도 딥 웹이다. 외부에서 온라인으로 열람할 수 없으나, 계약을 맺은 기관의 전산실 컴퓨터를 이용하면 열람할 수 있다. 석박사 논문은 보통 국회도서관에만 있으므로 집에서 편하게 볼 수 없고 학교 도서관 등을 가야 하는 수고를 해야 한다.
한가지 예를 더 들자면, 롯데리아홈서비스나 홈쇼핑같은 서버를 따로 두고 국회도서관처럼 제한된 전산실에서만 네트워크 주문빌지를 만들어 손님들께 홈서비스를 제공하는 경우 역시 딥 웹이라 할 수 있겠다. 이런 서버 같은 경우에도 http:// 이후 199.53.224.173 같은 숫자로 나열된 고유의 아이피 주소가 엄연히 존재하나 당연히 아무나 접속할 수는 없고, 특정 서버에 사원 로그인으로 접속이 가능하다.
네이버 웹툰 등 웹툰 사이트에 연재되는 웹툰의 각 화들도 검색에 걸리지는 않으나 해당 웹툰의 대표 주소는 뜬다. 그리고 몇몇 화가 가끔 구글에 걸리기는 하니 완전한 딥 웹이라고 볼 수는 없다.
3. 실체가 알려진 딥 웹
4. 관련 문서
[1] 물론 이러한 특성으로 인해 범죄 등 사회의 어둠과 관련된 사이트들이 딥 웹에 실재하는 것은 맞다.