“인터넷에서 숨어있는 금맥을 찾아라.”
몇 달전 미국의 ‘브라이트플래닛’사는 검색엔진이 찾을 수 있는 웹문서가 전체 웹의 500분의 1에 불과하다는 조사결과를 내놓았다. 검색엔진 그물에 걸리지 않는 정보가 생각보다 훨씬 많다는 얘기다.
이런 숨어있는 정보를 ‘보이지 않는 웹’(invisible web), 혹은 ‘깊은 웹’(deep web)이라 부른다. 대부분은 직접 그 사이트를 방문해 검색해야 비로소 내용을 ‘볼 수 있는’, 데이터베이스(DB)에 저장된 정보들이다.
문제는 이 중에 알짜배기 보물창고가 많다는 점이다. 인터넷 검색실력은 ‘보이지 않는 웹’을 얼마나 잘 활용하느냐에서 판가름난다해도 과언이 아니다. 검색엔진에서 놓치고 있는 알짜정보, 어디서 찾을 수 있을까.
가장 추천할 만한 사이트는 ‘컴플리트플래닛’(www.completeplanet.com). 이 사이트는 약 10만여개의 ‘인터넷 금맥’을 발굴해 제공하며 각종 참고자료도 풍부하게 갖고 있다.
‘인비저블웹’(www.invisibleweb.com)과 ‘인비저블 웹카타로그’(dir.lycos.com/Reference/Searchable…Databases/)는 1만여개에 달하는 웹DB를 주제별로 잘 정리해놓은 사이트. 주제를 따라 사이트 목록을 훑다보면 “인터넷에 이런 정보도 다 있었네”하는 감탄사가 절로 나온다. 주제별로 웹DB의 검색창을 한 곳에 모아놓은 ‘빅허브’(www.thebighub.com)와 데이터베이스 포털을 지향하는 ‘웹데이터’(www.webdata.com)도 유용하다.
한 주제만 특화해놓은 곳도 있다. 학술정보 웹DB를 검색할 수 있는 ‘인포마인’(infomine.ucr.edu)이 바로 그 것. 이 곳에선 각종 전자저널과 도서, 온라인도서관의 카드목록과 연구원디렉토리 등을 검색할 수 있다.
국내 사이트중엔 웹DB를 주제별로 정리한 ‘DB나라’(www.dbnara.pe.kr)와 비즈니스정보를 중심으로 국내외 2000여 웹DB를 정리해놓은 ‘서치플러스’(www.searchplus.co.kr)가 참고할 만하다.
권혜진hjkwon@donga.com