정신병자의 인터넷 정신병동 위치로그  |  태그  |  방명록
2008/06 에 해당하는 글5 개
2008/06/24   네이버 (아니 한국의 포털)은 검색서비스가 아닌 아카이브 서비스이다. (3)
2008/06/24   정신병자군의 마음대로 음모이론 - "촛불집회를 무산시키기 위한 원산지표시제 강화"
2008/06/21   "촛불은 어디로 나아가야 할 것인가?" - 정신병자군의 생각
2008/06/11   촛불집회의 성격에 대한 짧은 단상
2008/06/03   "Operation Human Shield" (4)


네이버 (아니 한국의 포털)은 검색서비스가 아닌 아카이브 서비스이다.
정신병자 생각들 | 2008/06/24 23:01
본론에 들어가기에 앞서, 아카이브 서비스와 검색서비스의 가치에 대한 평가는 전혀 없습니다. 양자는 완전히 다른 서비스 영역이며, 추구하는 가치 역시 완전히 다르니까요. 구글과 네이버를 비교하는 경우가 많은데, 결론적으로 검색서비스업체인 구글과 (병자군의 분류에서) 아카이브 서비스업체인 네이버는 비교할 필요가 없을 뿐만 아니라 아예 비교 자체가 불가능하다, 라는 것이 병자군의 생각입니다.

1. 용어의 정의

Searching is the act or process of a thorough examination in order to find something concealed. Web searching benefits from specific techniques, which are detailed in the search engine article (see also: list of search engines). An online search engine is any device that allows the user to quickly search and view multiple online articles/websites.

검색은 숨겨진(감춰진) 것으로부터 무엇인가를 찾기 위해 조사하는 행동이나 절차이다. 웹 검색은 특별한 기술, 검색 엔진 규칙에 의해 세밀화하는 독특한 기술에 의해 이점을 가지게 된다. 온라인 검색 엔진은 유저가 다양한 온라인의 기사(글)이나 웹사이트를 빠르게 찾아 볼 수 있게 해 주는 장치이다.

Web archiving is the process of collecting the Web or particular portions of the Web and ensuring the collection is preserved in an archive, such as an archive site, for future researchers, historians, and the public. Due to the massive size of the Web, web archivists typically employ web crawlers for automated collection....

웹 아카이브는 웹이나 웹의 특정 부분을 수집하고 리서쳐나 역사가나 일반 대중을 위해 아카이브 사이트 등에 보관된 수집품을 보존하는 절차이다. 웹의 크기가 커짐에 따라 웹 아카이비스트는 자동화된 수집을 위해 웹 크롤러를 사용한다....

- 출처 : 위키피디아

네이버를 아카이브 서비스업체라고 규정한 이유는 네이버 검색을 통해 제공되는 정보의 대다수가 외부의 데이터가 아닌 네이버 내부의 데이터라는 점 때문이다. 네이버의 검색은 웹 상에 존재하는 무수히 많은 정보들 중 사용자에게 정말 필요한 정보를 찾아 볼 수 있게 도와주는 것이 목적이라기보다는 자사 DB의 정보를 얼마나 효과적으로 노출시킬 것인가에 우선 촛점이 맞춰져 있다. (그렇게 보인다.) 이는 기존에 존재하고 있는 정보를 효과적으로 찾을 수 있는 방법을 고민하는 구글과 확실한 차이를 보인다.

네이버의 서비스모델이 "있는 정보를 찾아주는" 것이 아닌 "자사의 데이터를 노출하기 위한" 것이 된 것에는 초기 한국어 웹 시장의 협소성에 기인한다(고 네이버는 주장한다.). 네이버가 처음 서비스를 시작한 즈음에는 한국어로 이루어진 웹 상의 정보는 거의 존재하지 않은 상황이었고, 이런 상황에서 재대로 된 웹 검색 서비스를 구현하기 위해서는 우선 검색할 대상, 즉 정보의 절대량을 늘려야 했고 이는 네이버가 '효율적인 정보를 찾기' 보다는 '효율적인 정보 DB를 구축하기'를 목표로 삼을 수밖에 없는 요인으로 작용하였다(고 네이버는 이야기한다).

이 말을 그대로 믿을 수 있을까? 최근 링블로그-그만의 아이디어에서 이 주장에 대한 (병자군의 생각에) 의미있는 실험 데이터가 공개되었기에 살짝 인용해보고자 한다.

검색어 '네이버' 에 의한 검색결과

다음                                  | 498,505개
엠파스/네이트/사이월드       | 1,248,407개
야후!코리아                        | 831,013개
구글                                  | 4,937,928개
파란                                  | 172,840건
나루                                  | 481,354건

....

네이버 | 75,631건 (중복제외 결과) / 164,073건 (중복포함결과)

원문확인은 이곳에서...
아직도 한국어 웹 환경에서 Data가 너무 적어서 보다 유효한 결과를 얻기 위해 그렇게 열심히 모든 Data를 가두리양식해야 한다고 생각하는가? 네이버???

ps : 네이버 검색결과의 지나치게 초라한 수치도 문제이긴 하지만, 사실 파란, 다음의 결과도 한국을 대표하는 포털서비스의 검색결과라고 보기에는 좀 그렇다. 검색서비스 사용자가 원하는 정보를 정확하게 찾는 것도 중요하긴 하지만, 일단 Data수집량을 좀 더 늘려놓고 나서 그 Data를 어떻게 의미있게 노출할 것인가를 고민해야 되는 것이 아닐까?

태그 : , , , ,
트랙백(2) | 댓글(3)
이 글의 관련글(트랙백) 주소 :: http://psychoic.dothost.co.kr/trackback/51
Tracked from 링블로그-그만의 아이디어 2008/06/25 01:11 x
제목 : [테스트] 네이버는 겸손쟁이
간단한 실험이다. '네이버' 이 단순명료한 단어로 블로그를 검색해보자.검색해보자. 다음 | 498,505개 http://search.daum.net/search?w=blog&q=%EB%84%A4%EC%9D%B4%EB%B2%84 엠파스엠파스 | 네이트 | 싸이월드 | 1,248,407개 http://search.empas.com/search/ob.html?z=BVA&q=%B3%D7%C0%CC%B9%F6&a=w&s=&f== 야후!코리아 | 831,013..
Tracked from 민노씨.네 2008/06/25 15:12 x
제목 : 네이버와 시대정신 : 네이버 탈출 운동의 정당성
감정을 배제하고 제 나름으로 최대한 간략하게 답합니다. 이전 글들에서 제 주관적인 감정이 필요 이상으로 더해진 감이 없지 않네요. 1. 네이버의 기계적 중립을 어떻게 평가할 것인가. * 기계적 중립과 적극적 균형 기계적인 중립을 평가해야 한다고 말씀하시는 취지에 대해선 저로선 이해가 좀 어렵습니다. 제가 거듭해서 인용한 김창남 교수가 지적한 '적극적 균형'에 대한 요구와 기계적 중립은 서로 전혀 다른 것입니다. 무엇보다 먼저 전제되어야 하는 기준은...
buzz 2008/06/25 10:33 L R X
정신병자님의 해당 포스트가 6/25일 버즈블로그 메인 헤드라인으로 링크되었습니다.
민노씨 2008/06/25 15:11 L R X
적절한 '사실' 확인이네요. : )
네이버 검색은 말의 본래적인 의미에서 검색이 아니라, 네이버 가두리양식장에 검색 처럼 보이는 무엇인가를 살짝 올려놓은 형태랄까요?
숲속얘기 2009/04/30 12:18 L R X
이전에 네이버가 막 다음을 제치기 시작할 무렵 광고가 기억나십니까? "사랑"이란 단어로 검색했을때 몇만건이 검색되었다. 란 식으로 광고했죠. 당시 다음도 크롤링 문서개수에 연연했고, 심지어는 첫눈 조차도 크롤링 개수를 상단에 표시까지 했습니다.
구글이 출현하기 이전까지만 해도 야후니 뭐니도 다 그런식으로 크롤링 개수에 열을 올렸죠. 하지만, 당시에 한국의 문제는 사이트가 없었다는것은 사실입니다. 지금도 3대 포탈을 빼면 한국의 웹의 크기는 20%도 안남습니다.
3대 포탈에 유저가 폭발적으로 늘기 시작한것은 windows 98se 가 보급된 이후, 스타크래프트가 보급되면서죠. 실제로 네이버가 추월하기 시작한 시점이 그 때부터입니다. 지식인이라는 롱테일 전략이 가능했던거나 싸이월드의 SNS서비스가 가능해진것도 그 때문이죠.
한국의 웹은 태생적으로 연구소가 아닌 기업의 가두리 양식에서 시작했습니다. PC통신때부터 그랬죠. hitel nownurl 천리안 빼면 도깨비 bbs등 외부 bbs는 규모가 비교가 되지 않았으니까요. 외국의 경우는요? 야후가 출범하고, 구글이 왜 성공했는지를 보면 알 수 있습니다.
아카이브내에 이용되는 검색기술과 외부 검색기술은 둘 다 비슷합니다. 오히려 아카이브의 경우 생짜 검색이 가능하지만, 현재 한국 포탈내의 데이터는 엄청나서 그걸로 검색하기에는 무리입니다. 때문에 포탈내의 데이터만 가지고도 클로러나 검색기술을 사용해야만 가능한 수준이죠. 단순 아카이브라면 블로깅하면 바로 검색되게요? 현재 어떤 포탈도 바로 검색 되는경우는 많지 않습니다. 클롤러 봇이 돌아오는데는 시간이 걸리니까요.

아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



[PREV] [1][2][3][4][5] [NEXT]
관리자  |   글쓰기
BLOG main image
정신병자의 감각으로, 아무 짓이나 해 보자!
- 정신병자군의 사이트분석..
전체 (66)
정신병자's choice (9)
순간분석 (1)
정신병자 노올~이! (8)
정신병자 생각들 (5)
정신병자 영화보기 (2)
대선 네이버뉴스 마이홈 한나라당 대통령선거 공포 지지거부 오마이뉴스 펀글 네이버 감사합니다. 인생 네이버 블로그 찌질이 정신차리자! 세상 이랜드 초고속인터넷 가두리양식 LG파워콤 예인 디지털네임즈 인터넷의 뉴페러다임!!! 다음 뉴욕타임스 호러영화리뷰 레이버투데이 막시즘 상호수동 무서워
[블로그 이전 공지] 새로운 곳..
한때 폭파되었던 블로그를 되..
오마이 시민기자스쿨에 왔습니.. (3)
예의없는 것들...
11월 9일 손현숙 & Stopcrackd..
이전에 네이버가 막 다음을 제..
2009 - 숲속얘기
관리자만 볼 수 있는 댓글입니다
2009 -
그러게나 말입니다...^^ 왜 이..
2009 - 정신병자
어떻게 지내시나요? 몇 달만..
2009 - 민노씨
오타신고 감사합니다...^^ ..
2008 - 정신병자
네이버와 시대정신 : 네이버 ..
민노씨.네
[테스트] 네이버는 겸손쟁이
링블로그-그만의 아이디어
촛불시위 단상 - 이명박 찍은 ..
민노씨.네
digg.com 소셜네트워크서비스 ..
digg.com 소셜네트워크서비스 ..
디워 현상 ; 권위적 비평권력..
민노씨.네
Total : 120367
Today : 9
Yesterday : 57
태터툴즈 배너
rss
 
 
 
위치로그 : 태그 : 방명록 : 관리자
정신병자’s Blog is powered by Tattertools.com / Designed by plyfly.net