2008년 08월 11일
4시간만에 검색 엔진 서비스를 - 4HourSearch와 Yahoo BOSS API

CUIL과 YUIL과 4HourSearch
Google에서 나온 주요 개발자들이 만들었다는 새로운 검색엔진 CUIL이 화제를 모았던 것이 불과 한 두 주밖에 안 되었지요.
취향에 따라 CUIL의 검색 결과 표시 방식이 좋다는 사람 아닌 사람 다양했지만, 구글로 대변되는 초 고용량 인프라 운영 기술을 표방하며 새 플레이어가 나타난 것 자체가 사람들을 재미있게 해 주었습니다. 다만 다국어 검색 결과에 대해 기대를 충족 못 시키는 Beta 특유의 모습을 보여주는 건 한국이나 일본의 호사가들에게 충분히 씹혔었구요.
현재 CUIL 첫 페이지에는 1억 2천만 페이지가 넘는 웹페이지가 수집되어 있다고 표시되고 있는데 부쩍부쩍 늘어나는 페이지 인덱싱 량을 해결하기 위해 그 뒤에서 어떻게 인프라들이 팽팽 돌고 있을지 생각해보면 약간 아득합니다.
그런데, CUIL 런칭 이후 좀 있다가 YUIL이라는 서비스가 소개되었습니다.
CUIL과 동일한 UI를 가졌을 뿐 아니라 인덱싱된 페이지의 규모나 검색 결과도 그닥 차이 나지 않았던 이 서비스는 "이 짧은 시간에 누가 이정도로 따라 잡을 수 있는거야" 식의 놀라움보다는 "아니 뭐 이런 짓까지 ㅋㅋ" 류의 가십성 화제를 불러일으켰는데 다름이 아니라 야후의 검색 관련 임원(Sam Pullara)이 자사의 검색 API 플랫폼 BOSS와 Google App Engine을 이용하여 장난 치듯이 뚝닥 CUIL 클론을 만들어낸 Mash-up 결과물이었기 때문입니다. 약간 치기 어리다는 느낌이지요. 이름도 'Yahoo+CUIL'인가요.
구글이나 CUIL이나 검색엔진이라면 고용량의 문서를 처리할 back-end 인프라의 조직이 얼마나 견고하고 효율적이냐의 과제를 벗어날 수 없을텐데, UI 구성 방식과 달리 결코 작은 아이디어와 아마추어적인 기획으로 감당할만한 문턱이 아니지요.
그런데, 주어져있는 API 환경들과 호스팅 환경을 적당히 엮어 나름대로 잘 돌아갈 수 있는 '검색 엔진'씩이나 금방 만들어낼 수 있다고 하니, Yahoo 임원 입장에서는 치기어려 보일지라도 한 번 꼭 과시해보고 싶었을 법은 합니다.
아무튼 YUIL 서비스 자체는 잠깐의 화제와 함께 금방 내려졌습니다. (남의 서비스 배낀 거 농담으로라도 계속 유지하기는 좀 힘들었을 법 합니다. TechCrunch는 "Yahoo나 CUIL 중 누군가는 유머 감각이 좀 부족했던 듯.." 이라고 논평했지요. 역시 한 번 더 ㅋㅋㅋ)
4HourSearch 소스 제공!
그런데, YUIL 개발자들은 이 서비스를 4HourSearch 라는 이름으로 다시 열어놓고 (UI 등이 CUIL과 완전히 동일하지는 않습니다) 이제는 그 '소스 코드'까지 다운받게 해 놓았습니다. @.@
예, 이름이 표방하고 있듯이 4시간 정도를 투자해 만든 Yahoo BOSS + Yahoo YUI + Google App Engine Mash-up 어플리케이션이라는거지요.
들어가보면 아시겠지만, 이론적으로나 실질적으로나 검색 결과 컨텐트는 http://search.yahoo.com 에서와 동일합니다. (다국어 검색 결과 / 국내 검색 결과의 밀도와 조직화는 국내 Yahoo 검색의 튜닝을 전혀 타지 않았으므로 CUIL과 비슷하게 그다지 만족스럽지는 않습니다)
Web2.0 매쉬업에 관심이 많은 가난한 개발자라면 그들의 방법을 참고해볼 참으로 소스 다운받아 살펴보는 것도 괜찮을 것 같습니다. Zip 압축된 소스 파일이 전체 32kb에 지나지 않습니다 (꽥)
서버 한 대 안 사고, 크롤러나 인덱싱 엔진 제작 하나 안 하고 전세계를 대상으로 하는 검색 엔진 서비스를 만들 수 있는 시대가 된거네요.
재밌다는 느낌과 함께 뭔가 허망하기도 한 이 기분은?
이 글과 관련있는 글을 자동검색한 결과입니다 [?]
- cuil by baddaddy
- cuil.com by 돌하니
- www.cuil.com by 바죠
- 새로운 검색 엔진, CUIL by organizer
- 새로운 검색 엔진 "Cuil" by hoya
# by | 2008/08/11 19:50 | 트랙백 | 덧글(6)





☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
아예 도메인 따놓고 올려놨군요 ㅎㅎㅎ...
그래도 저런식으로 여유롭게 "우리 플랫폼 이용하면 이 정도야 금방 ㄳ" 하면서 장난질 칠 정도의 녀석들이니 뭐 쫌 우쭐거리는 꼴도 봐줄만 하긴 하네요 :)
그리고, 사고 당사자(!)는 아니지만 저렇게 만들어놓은 토이(이걸 토이 수준이라고 할 수 있나 싶지만) 어플에 수백만 수천만 트래픽이 발생하는걸 조용히 받아내주고 있는 구글 App Engine 플랫폼도...
NoPD님 방문해주셔서 감사합니다~
왜냐하면 4HourSearch를 잠시 써보기만 해도 여기에 뭘 더 붙이고 싶다든가 어떻게 특화하고 싶다는 생각이 들게 마련인데, 어차피 타사 엔진의 API 를 사용하는 것만으로는 한계가 있습니다.
대신, 그 새로운 검색을 평가할 '눈높이'가 날로 엄청 높아지리라는 짐작은 하게 되네요. "남의 API 몇 개 엮어도 그 정도는 되잖아"라는 핀잔은 벗어나야 그래도 검색엔진인 척 할 수 있겠죠 ㅎㅎ
joogunking 님 방문 감사합니다!
맞어요 저도 YUIL도 봤었는데 흥미롭더군요~
찾아와주셔서 감사합니다!