![](/file/23708/PCWorld_1999-03_cd.bin/tutorial/archiv/axxxk170/gifs/t821k171.gif) |
Domovskß strßnka s vyhledßvacφm formulß°em
V nedßvn²ch dnech byla ve°ejnosti zp°φstupn∞na dalÜφ vyhledßvacφ slu₧ba, kterß hodlß nabφzet plnotextovΘ vyhledßvßnφ v ΦeskΘm a slovenskΘm Internetu. Je tedy v po°adφ ji₧ Φtvrtou - po Atlasu, Kompasu a slu₧b∞ Search CZ - ale kupodivu nenφ nejmladÜφ. Jde toti₧ z°ejm∞ o urΦitou "reinkarnaci" jednoho d°φv∞jÜφho projektu, kter² nesl stejnΘ jmΘno jako nynφ zprovozn∞nß slu₧ba: Sherlock.
Za p∙vodnφm projektem vyhledßvacφ slu₧by Sherlock stßl pan ZajφΦek z firmy Bajt (d°φve vydavatel stejnojmennΘho tiÜt∞nΘho Φasopisu), a tato jeho p∙vodnφ slu₧ba je dodnes nabφzena na strßnkßch WWW serveru Bajtu (na adrese http://sherlock.bajt.cz, viz t°etφ obrßzek). Nepamatuji se ji₧ na dobu, kdy fungovala (dnes vracφ pouze chybovou hlßÜku), ale dob°e si pamatuji na zp∙sob, jak²m tehdy lidΘ z Bajtu "sbφrali" data a mapovali Φesk² Internet. D∞lali to tak, ₧e se podφvali do systΘmu DNS na to, jakΘ kde existujφ poΦφtaΦe, a pak ka₧d² z nich zkouÜeli oslovit na portu Φφslo 80 (na kterΘm je standardn∞ umφst∞n WWW server - tφm toti₧ zjiÜ¥ovali, zda p°φsluÜn² poΦφtaΦ je Φi nenφ WWW serverem, a pokud ano, sna₧ili se naΦφst jeho obsah). Byl to zp∙sob asi stejn∞ kultivovan² a druhou stranou vφtan², jako kdy₧ vßm n∞kdo systematicky obchßzφ vÜechny dve°e, bere za jejich kliky a zkouÜφ, jestli nßhodou nenφ otev°eno. Jak m∞l potom sprßvce "navÜtφvenΘ" sφt∞ poznat, ₧e nejde o ·tok hackera, kter² si mapuje terΘn? SluÜn∞ vychovanΘ vyhledßvacφ slu₧by se takto nechovajφ, a o nov²ch zdrojφch se dozvφdajφ jednak z hypertextov²ch odkaz∙ vedoucφch z ji₧ prozkouman²ch strßnek, nebo tφm zp∙sobem, ₧e nabφzφ z°izovatel∙m nov²ch strßnek, aby je explicitn∞ upozornili na svΘ strßnky (aby si je u p°φsluÜnΘ vyhledßvacφ slu₧by tzv. zaregistrovali - k Φemu₧ staΦφ pouhΘ sd∞lenφ p°φsluÜnΘho URL odkazu na jednu z nov²ch strßnek, naΦe₧ vyhledßvacφ slu₧ba si ji₧ sama "rozleze" celou soustavu nov²ch strßnek a zmapuje si jejich obsah). U novΘ verze slu₧by Sherlock jsem vÜak takovouto mo₧nost vlastnφho zadßnφ URL odkazu nenaÜel.
![](/file/23708/PCWorld_1999-03_cd.bin/tutorial/archiv/axxxk170/gifs/t821k172.gif) |
P°φklad v²sledk∙
|
|
Novß verze vyhledßvacφ slu₧by Sherlock sφdlφ v samostatnΘ domΘn∞ (www.sherlock.cz), a o jejφ vazb∞ na p∙vodnφho Sherlocka krom∞ stejnΘho jmΘna sv∞dΦφ vlastn∞ jen to, ₧e je pod nφ podepsßn (jako mana₧er) op∞t pan Ladislav ZajφΦek, z firmy Bajt. Autory technickΘho °eÜenφ novΘho Sherlocka jsou dva studenti pra₧skΘ Matematicko-fyzikßlnφ fakulty, a penφze na cel² projekt z°ejm∞ poskytla nadace pana S÷rose (viz spodnφ Φßst prvnφho obrßzku). Pokud jde o technickΘ °eÜenφ, to je zcela p∙vodnφ (z autorskΘ dφlny obou student∙ MFF UK), a nabφzφ n∞kterΘ v∞ci, kterΘ jinΘ vyhledßvacφ slu₧by nemajφ: nap°φklad mo₧nost p°id∞lit jednotliv²m hledan²m klφΦov²m slov∙m r∙znΘ vßhy, a tφm Üikovn∞ uzp∙sobit vyhledßvßnφ sv²m specifick²m pot°ebßm. DalÜφ perliΦkou je mo₧nost vyspecifikovat p°φmo v dotazu, ₧e si chcete nechat zobrazit p°φmo n-tou strßnku s v²pisy v²sledk∙ - co₧ sice odstra≥uje pracnΘ proklikßvßnφ se mnoha v²sledkov²mi strßnkami, ale na druhΘ stran∞ mi pon∞kud unikß smysl toho, ₧e mßm mo₧nost p°eskoΦit nejlepÜφ v²sledky, a zajφmat se jen o ty, kterΘ mΘn∞ dob°e odpovφdajφ mΘmu dotazu. NenaÜel jsem ani mo₧nost vyhledßvßnφ frßzφ, a zejmΘna mne zaujala neexistence jakΘkoli zmφnky o diakritice - kdy₧ jde o p∙vodnφ Φesk² produkt, m∞li auto°i mo₧nost se vyrovnat s ΦeÜtinou tak, jak pova₧ovali za vhodnΘ. Empiricky jsem si vyzkouÜel, ₧e dotazy s diakritikou zadßvat lze, a v²sledkem jsou strßnky s p°φsluÜn²mi klφΦov²mi slovy vΦetn∞ diakritiky - ovÜem jen v tΘ samΘ diakritice, v jakΘ byl dotaz polo₧en. Z°ejm∞ tedy cel² systΘm vyhledßvßnφ diakritiku nijak neinterpretuje, a ka₧d² znak hledß "tak jak stojφ a le₧φ". V d∙sledku toho pak m∙₧e b²t dosti zkreslen² ·daj o poΦtu nalezen²ch strßnek, proto₧e r∙znΘ jazykovΘ mutace pak jsou poΦφtßny jako samostatnΘ (navzßjem odliÜnΘ) strßnky.
![](/file/23708/PCWorld_1999-03_cd.bin/tutorial/archiv/axxxk170/gifs/t821k173.gif) |
P∙vodnφ Sherlock je stßle jeÜt∞ dostupn² (i kdy₧ nefunkΦnφ)
|