Пишет Аут / Григорий Громов (abcdefgh)
2002-05-23 12:16:00

Сначала был Лайкос, потом Альта-Виста...
и только совсем ведь недавно сравнительно потом появился Гугль.

Нынче то - взад если глянуть - то смотрится оно так, что Веб имеет две эпохи: до Гугля и теперь. Интересно, может ли кто чего еще изобресть, чтоб его переплюнуть или это уже теоретический потолок неструктурированного поиска? А ведь простую вещь - в принципе всем доступную - использовали в основе то на старте компании своей Сергей сотоварищи. Давно всем библиотекарям мира известную - индекс цитирования для оценки релевантности ответов на запрос. И во как - проткнули плотно до них забитый китами рынок, обошли всех в миг, стартуя с нуля. Ото всех тех предбывших искалок сразу и навсегда - покамест оно смотрится - что оторвалися.

>

Не въехал. Видимо по причине или вообще. Но если поясните чуть более детально, чем этот Вами предлагаемый сексуальный подход для искалок чреват, то и с интересом бы поразмышлял. Потому как. А также. Но это в целом, а теперь, если позволите, то несколько слов без протокола.

Навскидку если, то никакая иерархия - от проклятия растущего в Вебе шума не спасает. Проблема не в том, что не может найти чего рядовая искалка, а ровно наоборот - в том что находит слишком много. Так вот как наверх сотен документов очередной выдачи выкинуть реально ценный - релевантно запросу - отклик? That is a question...

Индекс цитирования тут помогает, потому что все пользователи искалки оказываются при таком подходе и ее одновременно редакторами. Совершенно не просматривается в том что Вы сказали, ничего рядом даже с данной проблемой. А именно, к задаче как давить шумы отклика, то что Вы говорите и просто не относится. Разумеется, если понял Вас верно. В сумлении - потмоу и переспрашиваю.

Дело в том что на уровне любого типа семантического анализа текста документа определить его "полезность" теоретически невозможно. Неформализуемая принципиально задача. Остается только тот или иной подход к обобщению отношения пользователей к документу и соответственно изменение его веса после любого очередного запроса. Можно ли еще чего на этом пути придумать - об том и вопрос был. Пока не слыхать, потому видимо и пауза.

>

Мало ли кто и чего "пытается достичь"...

Вечный двигатель, философский камень, мир во всем мире, каждому по способностям и т.д. - полагаю Вы этот список в состоянии при желании сделать неограниченно длинным. Речь то шла не об индивидуальных хобби или профессиональных склонностях отдельных сайтовладельцев - пусть даже и наиболее амбициозных из них - а о массовых продуктах, интерес к которым подогревается каждым следующим посещением сайта любым очередным пользователем "с улицы".

Как сам, к примеру, узнал о существовании google искалки. К тому времени пребывал в спокойной уверенности что Альта-Виста недосягаема для вероятных конкурентов по многочисленным к тому соображениям, крайне убедительным для того времени. И вот в новом проекте - еще до того как перезнакомился с участниками - потребовалось что-то спросить у коллеги через кубик ближе к истине который сидел. В том смысле что в иерархии спецов шел он сразу за главным технологим проекта того. Пояснил ему суть вопроса и он ответил привычно спокойно - щас, гляну сначала что на слуху об етом, а потом подумаем вместе. При этом набрал гугля того, вынул ответ и начал рассуждать уже потом предметно.

Решил попервоначалу, на его глядя, что это какая-то предметно-ориентированная искалка для закрытого круга пользователей...

Со временем и сам стал почти вот также вынимать, что лень искать даже и в столе если, прямо из гугля. Причем чутьи не в буквальном смысле так. Знаю иной раз и сам, что в одной из директорий в моем компутере оно лежит, но если сразу под мышкой "шорткат" туда не лежит, то нередко проще получить из гугля бывает. То есть тянешься к нему уже почти автоматически по любому вопросу. И только получив там почему отлуп - начинаешь думать, а как быть... А ведь опять же напомню и всего-то на первый взгляд ничего - старую как мир идею применили основатели гугля - индекс цитирования. Но об этом выше уже пояснял.