![]() |
Пишет Аут / Григорий Громов (abcdefgh) 2002-05-23 12:16:00 |
Сначала был Лайкос, потом
Альта-Виста...
и только совсем ведь недавно сравнительно потом появился Гугль.
Нынче то - взад если глянуть - то смотрится оно так, что Веб имеет две эпохи: до Гугля и теперь. Интересно, может ли кто чего еще изобресть, чтоб его переплюнуть или это уже теоретический потолок неструктурированного поиска? А ведь простую вещь - в принципе всем доступную - использовали в основе то на старте компании своей Сергей сотоварищи. Давно всем библиотекарям мира известную - индекс цитирования для оценки релевантности ответов на запрос. И во как - проткнули плотно до них забитый китами рынок, обошли всех в миг, стартуя с нуля. Ото всех тех предбывших искалок сразу и навсегда - покамест оно смотрится - что оторвалися.
Не въехал. Видимо по причине или вообще. Но если поясните чуть более детально, чем этот Вами предлагаемый сексуальный подход для искалок чреват, то и с интересом бы поразмышлял. Потому как. А также. Но это в целом, а теперь, если позволите, то несколько слов без протокола.
Навскидку если, то никакая иерархия - от проклятия растущего в Вебе шума не
спасает. Проблема не в том, что не может найти чего рядовая искалка, а ровно
наоборот - в том что находит слишком много. Так вот как наверх сотен документов
очередной выдачи выкинуть реально ценный - релевантно запросу - отклик? That is
a question...
Индекс цитирования тут помогает, потому что все пользователи искалки оказываются
при таком подходе и ее одновременно редакторами. Совершенно не просматривается в
том что Вы сказали, ничего рядом даже с данной проблемой. А именно, к задаче как
давить шумы отклика, то что Вы говорите и просто не относится. Разумеется, если
понял Вас верно. В сумлении - потмоу и переспрашиваю.
Дело в том что на уровне любого типа семантического анализа текста документа
определить его "полезность" теоретически невозможно. Неформализуемая
принципиально задача. Остается только тот или иной подход к обобщению отношения
пользователей к документу и соответственно изменение его веса после любого
очередного запроса. Можно ли еще чего на этом пути придумать - об том и вопрос
был. Пока не слыхать, потому видимо и пауза.
Мало ли кто и чего "пытается достичь"...
Вечный двигатель, философский камень, мир во всем мире, каждому по способностям
и т.д. - полагаю Вы этот список в состоянии при желании сделать неограниченно
длинным. Речь то шла не об индивидуальных хобби или профессиональных склонностях
отдельных сайтовладельцев - пусть даже и наиболее амбициозных из них - а о
массовых продуктах, интерес к которым подогревается каждым следующим посещением
сайта любым очередным пользователем "с улицы".
Как сам, к примеру, узнал о существовании google искалки. К тому времени
пребывал в спокойной уверенности что Альта-Виста недосягаема для вероятных
конкурентов по многочисленным к тому соображениям, крайне убедительным для того
времени. И вот в новом проекте - еще до того как перезнакомился с участниками -
потребовалось что-то спросить у коллеги через кубик ближе к истине который
сидел. В том смысле что в иерархии спецов шел он сразу за главным технологим
проекта того. Пояснил ему суть вопроса и он ответил привычно спокойно - щас,
гляну сначала что на слуху об етом, а потом подумаем вместе. При этом набрал
гугля того, вынул ответ и начал рассуждать уже потом предметно.
Решил попервоначалу, на его глядя, что это какая-то предметно-ориентированная
искалка для закрытого круга пользователей...
Со временем и сам стал почти вот также вынимать, что лень искать даже и в столе
если, прямо из гугля. Причем чутьи не в буквальном смысле так. Знаю иной раз и
сам, что в одной из директорий в моем компутере оно лежит, но если сразу
под мышкой "шорткат" туда не лежит, то нередко проще получить из гугля бывает.
То есть тянешься к нему уже почти автоматически по любому вопросу. И только
получив там почему отлуп - начинаешь думать, а как быть... А ведь опять же
напомню и всего-то на первый взгляд ничего - старую как мир идею применили
основатели гугля - индекс цитирования. Но об этом выше уже пояснял.