Пишет Аут / Григорий Громов (abcdefgh)
 2003-10-25 17:24:00

Google PageRank VS. LJRank: какая система мер объективнее отражает ценность Вашей страницы?

Многие популярные в инетернете форумы пытаются копировать (для ранжирования своих юзеров по относительной популярности привносимого ими лично на этот форум контента) систему измерения популярности Веб страниц, разработанную создателями Google.

Если в таком случае брать систему PageRank гуглевую за эталон, потому как более совершенных пока видимо еще не создано и по ней строят многие остальные из наиболее известных, то видимо было бы небезынтересно сравнивать (можно сказать и иначе - КАЛИБРОВАТЬ) те уже локальные версии гуглевых измерителей популярности, сопоставляя их результаты - по отдельным позициям - с прямыми их же и измерениями по самому гуглю. К примеру, можно бывло бы сравнивать какой ранг популярности окажется при сравнении юзера ХХХ с конкурирующим с ним по популярности в LJ юзером ZZZZ по двум метрическим системам: 1) исходно оригинальной версиии Google PageRank самим гуглем предлагаемую - с одной стороны; 2)ее локально жежешной версии LJRank - взвешенный индекс популярности в LJ.

LJRank - напомним, это такая страница "Спутника жижиста" (созданная для специально для жжистов версия гуглевого измерителя), которая была до сих пор безусловно полезна, потому что сам Google все это время не давал возможностей пользоваться его измерителем в личных целях - никому за пределами своих же и гуглевых сотрудников он не давал своего измерителя прямо в руки, а только пояснял в общих чертах как он работает.

Нынче же такие сопоставительные измерения - для самого себя или любых интересных кому-то иных юзеров LJ страничек - каждый может (свершилось!) проделать без особого труда и сам. Google предлагает теперь всем желающим бесплатно установить у себя в браузере его фирменный toolbar, в котором (кроме много чего еще полезного) стоит его (подлинно гуглевый то есть, а не какие-то там очередные самостроки) измеритель популярности страниц в инете.

Никаких компьютерных навыков для установки этого самого toolbar гуглевого не требуется и любой LJ юзер, из тех кто иногда лазил в "Спутник жижиста" чтобы с помощью LJRank на такие сопоставления популярности глянуть, могут теперь без труда это чудо природы в личное пользование заиметь. Достаточно только кликнуть на линк: http://toolbar.google.com и следовать далее инструкции.

Сопоставление относительных позиций некоторых из наиболее популярных - согласно данным измерений приводимымм в "Спутнике жижиста" - в LJ авторов с аналогичными данными об их относительных позициях согласно Google PageRank при этом иногда дает поводы для любопытных размышлений. Начать с того, что уже сам по себе рейтинг в "Спутнике жижиста" далеко не соответствует рейтингу, который был бы составлен по одной лишь длине листа friendoff сопоставляемых дневников. В этом смысле и представляется видимо интересным дальнейшее уточнение их относительных между собой позиции, когда измерения производится теперь уже что называется на всю катушку избранной в инете системы ""мер и весов" критериев - то есть, по всем нормам сравнения страниц, действующих для эталонного механизма Google PageRank.

>

Мы с Вами про гуглю и в самом деле уже однажды разговаривали тут. Но совсем в ином ключе, хотя и тоже про про гугль там разговор шел. Потмоу может быть и стоило бы ответить здесь на некоторые Ваши вопросы, выше поставленные.

Начну, если позволите, с конца. Убеждать Вам меня в том, что "индекс цитирования" или "linkrank" был известен до Гугля нет видимо смысла, хотя бы потому, что применял его для ранжирования компьютерных журналов на Вебе начиная с весны 1995. То есть в то время, когда эти двоя студентов еще сами не знали о том, что они через несколько лет к окончанию универа своего встретятся и решат учинять этот самый Google. Возможно поэтому - шютка - они этот мой ресурс от самого их момента корпоративного рождения строго блюдут на первом месте по ихним алгоритмам, как бы их и когда не меняли. Инварианта. На запрос computer magazines выпрыгивает всегда первым или сразу после zdnet. Обойти чтобы zdnet - супротив "Зиф-Дэвис" то есть - даже у них видать порой бывает что нет приема...

Так что дело не в их приоритете на "индекс цитирования" - почти все в этом мире, включая и законы механики и пр. гидравлика, были известны, опять же к примеру, задолго до шариковой ручки. Но оставили все тем ни менее свои жестяные перья и стали писать этим самым шариком с пастой. Ровно также и здесь. После того как yahoo, а затем и aol и пр. искалки сели на гуглевый search-engine, все остальное уже лирика. Только один лишь гугль с яху вместе уже набирают за 80 процентов Вебовского населения. Так что - "стандарт де факто". Это может нравиться кому-то или нет, но стандарт. Об чем выше и речь.

В том числе и создатели "Спутника жижиста" поясняли, что за основу взяли гуглевый алгоритм. Потому кроме прочего и полагал, что сравнения здесь могут быть небезынтересны.

Что же касается веса "индекса цитирования" в метрике гуглевой, то сегодня он там, хотя и разумеется, присутствует, но уже давно не единственный и - снова, как в тот раз, только под большим секретом, но все-таки расскажу Вам - больше уже он не является у них индекс этот решающим. Много там еще чего понаворочано.

Наконец - ближе к телу - про этот самый toolbar. Он и в самом деле - Вы совершенно правы - был давно доступен как бета версия сначала, а потом как некий в ряду иных пробный продукт. Совсем уже лишь не так давно они его довели до товарного вида (а также начинили всяко-разной еще акромя полезной всячиной) и стали предлагать уже в регулярном режиме, как завершенное в данной версии изделие. Есть там у них разумеется и теневые стороны, как в любой программе, что из резидентного компа куда то наружу лазит и чего-то туда уносит, но это уже другой и более общий вопрос - про такого рода неспокойные резидентные игрушки, включая и здешний LJ-клиент, кто его пользует если ....

>

Традиционная вводка - извините за длинное письмо, но к сожалению не было времени сформулировать короче. Если же и в самом деле серьезно к этим текстам относиться, а гугль такое рекомендует кстати, то тогда не берите в голову. Вовсе не обязательно все что пишут люди в своих дневниках - по самым разным поводам - всем интересно бывает. Это же дневник - пусть даже и в онлайне - этим все сказано.

Напомнили Вы про что-то - или еще кто - вот и записал себе в дневник некие мне самому про то интересные соображения. Могут ли они кому еще быть поводом для следующего к ним скажем почему-либо коммента к ней - вопрос этот всегда остается открытым.

Наконец, чтобы уж и вовсе полную ясность в этот узко процедурный вопрос внести, сознаюсь - мне и самому бывает вовсе не обязательно сразу же и в первом чтении некоторые из этих своих записей бывают понятны. Пищу чаще всего их сюда как раз для того, чтобы разного рода сопутствующие текстам этим соображения не потерялись, и соответственно сохранилась бы возможность к ним потом еще ни раз вернуться и возможно тогда уже понять об чем это все и к чему тоже. Иногда - такое тоже бывает - удается.

>

Выше сказано было ... о том что за несколько лет до появления в инете гугля, применял ранжирование по критериям, включавшим в себя так ровно и называемый "maglinkrank. Чтобы в этом - с точностью до года - убедиться достаточно глянуть в всея вебовский веб-архив, который к счастью хранит кэшевые версии всего сколько то на вебе заметного с 1996 года. Есть там и эта самая страница, о которой в данном случае речь:
http://web.archive.org/web/19971011182114/www.internetvalley.com/archives/0596maglinkrank.html

 

Цель то ведь не "подправить", а сравнить, как выглядит список скажем той же "горячей десятки", сформированной по критериям "Спутника жижиста" (который есть тот же гуглевый алгоритм, но авторами его возможно "подправленный"), с оригинальным гуглевым. Для чего, после установки этого самого toolbar и лазить то больше уже никуда не надо будет. Как Вы верно заметили, на браузере он тогда будет сидеть и ясно показывать контент-вес каждой вызываемой страницы. Тем - именно тем - как пытался показать в исходном сообщении, и было бы любопытно такое сравнение. лезешь в "Спутник жж" и сравниваешь их ранг популярности с тем, что показывает собственный браузер. Ровно об том и речь - про сравнение. Как об том полагал что предельно ясно было в заголовке данного сообщения сформулировано: