Цитаты из статьи по PageRank (http://www.woweb.ru/publ/31-1-0-714):
Вычисление Pagerank
Представьте себе идеального веб-серфера перемещающегося по всемирной
паутине. Пусть сёрфер посещает страницу p, случайное блуждание
при этом находится в состоянии p.
На каждом шаге, веб-сёрфер либо перепрыгивает на другую страницу в сети, выбранную
псевдо-случайным образом, либо он следует по ссылке на текущей странице, при
этом не возвращаясь и не посещая одну и ту же страницу дважды. Вероятность
случайного прыжка обозначим как d тогда вероятность перехода по ссылке
будет 1-d.
Таким образом, вероятность нахождения пользователя на странице p
можно вычислить по следующей формуле:
где R(p) – PageRank страницы, С(p) – число
ссылок на странице, к – число ссылающихся на p страниц, d-
коэффициент затухания (damping factor). Обычно 0.1масштабировать PageRank таким образом, что
где N – число всех страниц, для которых
производится расчёт PageRank, то R(p)
можно рассматривать как распределение вероятности по всем страницам.
Для вычисления PageRank составляется матрица M размером
NxN, где каждому элементу mij матрицы присваивается
значение R0(p)=1N в том случае, если с i -й страницы имеется ссылка на
j-ую, все оставшиеся элементы матрицы заполняются нулями.
Таким образом, вычисление PageRank сводится к отысканию собственного вектора
матрицы M что достигается умножением матрицы M
на вектор Rj
на каждом шагу итерации. Введение коэффициента затухания
гарантирует, что процесс сходится.
Если зарегистрировать сайт во всех популярных каталогах, то PageRank
будет очень высоким
Не стоит обольщаться – PageRank
вычисляется не для сайта целиком, а для отдельно взятой страницы. Поэтому ссылка из глубокой поддириктории,
скажем в Yahoo, может быть менее ценна чем страница Васи Пупкина. Так что, тут можно
взять не качеством ссылок, а их количеством. Надо только обращать внимание на то,
чтобы ссылки из каталога шли напрямую на ваш сайт, а не через cgi-скрипт,
иначе они просто не будут учитываться. Кроме того, правила многих каталогах
требуют размещения корневой страницы, а не того документа, PageRank которого вы
собираетесь повышать. Поэтому гораздо эффективнее можно повысить PageRank
конкретной страницы ссылкой с корневой страницы своего собственного сайта.
PageRank уменьшается при проставлении внешних ссылок
Весьма спорное утверждение, как говорилось выше PageRank
понижается в случае симметричного
объединения ссылающихся страниц, вероятность получить которое при проставлении
внешней ссылки ничтожно мала. Если такую фобию в себе не перебороть, то можно
дать совет завести специальную страницу для обмена ссылками. Кстати, стоит
заметить, что при расчёте PageRank никто не обещал разделять ссылки на внешние и внутренние.
Если добиться высокого PageRank для какой-то страницы, то
эта страница будет на первом месте в результатах поиска.
Не верно, по той причине, что PageRank является не основным критерием для
ранжирования страниц, а вспомогательным. В противном случае, на первых
страницах по очень многим запросам располагались бы только рейтинги и топы.
Только при прочих равных условиях страница с более высоким PageRank
будет располагаться выше в результатах поиска.
Если на какой-то сайт есть много ссылок с
FFA, гостевых книг или на сайтов другой тематики, то PageRank
будет занижен.
Не стоит путать понятия <индекс цитирования> и PageRank. При расчёте PageRank
анализ содержимого ни сайта ни текста ссылки не производится, учитываются
только общее число ссылок и их веса, поэтому никаких штрафных санкций при
наличии ссылок с <неправильных> страниц не применяется.
Leave a Reply