Цитаты из статьи по PageRank (http://www.woweb.ru/publ/31-1-0-714): Вычисление Pagerank Представьте себе идеального веб-серфера перемещающегося по всемирной паутине. Пусть сёрфер посещает страницу p, случайное блуждание при этом находится в состоянии p. На каждом шаге, веб-сёрфер либо перепрыгивает на другую страницу в сети, выбранную псевдо-случайным образом, либо он следует по ссылке на текущей странице, при этом не возвращаясь и не посещая одну и ту же страницу дважды. Вероятность случайного прыжка обозначим как d тогда вероятность перехода по ссылке будет 1-d. Таким образом, вероятность нахождения пользователя на странице p можно вычислить по следующей формуле: где R(p) – PageRank страницы, С(p) – число ссылок на странице, к – число ссылающихся на p страниц, d- коэффициент затухания (damping factor). Обычно 0.1масштабировать PageRank таким образом, что где N – число всех страниц, для которых производится расчёт PageRank, то R(p) можно рассматривать как распределение вероятности по всем страницам. Для вычисления PageRank составляется матрица M размером NxN, где каждому элементу mij матрицы присваивается значение R0(p)=1N в том случае, если с i -й страницы имеется ссылка на j-ую, все оставшиеся элементы матрицы заполняются нулями. Таким образом, вычисление PageRank сводится к отысканию собственного вектора матрицы M что достигается умножением матрицы M на вектор Rj на каждом шагу итерации. Введение коэффициента затухания гарантирует, что процесс сходится. Если зарегистрировать сайт во всех популярных каталогах, то PageRank будет очень высоким Не стоит обольщаться – PageRank вычисляется не для сайта целиком, а для отдельно взятой страницы. Поэтому ссылка из глубокой поддириктории, скажем в Yahoo, может быть менее ценна чем страница Васи Пупкина. Так что, тут […]
Read more