Успех/неудача
большинства сайтов зависят от расчета небольшого алгоритма – PageRankот Google. В этой статье будет говориться о
том, как функционирует PageRank.
Начнем с
прописных истин: Интернет очень огромен, а веб-страницы, наоборот малы. Многие
из них дают одинаковый контент (содержимое). Поэтому отдельному сайту довольно
трудно подняться над всей этой массой. Пользователь зачастую сможет найти этот
сайт, только если страница будет на первом месте в списке. Правила Сети Интерес
жестоки и чем-то напоминают о дарвинской борьбе за выживание – это правила от Google.
Ответ на
вопрос о позициях сайта знают основатели GoogleЛарри Пейдж и Сергей Брин, заложившие в формулу поискового алгоритма PageRank. Тот, кто чтит и использует его себе
во благо, будет вознагражден по заслугам, а тот, кто им пренебрегает, будет
неминуемо наказан.
Однако же,
каким образом работает GooglePR? Как добиться высокого PR? И в каком случае веб-страница
попадет в верхнюю часть списка поисковой машины....
PR: Как вычисляется по формуле.
PR возник еще давно из великого логического рассуждения:
1. Для
каждой из страниц сайта найдется в огромных просторах Сети Интернет страница,
которая даст на нее гиперссылку.
2. Каждая из
данных страниц тоже будет иметь свой PR.
3.Ссылка со
страницы В страницу А, как при выборах, может считаться только одним голосом,
отданным В за А.
4. В
качестве фактора рассматривается общее число ссылок на странице В. Чем их
больше, тем хуже это для страницы А.
5. PageRank со страницы В придает голосу
отданному за страницу А, дополнительный прирост веса PageRank.
Важно
следующее суждение: PageRank устанавливается не для какого-то отдельного сайта, а для
каждой страницы веб-сайта. Именно поэтому может случиться так, что определенный
документ сайта, будет иметь большее значение PageRank, чем даже главная страница. В виде
уравнения вся игра с PRвыглядит так:
PR (A) = (1-d) + d (PR (T1)/C(T1)+…+ PR (Tn)/C(Tn))
Вот как это
читается: PageRank документа А складывается из PR страниц T1…Tn, разделенных соответственно на
количество ссылок на этих страницах. При этом следует учитывать такую вещь как
коэффициент затухания PR.
Принцип PageRank легко объяснить, если предположить,
что весь мировой Интернет состоит всего-то из 4 страницек. Как дано
известно,нам были даны странички А,В,С,D.
Каждая из
страниц А,В,С и D с определенным количеством , который равен (пока) одному. Все значения PegeRпросто объяснить. Значения, взятые
вместе, соответствуют всей сети из четырех страниц.
Для первого
примера возьмем сеть состоящую из А, В, С и D. Каждая из страниц В, С и D поставила ссылку на страничку А, не
имея никаких других ссылок.
У нас
получится вот такая формула, не учитывая другие мелкие факторы:
PR (A) = 1/1 +1/1 + 1/1
(1 – PR, 1 – количество ссылок на странице)
:) Оно дает
значение для А, которое будет равно 3.
----
Теперь
сделаем более сложную формулу, в которой страничка А имеет еще ссылки на В и С.
В – лишь на А . С – только на А, В, С.
Тогда данная
формула будет выглядеть следующим образом:
PR (A)=1/1 + 1/3
Ссылка со
страницы В дает PR1, от
С мы получаем только 0,33, поскольку она имеет сразу три ссылки. В результате
будет 1,33. Формула В имеет такой вид:
PR (В) = 1\2 + 1\3 +1\1
Округлим и
получим 1,83
PR страницы С узнаем так:
PR (С) = 1.2
То есть 0,5.
В конце концов, D поучит:
PR (D) = 1/3
Или же 0,33
(с округлением результата)
В этом
вычислении не достает еще вот чего: в результат не включен PR каждой из страниц. Возьмем еще раз пример
с веб-страницей В. Если, вместив него показатели PR, взятые во время выполнения шага
один, то получим:
PR (В) = 1,33\2 + 0,5 + 0,33/1
С
округлением результат получается 1,62, это соответственно изменит рейтинги PR для В, С и D. Из-за этого Googleработает с PageRankступенчато (итеративно), то есть
поисковик применяет результаты предыдущего захода для вычисления следующего
шага итерации.По данным от Пейджа и
Брина, достаточно 200 проходов, чтобы получить PR миллиардов сохраненных страниц.
При копировании материалов ссылка на источник обязательна. Если какой либо материал нарушает ваше
авторское право, то пожалуйста обратитесь к администрации через ЛС. Шаблон защищен авторским правом. подробнее