Cómo funciona el algoritmo PageRank de Google

miércoles, 17 de septiembre de 2008

El valor del PageRank que observamos si tenemos instalada la barra de Google es un valor comprendido entre 0 y 10. Pero en realidad, el PageRank es un valor numérico mucho más alto, calculado en función de los enlaces que reciben nuestras páginas.

El valor real suele ser del orden de miles de unidades. Sin embargo, Google coge su valor logarítmico para hacerlo visible a los usuarios. La base de este logaritmo es desconocida.

Por ejemplo, para una base 7, tendríamos los siguientes valores:

PR Barra PR Real
0 0 - 3
1 3 - 19
2 19 - 130
3 130 - 907
4 907 - 6351
5 6351 - 44458
6 44458 - 311209
7 311209 - 2178466
8 2178466 - 15249262
9 15249262 - 106765607
10 > 106765607

Si una página tiene un PageRank real -por ejemplo- de 500000, ¿qué valor le trasmitiría a otra a la cual enlaza?.

La respuesta a esta pregunta se contesta en el ya famoso texto de Sergey Brin y Larry Page (fundadores de Google), llamado 'The Anatomy of a Large-Scale Hypertextual Web Search Engine'.

En él, planteaban la siguiente fórmula para calcular el PageRank de una página web llamada 'A':

PR(A) = (1-d) + d * [ PR(T1)/C(T1) + ... + PR(Tn)/C(Tn) ]

Donde:
- 'd' es el factor de atenuación. Un valor podría ser 0,85
- 'Ti' es cada página que enlaza a 'A'. 'i' toma los valores 1, 2, ... hasta 'N'. 'N' es el número de páginas que enlazan a 'A'.
- 'PR(Ti)' es el PageRank de cada una de las páginas que enlazan a 'A'.

- 'C(Ti)' es el número de enlaces que salen desde cada página 'Ti'.

Por lo tanto, nuestra página de 500000 de PageRank transmitirá a otra en caso de tener un único enlace, un valor de 0,85*500000 = 425000. Generalmente las páginas poseen más de un enlace dentro de ellas, así que este valor habría que dividirlo entre el número de enlaces.



Como se puede comprobar, el valor del PageRank de cada página no es constante en el tiempo, ya que depende de los enlaces que vayamos recibiendo y, a su vez, del PR de las páginas que nos enlazan.

Por ello, una vez al mes aproximadamente, Google recalcula el valor de este PageRank en lo que viene a llamar la 'Google Dance'.

0 Comments:

Superficie Web - Theme designed by Superficieweb.com