domingo, 26 de julio de 2009

Como indexa Google las paginas

Hola amigos

Hoy me gustaria compartir informacion que esta al alcance de todos en la siguente pagina de Google acerca del proceso de como indexa google las paginas que lista en sus resultados

http://www.google.es/corporate/tech.html

Ahi se explica como indexa Google las paginas de una manera descriptiva, aunque no cuantitativa.

Permitanme transcribir algunos parrafos para hacer mis comentarios:

"Los motores de búsqueda tradicionales se basan, en gran parte, en la frecuencia con que una palabra aparece en una página web. Google, en cambio, emplea la tecnología PageRank™ para examinar toda la estructura de vínculos de la web y determinar qué páginas son las más importantes. A continuación, realiza un análisis de concordancia de hipertextos para establecer qué páginas son relevantes para la búsqueda específica que se esté procesando. Al combinar la importancia general con la relevancia específica respecto de una consulta en particular, Google puede colocar los resultados más relevantes y fiables en primer lugar."

Aqui nos describe claramente que su proceso de indexacion no es simple por lo que para lograr estar bien posicionados debemos estudiar el sistema de manera mas profunda y no solo superficialmente.

"PageRank realiza una medición objetiva de la importancia que tienen las páginas web. Para ello, resuelve una ecuación que contiene más de 500 millones de variables y 2.000 millones de términos. En lugar de contar los vínculos directos, PageRank interpreta un vínculo de la Página A a la Página B como un voto que recibe la Página B de parte de la Página A. PageRank evalúa, de esa manera, la importancia que tiene una página determinada al contar la cantidad de votos que recibe."

Como les decia en el parrafo anterior, no es a primera vista como se determina que paginas aparecen en primer lugar.

"PageRank también considera la importancia de cada página que emite un voto, dado que a los votos procedentes de determinadas páginas se les otorga un valor mayor, incrementando así el valor de la página vinculada. Las páginas importantes reciben una valoración de PageRank más alta y aparecen en la parte superior de los resultados de búsqueda. La tecnología de Google emplea la inteligencia colectiva de la web para determinar la importancia de una página. Los resultados se obtienen sin ningún tipo de participación humana; por este motivo, los usuarios han llegado a confiar en Google como fuente de información objetiva, libre de la manipulación que se genera cuando los sitios pagan por ocupar determinada posición en los resultados."

Al ser el proceso de indexacion completamente automatico podemos tener la esperanza de aparecer algun dia en el primer lugar y tambien que no hay personas filtrando o manipulando las posiciones.

Por eso Google pone los anuncios Adsense en primer lugar, ya que no tienen injerencia humana en los resultados que arrroja el motor de busqueda. En ese sentido es tan honesto como el algoritmo de indexacion lo establece. Eso lo podemos inferir luego de entender como indexa google las paginas.

"Análisis de concordancia de hipertextos: el motor de búsqueda de Google también analiza el contenido de cada página. Sin embargo, en lugar de explorar simplemente el texto de la página (que los editores de sitios pueden manipular mediante metaetiquetas), la tecnología de Google analiza todo el contenido de una página y toma en cuenta también las fuentes, las subdivisiones y la ubicación precisa de cada palabra. Asimismo, Google analiza el contenido de páginas web vecinas para garantizar que los resultados encontrados son los más relevantes para la consulta del usuario"

Podemos concluir que aun y cuando haya competencia en posicionar paginas en el primer lugar de resultados de Google hay tambien esperanza. Debemos estudiar el proceso de indexacion de Google el cual tiene como corazon los enlaces de calidad de otras paginas a la tuya.

Si quieres conocer las formulas detras del algoritmo de como indexa google las paginas puedes visitar esta pagina (En ingles)

http://infolab.stanford.edu/~backrub/google.html

Saludos

No hay comentarios:

Publicar un comentario