Siempre que ha habido motores de búsqueda, ha habido personas que tratan de aprovecharse de ellos para tratar de conseguir las páginas de más alto rango en los motores de búsqueda. No es raro ver a muchas auditorías SEO sitio una sección sobre las prácticas negativas que un motor de búsqueda puede fruncir el ceño a, y Google se enumera una serie de esas prácticas en sus directrices para webmasters . Enlazado de las Directrices es una página de Google en texto oculto y enlaces , donde Google nos dice que debemos desconfiar de hacer cosas como:
- El uso de texto blanco sobre un fondo blanco
- Localización de texto detrás de una imagen
- El uso de CSS para colocar texto fuera de la pantalla
- Ajuste el tamaño de fuente a 0
Estos son algunos de los mismos ejemplos descritos en la patente concedida a Google hoy en la USPTO:
Sistemas y métodos para detectar texto oculto y enlaces ocultos
inventados de Fritz Schneider y Matt Cutts
Google asignados a la
patente de EE.UU. 8.392.823
Otorgadas 05 de marzo 2013
Archivado: 25 de agosto 2009
Abstracto
Un sistema detecta los elementos ocultos en un documento que incluye un grupo de elementos. El sistema puede identificar cada uno de los elementos del documento y crear una representación estructural del documento.
La representación estructural puede proporcionar una interconexión del grupo de elementos en el documento. El sistema también puede determinar si uno o más elementos del grupo de elementos están ocultos en base al menos en parte en ubicaciones u otros atributos o propiedades de los uno o más elementos en la representación estructural.
Como era de esperar, uno de los co-inventores detrás de la patente es distinguido ingeniero de Google Matt Cutts, que ha pasado buena parte de su larga carrera en Google explorando las diferentes maneras en que las personas pueden tratar de engañar con spam en el motor de búsqueda y encontrar algunas soluciones.
Me gusta mucho ver a las patentes como ésta, que no puede decirnos nada nuevo, sino que proporcionan una fuente de referencia que otras personas, incluidos los clientes, se pueden señalar hacia. A veces rellenan algunas lagunas sobre cómo un motor de búsqueda podría hacer algo, y proporcionar un poco de historia.
Por ejemplo, esta patente se basa en una anterior que se presentó por primera vez en 2003, y no es difícil imaginar la gente en el Google de que el tiempo tratando de encontrar la manera de automatizar una manera de identificar el texto y enlaces que pueden estar ocultos por siendo el mismo color que el fondo que aparecen en, o ser ofuscado por las hojas de estilo, o escrita en letras tan pequeña que parece ser una línea en lugar de texto real.
Las directrices anteriores mencionan el uso de un carácter único y pequeño en un párrafo se utiliza como enlace, y la patente menciona que las imágenes muy pequeñas (1 píxel x 1 píxel) también han sido utilizados como enlaces ocultos en las páginas.
En la patente también señala, CSS permite a los webmasters para marcar un bloque de texto oculto, o para colocarlo fuera de las áreas visibles de una página. Java script también se puede utilizar para ocultar el texto, y modificar documentos a reemplazar texto.
Parte del proceso detrás de la identificación de texto oculto o enlaces en una página puede implicar el análisis de la estructura HTML de una página y sus elementos, como divisiones o secciones, encabezados, párrafos, listas, imágenes, y otros. Se parece a una Document Object Model (DOM) de páginas para aprender cosas acerca de estos diferentes elementos, sus tamaños, posiciones, órdenes de capas, colores, visibilidad, etc.
La patente proporciona algunos ejemplos diferentes de cuando el texto oculto puede ser encontrado en una página, como en lo siguiente:
En este ejemplo, el servidor 120 puede detectar que el webmaster ha anulado el valor de la etiqueta <h2>. Normalmente, el "h2" etiqueta es un tamaño de la partida, en la que H1 es muy grande, H2 es un poco más pequeño, H3 es aún más pequeña, etc Aquí, la webmaster ha utilizado CSS para anular el valor de h2 para significar "para todos texto en la sección de H2, hacer que el color del texto casi completamente negro, y hacer que la altura de la fuente de aproximadamente un pixel de alta ".
Un espectador de este documento no vería el texto porque es muy pequeño, pero un motor de búsqueda puede determinar que el texto es relativamente importante debido a la etiqueta H2 partida. En esta situación, el servidor 120 puede determinar que el texto en la sección de H2 es muy pequeña, lo que puede indicar que la webmaster está tratando de ocultar el texto en esta sección.
Conclusión
Hay algunas veces cuando los diseñadores utilizan texto oculto porque quieren usar un tipo de letra en una página que no es una fuente de sistema estándar que puede venir con Windows o Apple o Linux, y la página no quede inutilizada la manera que quieren. John Mueller de Google se ha observado en el pasado en el Foro de ayuda para webmasters de Google es probablemente no es un problema .