Página 1 de 1

Eliminar la opcion "cache de google" en buscadores

Publicado: 12 Dic 2009, 08:42
por luvan
URL: http://elfaenon.xtreemhost.com/foro/index.php
Versión phpBB: phpBB3 (3.0.6)
MODs Instalados: en mi firma
Plantilla(s) usada(s): prosilver
Servidor: linux
Actualización desde otra versión: sí de 3.0.4 a 3.0.6


Hola, este es un tema de riesgo, no sé donde ponerlo realmente, creo que en este foro es el mas adecuado para la ayuda.

Veran, tengo algunas zonas(foros, temas) reservadas, donde solamente pueden ingresar usuarios con una clave o dandoles acceso manualmente, igualmente forme algunos temas donde solamente pueden entrar los moderadores y/o administradores. Lo que hize fue negarles el acceso en permisos de foros, a los bot. No pueden ver ni leer, de acuerdo a la opcion que aparecian en los permisos.

Resulta que curioseando en el buscado de google, aparecen los temas de dichos foros reservados, muchos de ellos con una breve descripcion del tema que supuestamente no debiera verse. El más grande problema es que en el buscador de google aparece la opcion de caché, que al hacerle click automaticamente aparece el foro sin siquiera haberse registrado y que es de caracter restringuido, reservado para foristas especiales.

¿Que paso realmente? ¿Es una vulnerabilidad de phpbb 3.0.6?

Revisando la informacion en google, me recomendaron ingresar meta tags, pero su información es muy vaga, no la entiendo, además que no me dice en que archivo hacer la modificacion, tampoco me dice la forma de que no se vea la opcion del caché o del por qué aparecen en sus buscadores mis foros reservados cuando a su bot le denegue acceso total.

Gracias, y espero sus recomendaciones, ya que mi foro lo siento vulnerable.

Re: Eliminar la opcion "cache de google" en buscadores

Publicado: 12 Dic 2009, 17:29
por luvan
Hasta el momento estoy haciendo lo siguiente:

En el overal_header.html agrege despues de <head>

Código: Seleccionar todo

<META NAME="ROBOTS" CONTENT="NOARCHIVE"> 
<META HTTP-EQUIV="Cache-Control" CONTENT ="no-cache">
<META HTTP-EQUIV="Pragma" CONTENT="no-cache"> 
<META HTTP-EQUIV="expires" CONTENT="0">
Tambien subi el archivo de texto robots.txt con el siguiente codigo generado por la propia ayuda de las herramientas de webmaster de google.

Código: Seleccionar todo

User-agent: *
Allow: /

User-agent: Googlebot
Disallow: /

He movido todos mis temas que aparecian en el caché de google a un foro nuevo y privado, he cambiado las palabras con que aparecian en google. Lei que tengo que esperar que google mande su nuevo rastreador para actualizar la pagina.

Mi preocupación es si hay un problema de que mi servidor sea gratuito, ya que edite algunos temas y nunca se han actualizado en los buscadores de google.

Gracias.

Re: Eliminar la opcion "cache de google" en buscadores

Publicado: 12 Dic 2009, 23:04
por ahh72
si deseas un buen meta tags aqui lo tienes: http://www.mssti.com/phpbb3/viewtopic.php?f=50&t=578

saludos

Re: Eliminar la opcion "cache de google" en buscadores

Publicado: 14 Dic 2009, 16:50
por luvan
Gracia por la recomendacion.

Ya solucione mi problema, movi todos mis temas a una nueva zona reservada, hize nuevos post y pegue los anteriores. Los originales los elimine. Tambien mande varias url en la ayuda de webmaster de google para que lo eliminaron. Hasta ahí me ha funcionado perfecto, salvo por un enlace que aún esta vivo para el caché de google.

Ahora mi consulta es la siguiente: ¿El archivo robots.txt que subi a mi foro, que es el codigo que postee líneas arriba, impediraa a googlebot rastrear todos mis temas?

Gracias por la ayuda

Re: Eliminar la opcion "cache de google" en buscadores

Publicado: 14 Dic 2009, 20:06
por HuanManwe
el archivo que pusiste de robots.txt le dice que a GoogleBot no le permita mirar nada dentro de ese directorio, asi que no mirara nada. Nada significa nada, asi que no mirara ni los que no quieres que mire ni los demas. No se si es eso lo que querias...

1.- Permito a cualquier robot de busqueda ndexar mi foro
User-agent: *
Allow: /

2.- Pero en concreto al de gooble no le dejo indexar nada desde el directorio raiz.
User-agent: Googlebot
Disallow: /

Con esa medida permites mirar e indexar a cualquier otro robot, como el buscador de Yahoo, Bing, y otros.

Re: Eliminar la opcion "cache de google" en buscadores

Publicado: 14 Dic 2009, 20:10
por MR.PABLO
HuanManwe, entonces, existe una solución para quitar las páginas indexadas de google que son "basura" o cache?, claramente sin que afecte eso ...

Re: Eliminar la opcion "cache de google" en buscadores

Publicado: 14 Dic 2009, 22:04
por HuanManwe
una forma teorica es dando permisos de NUNCA a los usuarios bots, para esos foros. Es la forma teorica mas facil y limpia; asi podrias quitar ese archivo robots.txt y que el resto de tu web sea indexada.

Re: Eliminar la opcion "cache de google" en buscadores

Publicado: 14 Dic 2009, 23:35
por luvan
Como explique lineas arriba, la mejor forma es darle las url donde quieres que se elimine tu información.
Yo lo hize atraves de las herramientas del webmaster de google.

Una consulta final, a mis zonas reservadas ya le di permisos de NUNCA al bot, para esa zona, además le puse una contraseña de ingreso a la zona. ¿Ahora puede quitar eliminar libremente el robots.txt?

Gracias por la ayuda.