Comunidad de diseño web y desarrollo en internet online

htaccess y drupal

Citar            
MensajeEscrito el 01 Oct 2008 12:00 pm
hola a todos,

antes que nada, me presento. hace ya un año que utilizo esta web para buscar tutoriales o despejar dudas cuando estoy trabajando en algún proyecto. por suerte, siempre encontré lo que buscaba y no tuve la necesidad de postear en los foros para pedir ayuda. Pero esta vez la situación me ha sobrepasado.
He realizado un sitio en drupal, con unas 150 páginas. más allá de las luchas con el IE para que me visualizara correctamente el sitio, no tuve mayores complicaciones.
Pero ahora tengo este problema, que luego de 6 horas de googlear, leer, probar y reprobar me ha dejado la cabeza seca.
El problema en cuestión es este:
*tengo las urls limpias activadas, y funcionan a la perfección.
*salvo por 8 (si sólo 8) páginas que se me han duplicado. Cuando realizo una búsqueda en google del tipo site:www.autoimportas.com me arroja unas urls del tipo: www.autoimportas.com/index.php?q=importacion-coches-pago
y eso para el SEO es muy malo.
El resultado de la búsqueda lo pueden ver en:
www.google.com.ar/search?q=site%3Awww.autoimportas.com&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:es-ES:official&client=firefox-a
Entonces, ¿por qué sólo esas 8 urls google las ve distintas que a las restantes 140?
Imagino que el problema viene por el .htaccess, pero no puedo diagnosticarlo. una porque no entiendo nada y otra porque tampoco comprendo porqué algunas urls no tienen problema y otras si.
Yo simplemente en cambiado el código del archivo para que me redireccione hacia el sitio con www, nada más.
les dejo el código completo del .htaccess, ojala alguien acá con conocimiento pueda solucionarmelo; yo, la verdad, ya me siento vencido por un archivito de 1k.

Código :

RewriteBase /
RewriteBase /
#
# Apache/PHP/Drupal settings:
#

# Protect files and directories from prying eyes.
<FilesMatch "\.(engine|inc|info|install|module|profile|po|sh|.*sql|theme|tpl(\.php)?|xtmpl)$|^(code-style\.pl|Entries.*|Repository|Root|Tag|Template)$">
  Order allow,deny
</FilesMatch>

# Don't show directory listings for URLs which map to a directory.
Options -Indexes

# Follow symbolic links in this directory.
Options +FollowSymLinks

# Customized error messages.
ErrorDocument 404 /index.php

# Set the default handler.
DirectoryIndex index.php

# Override PHP settings. More in sites/default/settings.php
# but the following cannot be changed at runtime.

# PHP 4, Apache 1.
<IfModule mod_php4.c>
  php_value magic_quotes_gpc                0
  php_value register_globals                0
  php_value session.auto_start              0
  php_value mbstring.http_input             pass
  php_value mbstring.http_output            pass
  php_value mbstring.encoding_translation   0
</IfModule>

# PHP 4, Apache 2.
<IfModule sapi_apache2.c>
  php_value magic_quotes_gpc                0
  php_value register_globals                0
  php_value session.auto_start              0
  php_value mbstring.http_input             pass
  php_value mbstring.http_output            pass
  php_value mbstring.encoding_translation   0
</IfModule>

# PHP 5, Apache 1 and 2.
<IfModule mod_php5.c>
  php_value magic_quotes_gpc                0
  php_value register_globals                0
  php_value session.auto_start              0
  php_value mbstring.http_input             pass
  php_value mbstring.http_output            pass
  php_value mbstring.encoding_translation   0
</IfModule>

# Requires mod_expires to be enabled.
<IfModule mod_expires.c>
  # Enable expirations.
  ExpiresActive On

  # Cache all files for 2 weeks after access (A).
  ExpiresDefault A1209600

  # Do not cache dynamically generated pages.
  ExpiresByType text/html A1
</IfModule>

# Various rewrite rules.
<IfModule mod_rewrite.c>
  RewriteEngine on

  # If your site can be accessed both with and without the 'www.' prefix, you
  # can use one of the following settings to redirect users to your preferred
  # URL, either WITH or WITHOUT the 'www.' prefix. Choose ONLY one option:
  #
  # To redirect all users to access the site WITH the 'www.' prefix,
  # (http://example.com/... will be redirected to http://www.example.com/...)
  # adapt and uncomment the following:
  # RewriteCond %{HTTP_HOST} ^example\.com$ [NC]
  # RewriteRule ^(.*)$ http://www.example.com/$1 [L,R=301]
  #
  # To redirect all users to access the site WITHOUT the 'www.' prefix,
  # (http://www.example.com/... will be redirected to http://example.com/...)
  # uncomment and adapt the following:
  # RewriteCond %{HTTP_HOST} ^www\.example\.com$ [NC]
  # RewriteRule ^(.*)$ http://example.com/$1 [L,R=301]

  # Modify the RewriteBase if you are using Drupal in a subdirectory or in a
  # VirtualDocumentRoot and the rewrite rules are not working properly.
  # For example if your site is at http://example.com/drupal uncomment and
  # modify the following line:
  # RewriteBase /drupal
  #
  # If your site is running in a VirtualDocumentRoot at http://example.com/,
  # uncomment the following line:
  # RewriteBase /

  # Rewrite URLs of the form 'index.php?q=x'.
  RewriteCond %{REQUEST_FILENAME} !-f
  RewriteCond %{REQUEST_FILENAME} !-d
  RewriteRule ^(.*)$ index.php?q=$1 [L,QSA]
</IfModule>

# $Id: .htaccess,v 1.90 2007/10/05 14:43:23 dries Exp $


gracias!

Por adanb

2 de clabLevel



 

firefox
Citar            
MensajeEscrito el 01 Oct 2008 09:43 pm

Por Drakedalfa

812 de clabLevel

8 tutoriales

 

Santa Ana, El Salvador

opera
Citar            
MensajeEscrito el 01 Oct 2008 09:53 pm
Hola AdanB

El problema no es drupal, es Google

Al construir tu sitio web en algun momento Google Bot paso por ahi, encontro el enlace y lo indexo, asi de simple.

La forma sencilla de solucionar tu problema es :

* Verificar que no existan ninguna url en tu contenido que enlace al formato antiguo
* dale una revisada a este articulo sobre SEO y Drupal http://blamcast.net/articles/drupal-seo
* Redirigir las urls malformadas a las finales usando el archivo htaccess : Redirect 301 /paginaantigua.html http://www.ejemplo.com/paginanueva.html para que Google la limpie de su index (este cambio toma el tiempo que a google le de la gana)

Y eso seria, ya nos cuentas como te fue

Saludos

Por CesarS

23 de clabLevel



 

Lima, Perú

firefox
Citar            
MensajeEscrito el 02 Oct 2008 02:06 am
Drake,
Cesar S,

gracias por la información, ya me estoy poniendo a leer ambos artículos. Algo me habían dicho de que pruebe con el robots.txt, pero me pareció un disparate :P

Igualmente, les comento que creo haber sufrido una especie de iluminación y creo que he dado con el origen del problema de manera inexplicable: en el index figuran repetidos algunos vínculos, que casualmente son los que tienen esa url duplicada.
unos están creadosdinámicamente y otros los ingresé a mano en el footer. quiero creer que a eso se debe que sólo esas 8 urls me salen mal y no las 150 del sitio en total.

eso si, sólo me he imaginado la causa, la solución está tardando en llegar.

slds.

Por adanb

2 de clabLevel



 

firefox
Citar            
MensajeEscrito el 09 Oct 2008 11:33 am
Bueno, me colgué un poco en contar como me fue.

Al final lo solucioné gracias a ustedes y a los enlaces que me pasaron. para evitar el contenido duplicado, instalé (bah, descomprimí y habilité en el ADMIN) un módulo que se llama GlobalRedirect, que sencillamente redirecciona todas las URLS sucias hacia su equivalente limpia, en el caso de que exista.
De paso, metí un robots para que los buscadores no me indexen la parte de admin.

muchas gracias amigos y perdón por la demora.

Por adanb

2 de clabLevel



 

firefox

 

Cristalab BabyBlue v4 + V4 © 2011 Cristalab
Powered by ClabEngines v4, HTML5, love and ponies.