Startseite
  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche
Startseite › Forum › Drupalcenter.de › Allgemeines zu Drupal ›

Google indiziert URLs die nach der robots.txt eingentlich verboten sind.

Eingetragen von wflorian (251)
am 05.11.2008 - 09:05 Uhr in
  • Allgemeines zu Drupal
  • Drupal 5.x oder neuer

Hallo.

Google indiziert Seiten die laut der robots.txt eigentlich verboten sind.

Mehrere URLs folgender Form wurden indiziert:

www.XXXXX.de/user/register?destination=comment/reply/XXX%XXXXcomment-form

Laut der robots.txt sind allerdings folgende URLs verboten:

Disallow: /user/register/

Hat jemand eine Idee?

Sollte folgendes in die robots.txt hinzugefügt werden?

Disallow: /user/register?destination=comment/reply/

Danke euch.

Florian

‹ Verständnisfrage zu allow_url_fopen = on Date Field in Datum Symbol/Widget zeigen ›
  • Anmelden oder Registrieren um Kommentare zu schreiben

"Disallow:

Eingetragen von narres (348)
am 05.11.2008 - 09:39 Uhr

"Disallow: /user/register/"
ist ein Unterschied zu
"Disallow: /user/register" (ohne Slash)

In "/user/register?destination=comment/reply/" ist auch kein "/" hinter "/user/register"

Ob sich der Spider aber daran hält?

  • Anmelden oder Registrieren um Kommentare zu schreiben

Du hast Recht! Ich habe

Eingetragen von wflorian (251)
am 05.11.2008 - 10:14 Uhr

Du hast Recht!

Ich habe jetzt mal folgende Zeile in die robots.txt hinzugeschrieben:

Disallow: /user/login?destination=comment/reply/
Disallow: /user/register?destination=comment/reply/

  • Anmelden oder Registrieren um Kommentare zu schreiben

Disallow: /comment/reply/

Eingetragen von asienfreak (20)
am 12.11.2012 - 00:45 Uhr

Hallo Leute,

habe ein ähnliches Problem. Ich habe in der Robots.txt stehen:

Disallow: /comment/reply/

Jetzt sind aber unterseiten wie z.B. /comment/reply/51 in den index gerauscht...normal kann das ja nicht sein?

Anderes Problem:

Eine einfache Seite heisst zum Beispiel kommentar.htm (dort ist der Post zu sehen + Kommentare)
Wenn ich jetzt auf "Antworten" klicke also z.B. auf den Link /comment/reply/51/ leitet die Seite auf kommentar.htm/1 weiter?
Die URL sollte doch aber eigentlich auf /comment/reply/51/ stehen bleiben?!

Edit: Der Fehler mit der falschen Weiterleitung tritt nur im "Admin" Modus auf...wenn man nicht eingelogged ist, dann gehts.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Oder muss man einfach nur

Eingetragen von asienfreak (20)
am 15.11.2012 - 16:08 Uhr

Oder muss man einfach nur schreiben

Disallow: /comment/reply

Also das / weglassen, damit keine comments indexiert werden?

  • Anmelden oder Registrieren um Kommentare zu schreiben

abschließender slash muss sein

Eingetragen von glycid (921)
am 15.11.2012 - 16:58 Uhr

sonst bezieht sich das Verbot nur auf /comment/reply. Wie lange steht denn der Eintrag in der robots.txt schon? Poste doch mal die Domain, dann kann man mal in die Datei gucken. Vllt. liegt der Fehler an allgemeinen Notationen

  • Anmelden oder Registrieren um Kommentare zu schreiben

ist noch nicht fertig ..noch

Eingetragen von asienfreak (20)
am 15.11.2012 - 17:41 Uhr

ist noch nicht fertig ..noch im Aufbau... hier: http://asienrundreise.com

comment/relply/ zu finden unter: http://asienrundreise.com/comment/reply/59/
bei der "site" abfrage bei google nur unter den ausgeblendeten ergebnissen, aber sie sind trotzdem da...

Ehrlich gesagt weiß ich gar nicht wie lange der Befehl in der Robots.txt dort schon steht...wird das nicht standartmäßig von drupal gemacht?

  • Anmelden oder Registrieren um Kommentare zu schreiben

robots.txt ist in Ordnung

Eingetragen von glycid (921)
am 15.11.2012 - 17:48 Uhr

....nur scheint sich G*** nicht mehr dran zu halten. Ich krieg die URL in Google mit dem Hinweis:

Zitat:

Aufgrund der robots.txt dieser Website ist keine Beschreibung für dieses Ergebnis verfügbar. Weitere Informationen

aber sie ist trotzdem indiziert.

Wenn es dir um die Vermeidung von DC geht, kannst ja auch das Canonical Tag verwenden. Andernfalls bleibt nur das noindex- Metatag. Da gibts auch Module für Drupal.

Gruss Glycid

  • Anmelden oder Registrieren um Kommentare zu schreiben

Also an Modulen habe ich nur

Eingetragen von asienfreak (20)
am 15.11.2012 - 18:23 Uhr

Also an Modulen habe ich nur http://drupal.org/project/node_noindex gefunden

Da kann man allerdings nur content-typen auswählen, welche nicht indexiert werden...hm

  • Anmelden oder Registrieren um Kommentare zu schreiben

auch in die robots.txt

Eingetragen von glycid (921)
am 15.11.2012 - 19:08 Uhr

ach ja, stimmt.

Ich hab es schon gesehen, aber nicht selber getestet, dass man auch in die robots.txt eine noindex Anweisung schreiben kann. Füge doch einfach mal die Zeile:
Noindex: /comment/reply/

in die robots.txt ein. Dann mal 1-2 Wochen warten, ob die URL's noch im Suchindex sind.

Wenn das auch nicht funktioniert, kannst du mit mod_rewrite per 301 auf eine gewünschte URL umleiten, vorrausgesetzt, dein Hosting- Produkt erlaubt den Zugriff per .htaccess

siehe auch: http://de.selfhtml.org/servercgi/server/rewrite.htm

  • Anmelden oder Registrieren um Kommentare zu schreiben

Ihr nutzt doch alle Drupal.

Eingetragen von asienfreak (20)
am 15.11.2012 - 20:58 Uhr

Ihr nutzt doch alle Drupal. Ihr gibt mir zwar alle Tipps...aber selbst müsst Ihr es ja auch irgendwie gelöst haben?

Eine Noindex für die Robots.txt setzen? Im Internet steht, man setzt sowas nur page-seitig....aber weiß auch nicht wo ich das in die page einfügen soll.

Habe hier noch was gefunden: http://drupal.org/node/639796 und http://drupal.stackexchange.com/questions/18299/how-to-noindex-comment-r...

Da blickt man aber auch nicht durch - jeder will das irgendwie wissen - aber zu einem Ergebnis kommt keiner.

@301 Weiterleitung

Darüber habe ich auch schon nachgedacht - dies ginge zumindest erstmal, um den vorhandenen DC zu entfernen - das hindert aber google nicht daran, die neuen Comments in seinen index zu schmeissen - zumal man für die 301 weiterleitung ja auch google wieder erlauben muss die comment/reply/ offiziell zu spidern. (das heisst das disallow comment/reply/ wieder aus der Robots.txt entfernen.)

hmmm

  • Anmelden oder Registrieren um Kommentare zu schreiben

Du hast kein wirkliches DC Problem

Eingetragen von glycid (921)
am 16.11.2012 - 00:05 Uhr
asienfreak schrieb

Eine Noindex für die Robots.txt setzen? Im Internet steht, man setzt sowas nur page-seitig....aber weiß auch nicht wo ich das in die page einfügen soll.

Da bist du wohl einseitig informiert. Guck mal hier zum Beispiel

asienfreak schrieb

Ihr nutzt doch alle Drupal. Ihr gibt mir zwar alle Tipps...aber selbst müsst Ihr es ja auch irgendwie gelöst haben?

Komm, jetzt bleib mal locker! Das Disallow in der robots.txt reicht völlig aus. Ein Canonical Tag würde ebenfalls ausreichen. Google hat zwar die URL indiziert, weil sie der Meinung sind, da könnte eventuell was relevantes für bestimmte Suchanfragen stehen. Das ist aber auch schon alles. Sie zeigen keine Description aufgrund des Disallow in der robots.txt. Folglich auch kein DC! Du schiebst absolute SEO Anfänger Panik wegen einzelner Kommentare auf ner anderen URL. Ich bin jetzt seit acht Jahren SEO und arbeite seit 2006 mit Drupal. Probleme mit Google hatte ich bislang absolut bei keinem Drupal Projekt. Ernsthaften DC gibts bei deinem Projekt nicht, soweit ich gesehen habe. Also entspann dich und kümmere dich um die wichtigen Dinge wie solide Backlinks, positive Nutzererfahrung durch hochwertige Inhalte, Social Media Buzz etc. Dann klappts auch mit den Rankings.

Gruss Glycid

  • Anmelden oder Registrieren um Kommentare zu schreiben

Alles klar Glycid,eigentlich

Eingetragen von asienfreak (20)
am 16.11.2012 - 03:13 Uhr

Alles klar Glycid,

eigentlich haste ja Recht - die robots.txt weist google ja an, dass er den Rotz nicht erlauben soll - nur die URL wird indiziert - der Content nicht - finde trotzdem die Indizierung der links unnötig - habe schon drüber nachgedacht, den antwort-link zu entfernen - das schränkt nur leider die Aktivität der User ein. Ich lasse es einfach erstmal so laufen und kümmere mich mehr um Content und Backlinks :D

Vielen Dank erstmal euch allen für eure Tipps und Tricks.

der Asienfreak :D

  • Anmelden oder Registrieren um Kommentare zu schreiben

Benutzeranmeldung

  • Registrieren
  • Neues Passwort anfordern

Aktive Forenthemen

  • für drupal11 ein Slider Modul
  • [gelöst] W3CSS Paragraphs Views
  • Drupal 11 neu aufsetzen und Bereiche aus 10 importieren
  • Wie erlaubt man neuen Benutzern auf die Resetseite zugreifen zu dürfen.
  • [gelöst] Anzeigeformat Text mit Bild in einem Artikel, Drupal 11
  • Social Media Buttons um Insteragram erweitern
  • Nach Installation der neuesten D10-Version kein Zugriff auf Website
  • Composer nach Umzug
  • [gelöst] Taxonomie Begriffe zeigt nicht alle Nodes an
  • Drupal 11 + Experience Builder (Canvas) + Layout Builder
  • Welche KI verwendet ihr?
  • Update Manger läst sich nicht Installieren
Weiter

Neue Kommentare

  • melde mich mal wieder, da ich
    vor 1 Woche 6 Tagen
  • Hey danke
    vor 2 Wochen 16 Stunden
  • Update: jetzt gibt's ein
    vor 2 Wochen 1 Tag
  • Hallo, im Prinzip habe ich
    vor 2 Wochen 5 Tagen
  • Da scheint die Terminologie
    vor 2 Wochen 5 Tagen
  • Kannst doch auch alles direkt
    vor 3 Wochen 3 Tagen
  • In der entsprechenden View
    vor 3 Wochen 3 Tagen
  • Dazu müsstest Du vermutlich
    vor 3 Wochen 3 Tagen
  • gelöst
    vor 5 Wochen 6 Tagen
  • Ja natürlich. Dass ist etwas,
    vor 6 Wochen 16 Stunden

Statistik

Beiträge im Forum: 250233
Registrierte User: 20451

Neue User:

  • ByteScrapers
  • Mroppoofpaync
  • 4aficiona2

» Alle User anzeigen

User nach Punkten sortiert:
wla9461
stBorchert6003
quiptime4972
Tobias Bähr4019
bv3924
ronald3857
md3717
Thoor3678
Alexander Langer3416
Exterior2903
» User nach Punkten
Zur Zeit sind 0 User und 18 Gäste online.

Hauptmenü

  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche

Quicklinks I

  • Infos
  • Drupal Showcase
  • Installation
  • Update
  • Forum
  • Team
  • Verhaltensregeln

Quicklinks II

  • Drupal Jobs
  • FAQ
  • Drupal-Kochbuch
  • Best Practice - Drupal Sites - Guidelines
  • Drupal How To's

Quicklinks III

  • Tipps & Tricks
  • Drupal Theme System
  • Theme Handbuch
  • Leitfaden zur Entwicklung von Modulen

RSS & Twitter

  • Drupal Planet deutsch
  • RSS Feed News
  • RSS Feed Planet
  • Twitter Drupalcenter
Drupalcenter Team | Impressum & Datenschutz | Kontakt
Angetrieben von Drupal | Drupal is a registered trademark of Dries Buytaert.
Drupal Initiative - Drupal Association