Dublicate Content durch /feed URLs
am 21.06.2008 - 17:07 Uhr in
Hallo,
mir ist mal wieder etwas merkwüriges an meinen Drupalseiten aufgefallen, wozu mich eure Meinung interessieren würde.
Und zwar ist jede Seite unter 3 URLs zu erreichen, nämlich:
- http://www.beispiel.de/beispiel.html
- http://www.beispiel.de/beispiel.html/feed
- http://www.beispiel.de/node/175/feed.
(URL Alias generiert durch Pathauto)
(URL Alias generiert durch Pathauto)
(Original URL mit /feed dahinter)
Die Seiten enthalten alle den gleichen Content, was natürlich sehr schlecht ist.
Ich möchte entweder erreichen, dass alle /feed URLs per 301 Redirect auf das jeweilige Alias umgeleitet werden oder noch besser: Verhindern, dass /feed URLs überhaupt generiert werden und erreichbar sind.
- Anmelden oder Registrieren um Kommentare zu schreiben

Was sind das fuer *.html
am 21.06.2008 - 17:18 Uhr
Was sind das fuer *.html Dateien? Wieso *.html?
-------------
quiptime
Nur tote Fische schwimmen mit dem Strom.
Hallo, durch Pathauto
am 21.06.2008 - 17:26 Uhr
Hallo,
durch Pathauto generiert, auf Kundenwunsch. Deshalb hatte ich darunter geschrieben "Durch Pahauto generierte URLs", in Pathauto mit "[termpath-raw]/[title-raw].html" eingestellt.
Die Feed urls, kannste
am 21.06.2008 - 20:24 Uhr
Die Feed urls, kannste verhindern unter den Pathautoeinstellung bei Beiträge/Nodes -->Interner Feed Alias Text!
Und über node/123 und der dazugehörige Aliasurl brauchste dir kein gedanken drüber machen, wenn doch Webmaster Tools von Google und node urls löschen lassen.
----------------------------------------
Alle Angaben ohne Gewähr!!:D
http://www.tobiasbaehr.de/
Sorry meiner dummen Frage.
am 21.06.2008 - 22:50 Uhr
Sorry meiner dummen Frage. Wer lesen kann ...
-------------
quiptime
Nur tote Fische schwimmen mit dem Strom.
Spartacus schrieb Die Feed
am 22.06.2008 - 14:01 Uhr
Die Feed urls, kannste verhindern unter den Pathautoeinstellung bei Beiträge/Nodes -->Interner Feed Alias Text!
Und über node/123 und der dazugehörige Aliasurl brauchste dir kein gedanken drüber machen, wenn doch Webmaster Tools von Google und node urls löschen lassen.
----------------------------------------
Alle Angaben ohne Gewähr!!:D
http://www.tobiasbaehr.de/
Dass man das Feld für die Feed-URL in Pathauto auch leer lassen kann, ist mir schon klar. Nur sind die Seiten dann leider unter http://www.beispiel.de/node/175/feed anstatt unter http://www.beispiel.de/beispiel.html/feed zusätzlich zu erreichen.
Warum sollte ich mir deiner Meinung nach dazu keine Gedanken machen, wenn meine Seiten über 3 URLs zu erreichen sind? Natürlich kann ich die Seiten händisch aus dem Index entfernen oder in der robots.txt die Indizierung verbieten, aber bei >5000 Unterseiten mache ich mir auch Gedanken über die Ressourcen, wenn da für 5000 Unterseiten mindestens 3 URLs vorhanden sind, wenn es sich um Bilder handelt ja sogar nochmehr, durch ?size=thumbnail?size=thumbnail etc. aber das ist ein anderes Thema. Dann sind das mal eben 15.000 unnötoge URLs, die im System vorhanden sind.
@quiptime: Kein Problem.
der Ausgangspunkt des Übel's ?
am 22.06.2008 - 14:13 Uhr
Ich will mal nachhaken weil ich Eines noch nicht kapiere.
# http://www.beispiel.de/node/175/feed.
(Original URL mit /feed dahinter)
Wie und wo wird diese URL gebildet? Und warum und wozu?
Sie ist ja sinnlos weil damit kein Feed angezeigt wird. Wenn diese URL irgendwo manuell erstellt wird dann schnappt sie sich Pathauto und erzeugt die weitere Sinnlosigkeit
# http://www.beispiel.de/beispiel.html/feed
(URL Alias generiert durch Pathauto)
Also ist aus meiner jetzigen Beurteilung eine URL /node/x/feed der Ausgangspunkt des Übel's.
-------------
quiptime
Nur tote Fische schwimmen mit dem Strom.
quiptime schrieb Ich will
am 22.06.2008 - 14:53 Uhr
Ich will mal nachhaken weil ich Eines noch nicht kapiere.
# http://www.beispiel.de/node/175/feed.
(Original URL mit /feed dahinter)
Wie und wo wird diese URL gebildet? Und warum und wozu?
Sie ist ja sinnlos weil damit kein Feed angezeigt wird. Wenn diese URL irgendwo manuell erstellt wird dann schnappt sie sich Pathauto und erzeugt die weitere Sinnlosigkeit
# http://www.beispiel.de/beispiel.html/feed
(URL Alias generiert durch Pathauto)
Also ist aus meiner jetzigen Beurteilung eine URL /node/x/feed der Ausgangspunkt des Übel's.
-------------
quiptime
Nur tote Fische schwimmen mit dem Strom.
Danke für deine Bemühungen.
Habe noch einmal rumprobiert:
Meine Nodes sind dann über http://www.beispiel.de/node/175/feed zu erreichen, wenn in Pathauto das Feld, wo ich die URL für die Feeds definiere, leer lasse. Diese URL wird also gebildet ohne, dass ich dies bewusst beeinflusst habe, sie ist einfach vorhanden. Es erfolgt dann auch keine Umleitung o.ä. Würde nur http://www.beispiel.de/node/175 aufgerufen werden, dann greift der Redirect und man wird auf die Seite http://www.beispiel.de/beispiel.html umgeleitet. Genau hier liegt das Problem, wie du schon geschrieben hattest, da ich auch nicht verstehe, warum es diese URL überhaupt gibt.
Da hat wohl der Modulentwickler nicht zu Ende gedacht.
am 22.06.2008 - 14:58 Uhr
Diese URL wird also gebildet ohne, dass ich dies bewusst beeinflusst habe, sie ist einfach vorhanden.
Da hat wohl der Modulentwickler nicht zu Ende gedacht.
Na dann kann man in Pathauto entweder die Zusammenstellung einer URL themen oder es ist ein beschissener Bug.
Sehe doch am im Modul nach den Theme Funktionen. Eventuell kommt man ja an die URL Generierung ran.
-------------
quiptime
Nur tote Fische schwimmen mit dem Strom.
Komisch, da bei mir erst ein
am 22.06.2008 - 15:41 Uhr
Komisch, da bei mir erst ein node/123/feed erstellt wird, wenn ich was drin habe!
----------------------------------------
Alle Angaben ohne Gewähr!!:D
http://www.tobiasbaehr.de/
Spartacus schriebKomisch,
am 22.06.2008 - 17:41 Uhr
Komisch, da bei mir erst ein node/123/feed erstellt wird, wenn ich was drin habe!
Und auf die Node ID hast Du einen Feed? Oder hast Du mit dieser URL die normale Nodeanzeige?
-------------
quiptime
Nur tote Fische schwimmen mit dem Strom.
Nein, ganz normale
am 22.06.2008 - 18:56 Uhr
Nein, ganz normale Nodeansicht, kein Feed vorhanden.
Aber für was dies da ist, frag ich mich auch. vllt muss man ein anders Modul noch installieren.
----------------------------------------
Alle Angaben ohne Gewähr!!:D
http://www.tobiasbaehr.de/
Neues Dev-Pathauto-Modul: Besserung?
am 22.06.2008 - 21:38 Uhr
Das ist mir auch schon aufgefallen. Extrem ärgerliche Sache.
Vielleicht aber bringt das brandaktuelle DEV-Pathauto-Modul (VON HEUTE, 22. Juni 2008) eine Besserung?
Siehe: http://drupal.org/project/pathauto
Hi, danke für den Hinweis,
am 25.06.2008 - 15:20 Uhr
Hi,
danke für den Hinweis, werde es morgen mal testen und hier berichten.
sickstylez
am 25.06.2008 - 16:12 Uhr
Hallo,
mir ist mal wieder etwas merkwüriges an meinen Drupalseiten aufgefallen, wozu mich eure Meinung interessieren würde.
Und zwar ist jede Seite unter 3 URLs zu erreichen, nämlich:
(URL Alias generiert durch Pathauto)
(URL Alias generiert durch Pathauto)
(Original URL mit /feed dahinter)
Die Seiten enthalten alle den gleichen Content, was natürlich sehr schlecht ist.
Ich möchte entweder erreichen, dass alle /feed URLs per 301 Redirect auf das jeweilige Alias umgeleitet werden oder noch besser: Verhindern, dass /feed URLs überhaupt generiert werden und erreichbar sind.
Das Problem mit 'duplicate content' kannst du mit diesem Modul lösen.
http://drupal.org/project/globalredirect
vg
--
md - DrupalCenter
mdwp* :: Drupal Services