Startseite
  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche
Startseite › Forum › Drupalcenter.de › Module ›

herausfiltern ähnlicher Beiträge durch Wörtertvergleich

Eingetragen von Helge (404)
am 03.12.2015 - 20:35 Uhr in
  • Module
  • Drupal 7.x oder neuer

Hallo zusammen,

jeder der eine Drupal-Community betreibt kennt das sicher,
da werden Artikel eingestellt ohne vorher genau nachzuschauen, ob es bereits einen ähnlichen Artikel im System gibt.

Um die Artikel voneinander zu unterscheiden hat man wohl die Tags erfunden, doch diese werden von Nutzern kaum ausgefüllt uns sind somit relativ nutzlos für Filterungen ähnlicher Inhalte.

Nun meine Frage an Euch,
Gibt es neue Wege oder Modelle, Redundanzen herauszufiltern?

Vielleicht über das filtern und vergleichen von Wörtern oder so.

Wäre sicher auch für dieses Forum interessant.

Herzlichst
Helge

‹ [GELÖST] Poll Modul im Recent Topics anzeigen? User Profile als Nodes mit Profile2 ›
  • Anmelden oder Registrieren um Kommentare zu schreiben

das ist ein dickes Brett

Eingetragen von ronald (3857)
am 04.12.2015 - 09:22 Uhr

so etwas müsste im Hintergrund und per cron laufen.
Ohne einen menschlichen Redakteur wird es aber auch dann nicht machbar sein.

Natürlich kannst die Fließtexte mit einem cron job verschlagworten lassen.
Die Schlagworthäufung kannst du noch darstellen. Ob es sich um die gleiche Thematik handelt, kann nur ein menschlicher Redakteur feststellen.

Ich hatte vor etwa 30 Jahren so ein Projekt, wo es um die Verschlagwortung von Fließtexten gind.
Das ist eine heftige Angelegenheit, und lässt deine Schlagwortdatenbank explossionsartig anwachsen.

Ohne laufende Pflege wird das zu einem großen Schrotthaufen.

  • Anmelden oder Registrieren um Kommentare zu schreiben

automatische Verschlagwortung

Eingetragen von Helge (404)
am 04.12.2015 - 13:17 Uhr

Hallo Ronald,

welche modernen Möglichkeiten der automatischen Verschlagwortung gibt es denn heutzutage?

Mit einer guten umfangreichen Vokabularliste könnte man ja evtl. Wortvergleiche anstellen und dann bei Übereinstimmung automatisch verschlagworten.
Aber woher bekommt man eine solche deutsche Vokabularliste und wie hält man die noch performant in der DB?

Herzlichst
Helge

  • Anmelden oder Registrieren um Kommentare zu schreiben

eine solche Liste musst du dir schon im Kontext deiner Umgebung

Eingetragen von ronald (3857)
am 04.12.2015 - 14:42 Uhr

anlegen.

Das ist nicht so einfach.

Die Software von damals machte foldgendes:

Jedes Wort wurde auf bestimmte Grundmerkmale geprüft:
1. Mindestlänge
2. Maximallänge
3. in Ausschlußliste

Und dann, ob es dieses Wort schon in der DB gibt, wenn ja, wird nur eine Verknüpfung zum aktuellen Dateinamen hergestellt, wenn nein, wird es mit einer solchen Verknüpfung angelegt.

Am Ende hast du eine Datenbank, die Schlagworte mit Verknüpfungen auf die originalen Texte enthalten.
Dies kannst du dann zählen.

Die Datenbank selbst ist relativ einfach strukturiert, enthält jedoch sehr viele Einträge.
Mit einem Index auf dem Schlüsselbegriff ist der Zugriff sehr schnell.
Dafür ist auch mySQL gut geeignet.

Dennoch kannst du lediglich feststellen dass es bei bestimmten Dokumenten bestimmte Schlagworte gibt.

Diese Dokumente dann zu beurteilen, braucht es einen fähigen Redakteur, der die entsprechenden Abfragen in die Datenbank vornimmt, und die Einträge inhaltlich vergleicht.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Modul AutoTag

Eingetragen von Helge (404)
am 04.12.2015 - 15:32 Uhr

Aber so ähnlich macht es doch das Modul AutoTag doch auch, oder?

Weiß halt nicht wie gut das funktioniert.

  • Anmelden oder Registrieren um Kommentare zu schreiben

probier es aus

Eingetragen von ronald (3857)
am 04.12.2015 - 15:42 Uhr

es kann dir vielleicht dabei helfen.

Von der Beschreibung her passt es da rein.
Der Rest ist Organisation.

Ohne den Faktor Mensch geht es wahrscheinlich nicht.

  • Anmelden oder Registrieren um Kommentare zu schreiben

vielleicht sollte ich mal

Eingetragen von Helge (404)
am 04.12.2015 - 16:31 Uhr

vielleicht sollte ich mal gezielt nach diesem Modul in einem neuen Thread nachfragen
wer da Erfahrungen mit gesammelt hat?!

  • Anmelden oder Registrieren um Kommentare zu schreiben

Benutzeranmeldung

  • Registrieren
  • Neues Passwort anfordern

Aktive Forenthemen

  • Halla los mejores refugios burbuja en Madrid, Andalucia y la costa catalana
  • Drupal CMS installieren
  • [erledigt]MP3 in Drupal 10 einbinden
  • (gelöst)Drupal 11 installieren
  • Titel ausblenden
  • Ich brauche dringen Hilfe zu Updates oder ggf. wwie geht Composer?
  • Dynamische Ansicht von Seiteninhalt (als Tabelle?)
  • Vergabe von Berechtigungen für bestimmte Rollen; mir fehlt der Haken bzw. das „Veröffentlicht“
  • Medien und andere Daten mit Feeds von Drupal 7 auf Drupal 10 migrieren
  • Rolle erstellen nicht zu finden
  • für drupal11 ein Slider Modul
  • [gelöst] W3CSS Paragraphs Views
Weiter

Neue Kommentare

  • Verwende doch das Tag dafür,
    vor 2 Wochen 10 Stunden
  • Guckst du hier: step by step
    vor 1 Woche 6 Tagen
  • Guckst du hier: step by step
    vor 1 Woche 6 Tagen
  • Ich habe ja keine Angst vor
    vor 3 Wochen 2 Tagen
  • Ist grundsätzlichmachbar – aber nichts für „einfach mal schnell“
    vor 3 Wochen 4 Tagen
  • Vielen Dank erst einmal, aber
    vor 3 Wochen 6 Tagen
  • Du hast die "Trusted host
    vor 3 Wochen 6 Tagen
  • Bitte genauer den aktuellen Lösungs-Ansatz beschreiben
    vor 5 Wochen 5 Tagen
  • Git und rsync sind die wichtigsten Werkzeuge
    vor 6 Wochen 2 Tagen
  • Arrrrg. Nix Tabelle :-D /*
    vor 10 Wochen 4 Tagen

Statistik

Beiträge im Forum: 250285
Registrierte User: 20504

Neue User:

  • MonroeScobe
  • Marvinkep
  • RandallFloop

» Alle User anzeigen

User nach Punkten sortiert:
wla9464
stBorchert6003
quiptime4972
Tobias Bähr4019
bv3924
ronald3857
md3717
Thoor3678
Alexander Langer3416
Exterior2903
» User nach Punkten
Zur Zeit sind 0 User und 26 Gäste online.

Hauptmenü

  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche

Quicklinks I

  • Infos
  • Drupal Showcase
  • Installation
  • Update
  • Forum
  • Team
  • Verhaltensregeln

Quicklinks II

  • Drupal Jobs
  • FAQ
  • Drupal-Kochbuch
  • Best Practice - Drupal Sites - Guidelines
  • Drupal How To's

Quicklinks III

  • Tipps & Tricks
  • Drupal Theme System
  • Theme Handbuch
  • Leitfaden zur Entwicklung von Modulen

RSS & Twitter

  • Drupal Planet deutsch
  • RSS Feed News
  • RSS Feed Planet
  • Twitter Drupalcenter
Drupalcenter Team | Impressum & Datenschutz | Kontakt
Angetrieben von Drupal | Drupal is a registered trademark of Dries Buytaert.
Drupal Initiative - Drupal Association