Startseite
  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche
Startseite › Forum › Drupalcenter.de › Module ›

herausfiltern ähnlicher Beiträge durch Wörtertvergleich

Eingetragen von Helge (404)
am 03.12.2015 - 20:35 Uhr in
  • Module
  • Drupal 7.x oder neuer

Hallo zusammen,

jeder der eine Drupal-Community betreibt kennt das sicher,
da werden Artikel eingestellt ohne vorher genau nachzuschauen, ob es bereits einen ähnlichen Artikel im System gibt.

Um die Artikel voneinander zu unterscheiden hat man wohl die Tags erfunden, doch diese werden von Nutzern kaum ausgefüllt uns sind somit relativ nutzlos für Filterungen ähnlicher Inhalte.

Nun meine Frage an Euch,
Gibt es neue Wege oder Modelle, Redundanzen herauszufiltern?

Vielleicht über das filtern und vergleichen von Wörtern oder so.

Wäre sicher auch für dieses Forum interessant.

Herzlichst
Helge

‹ [GELÖST] Poll Modul im Recent Topics anzeigen? User Profile als Nodes mit Profile2 ›
  • Anmelden oder Registrieren um Kommentare zu schreiben

das ist ein dickes Brett

Eingetragen von ronald (3845)
am 04.12.2015 - 09:22 Uhr

so etwas müsste im Hintergrund und per cron laufen.
Ohne einen menschlichen Redakteur wird es aber auch dann nicht machbar sein.

Natürlich kannst die Fließtexte mit einem cron job verschlagworten lassen.
Die Schlagworthäufung kannst du noch darstellen. Ob es sich um die gleiche Thematik handelt, kann nur ein menschlicher Redakteur feststellen.

Ich hatte vor etwa 30 Jahren so ein Projekt, wo es um die Verschlagwortung von Fließtexten gind.
Das ist eine heftige Angelegenheit, und lässt deine Schlagwortdatenbank explossionsartig anwachsen.

Ohne laufende Pflege wird das zu einem großen Schrotthaufen.

Grüße
Ronald

  • Anmelden oder Registrieren um Kommentare zu schreiben

automatische Verschlagwortung

Eingetragen von Helge (404)
am 04.12.2015 - 13:17 Uhr

Hallo Ronald,

welche modernen Möglichkeiten der automatischen Verschlagwortung gibt es denn heutzutage?

Mit einer guten umfangreichen Vokabularliste könnte man ja evtl. Wortvergleiche anstellen und dann bei Übereinstimmung automatisch verschlagworten.
Aber woher bekommt man eine solche deutsche Vokabularliste und wie hält man die noch performant in der DB?

Herzlichst
Helge

  • Anmelden oder Registrieren um Kommentare zu schreiben

eine solche Liste musst du dir schon im Kontext deiner Umgebung

Eingetragen von ronald (3845)
am 04.12.2015 - 14:42 Uhr

anlegen.

Das ist nicht so einfach.

Die Software von damals machte foldgendes:

Jedes Wort wurde auf bestimmte Grundmerkmale geprüft:
1. Mindestlänge
2. Maximallänge
3. in Ausschlußliste

Und dann, ob es dieses Wort schon in der DB gibt, wenn ja, wird nur eine Verknüpfung zum aktuellen Dateinamen hergestellt, wenn nein, wird es mit einer solchen Verknüpfung angelegt.

Am Ende hast du eine Datenbank, die Schlagworte mit Verknüpfungen auf die originalen Texte enthalten.
Dies kannst du dann zählen.

Die Datenbank selbst ist relativ einfach strukturiert, enthält jedoch sehr viele Einträge.
Mit einem Index auf dem Schlüsselbegriff ist der Zugriff sehr schnell.
Dafür ist auch mySQL gut geeignet.

Dennoch kannst du lediglich feststellen dass es bei bestimmten Dokumenten bestimmte Schlagworte gibt.

Diese Dokumente dann zu beurteilen, braucht es einen fähigen Redakteur, der die entsprechenden Abfragen in die Datenbank vornimmt, und die Einträge inhaltlich vergleicht.

Grüße
Ronald

  • Anmelden oder Registrieren um Kommentare zu schreiben

Modul AutoTag

Eingetragen von Helge (404)
am 04.12.2015 - 15:32 Uhr

Aber so ähnlich macht es doch das Modul AutoTag doch auch, oder?

Weiß halt nicht wie gut das funktioniert.

  • Anmelden oder Registrieren um Kommentare zu schreiben

probier es aus

Eingetragen von ronald (3845)
am 04.12.2015 - 15:42 Uhr

es kann dir vielleicht dabei helfen.

Von der Beschreibung her passt es da rein.
Der Rest ist Organisation.

Ohne den Faktor Mensch geht es wahrscheinlich nicht.

Grüße
Ronald

  • Anmelden oder Registrieren um Kommentare zu schreiben

vielleicht sollte ich mal

Eingetragen von Helge (404)
am 04.12.2015 - 16:31 Uhr

vielleicht sollte ich mal gezielt nach diesem Modul in einem neuen Thread nachfragen
wer da Erfahrungen mit gesammelt hat?!

  • Anmelden oder Registrieren um Kommentare zu schreiben

Benutzeranmeldung

  • Registrieren
  • Neues Passwort anfordern

Aktive Forenthemen

  • Grundsatzfrage
  • Drupal 9 Hosting
  • Seite auf Xamp wird nicht geladen
  • Anregung für die Installation von Drupal
  • [simplenews_stats] [D10] Keine Öffnungen/Ansichten der Newsletter werden gezählt
  • Theme Olivero - Rand entfernen?
  • Olivero veraendern
  • Upgrade Drupal 9 auf 10
  • Matomo(?) in Seite, aber Deinstalliert!
  • Upgrade Drupal 7 auf Drupal 9 / Inhalt erstellen zeigt nur Fehler an
  • Fehlermeldung nach Update auf Drupal 10
  • Wie Button erstellen?
Weiter

Neue Kommentare

  • Grundsatzfrage
    vor 2 Stunden 31 Minuten
  • Schlichte Antwort: Ja, das
    vor 3 Stunden 55 Minuten
  • Hallo! Welchen Host nutzt du
    vor 1 Tag 8 Stunden
  • Also bei mir funktioniert es
    vor 1 Tag 9 Stunden
  • Hat mir auch sehr geholfen,
    vor 1 Tag 9 Stunden
  • Releases Stand 20-9-2023
    vor 2 Tagen 17 Stunden
  • Hi, Das ist leider nicht das
    vor 3 Tagen 12 Stunden
  • Wie plötzlich passierte
    vor 4 Tagen 16 Stunden
  • Sowas geht immer mit
    vor 6 Tagen 15 Stunden
  • vielen Dank fuer Deine Tipps.
    vor 6 Tagen 21 Stunden

Statistik

Beiträge im Forum: 248811
Registrierte User: 19835

Neue User:

  • inklusion
  • sofortnovo
  • MacLeod1639

» Alle User anzeigen

User nach Punkten sortiert:
wla9334
stBorchert6003
quiptime4972
Tobias Bähr4019
bv3924
ronald3845
md3717
Thoor3678
Alexander Langer3416
Exterior2903
» User nach Punkten
Zur Zeit sind 0 User und 6 Gäste online.

Hauptmenü

  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche

Quicklinks I

  • Infos
  • Drupal Showcase
  • Installation
  • Update
  • Forum
  • Team
  • Verhaltensregeln

Quicklinks II

  • Drupal Jobs
  • FAQ
  • Drupal-Kochbuch
  • Best Practice - Drupal Sites - Guidelines
  • Drupal How To's

Quicklinks III

  • Tipps & Tricks
  • Drupal Theme System
  • Theme Handbuch
  • Leitfaden zur Entwicklung von Modulen

RSS & Twitter

  • Drupal Planet deutsch
  • RSS Feed News
  • RSS Feed Planet
  • Twitter Drupalcenter
Drupalcenter Team | Impressum & Datenschutz | Kontakt
Angetrieben von Drupal | Drupal is a registered trademark of Dries Buytaert.
Drupal Initiative - Drupal Association