Startseite
  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche
Startseite › Forum › Drupalcenter.de › Module ›

herausfiltern ähnlicher Beiträge durch Wörtertvergleich

Eingetragen von Helge (404)
am 03.12.2015 - 19:35 Uhr in
  • Module
  • Drupal 7.x oder neuer

Hallo zusammen,

jeder der eine Drupal-Community betreibt kennt das sicher,
da werden Artikel eingestellt ohne vorher genau nachzuschauen, ob es bereits einen ähnlichen Artikel im System gibt.

Um die Artikel voneinander zu unterscheiden hat man wohl die Tags erfunden, doch diese werden von Nutzern kaum ausgefüllt uns sind somit relativ nutzlos für Filterungen ähnlicher Inhalte.

Nun meine Frage an Euch,
Gibt es neue Wege oder Modelle, Redundanzen herauszufiltern?

Vielleicht über das filtern und vergleichen von Wörtern oder so.

Wäre sicher auch für dieses Forum interessant.

Herzlichst
Helge

‹ [GELÖST] Poll Modul im Recent Topics anzeigen? User Profile als Nodes mit Profile2 ›
  • Anmelden oder Registrieren um Kommentare zu schreiben

das ist ein dickes Brett

Eingetragen von ronald (3857)
am 04.12.2015 - 08:22 Uhr

so etwas müsste im Hintergrund und per cron laufen.
Ohne einen menschlichen Redakteur wird es aber auch dann nicht machbar sein.

Natürlich kannst die Fließtexte mit einem cron job verschlagworten lassen.
Die Schlagworthäufung kannst du noch darstellen. Ob es sich um die gleiche Thematik handelt, kann nur ein menschlicher Redakteur feststellen.

Ich hatte vor etwa 30 Jahren so ein Projekt, wo es um die Verschlagwortung von Fließtexten gind.
Das ist eine heftige Angelegenheit, und lässt deine Schlagwortdatenbank explossionsartig anwachsen.

Ohne laufende Pflege wird das zu einem großen Schrotthaufen.

  • Anmelden oder Registrieren um Kommentare zu schreiben

automatische Verschlagwortung

Eingetragen von Helge (404)
am 04.12.2015 - 12:17 Uhr

Hallo Ronald,

welche modernen Möglichkeiten der automatischen Verschlagwortung gibt es denn heutzutage?

Mit einer guten umfangreichen Vokabularliste könnte man ja evtl. Wortvergleiche anstellen und dann bei Übereinstimmung automatisch verschlagworten.
Aber woher bekommt man eine solche deutsche Vokabularliste und wie hält man die noch performant in der DB?

Herzlichst
Helge

  • Anmelden oder Registrieren um Kommentare zu schreiben

eine solche Liste musst du dir schon im Kontext deiner Umgebung

Eingetragen von ronald (3857)
am 04.12.2015 - 13:42 Uhr

anlegen.

Das ist nicht so einfach.

Die Software von damals machte foldgendes:

Jedes Wort wurde auf bestimmte Grundmerkmale geprüft:
1. Mindestlänge
2. Maximallänge
3. in Ausschlußliste

Und dann, ob es dieses Wort schon in der DB gibt, wenn ja, wird nur eine Verknüpfung zum aktuellen Dateinamen hergestellt, wenn nein, wird es mit einer solchen Verknüpfung angelegt.

Am Ende hast du eine Datenbank, die Schlagworte mit Verknüpfungen auf die originalen Texte enthalten.
Dies kannst du dann zählen.

Die Datenbank selbst ist relativ einfach strukturiert, enthält jedoch sehr viele Einträge.
Mit einem Index auf dem Schlüsselbegriff ist der Zugriff sehr schnell.
Dafür ist auch mySQL gut geeignet.

Dennoch kannst du lediglich feststellen dass es bei bestimmten Dokumenten bestimmte Schlagworte gibt.

Diese Dokumente dann zu beurteilen, braucht es einen fähigen Redakteur, der die entsprechenden Abfragen in die Datenbank vornimmt, und die Einträge inhaltlich vergleicht.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Modul AutoTag

Eingetragen von Helge (404)
am 04.12.2015 - 14:32 Uhr

Aber so ähnlich macht es doch das Modul AutoTag doch auch, oder?

Weiß halt nicht wie gut das funktioniert.

  • Anmelden oder Registrieren um Kommentare zu schreiben

probier es aus

Eingetragen von ronald (3857)
am 04.12.2015 - 14:42 Uhr

es kann dir vielleicht dabei helfen.

Von der Beschreibung her passt es da rein.
Der Rest ist Organisation.

Ohne den Faktor Mensch geht es wahrscheinlich nicht.

  • Anmelden oder Registrieren um Kommentare zu schreiben

vielleicht sollte ich mal

Eingetragen von Helge (404)
am 04.12.2015 - 15:31 Uhr

vielleicht sollte ich mal gezielt nach diesem Modul in einem neuen Thread nachfragen
wer da Erfahrungen mit gesammelt hat?!

  • Anmelden oder Registrieren um Kommentare zu schreiben

Benutzeranmeldung

  • Registrieren
  • Neues Passwort anfordern

Aktive Forenthemen

  • für drupal11 ein Slider Modul
  • [gelöst] W3CSS Paragraphs Views
  • Drupal 11 neu aufsetzen und Bereiche aus 10 importieren
  • Wie erlaubt man neuen Benutzern auf die Resetseite zugreifen zu dürfen.
  • [gelöst] Anzeigeformat Text mit Bild in einem Artikel, Drupal 11
  • Social Media Buttons um Insteragram erweitern
  • Nach Installation der neuesten D10-Version kein Zugriff auf Website
  • Composer nach Umzug
  • [gelöst] Taxonomie Begriffe zeigt nicht alle Nodes an
  • Drupal 11 + Experience Builder (Canvas) + Layout Builder
  • Welche KI verwendet ihr?
  • Update Manger läst sich nicht Installieren
Weiter

Neue Kommentare

  • melde mich mal wieder, da ich
    vor 3 Tagen 5 Stunden
  • Hey danke
    vor 4 Tagen 14 Minuten
  • Update: jetzt gibt's ein
    vor 4 Tagen 18 Stunden
  • Hallo, im Prinzip habe ich
    vor 1 Woche 2 Tagen
  • Da scheint die Terminologie
    vor 1 Woche 2 Tagen
  • Kannst doch auch alles direkt
    vor 1 Woche 6 Tagen
  • In der entsprechenden View
    vor 1 Woche 6 Tagen
  • Dazu müsstest Du vermutlich
    vor 1 Woche 6 Tagen
  • gelöst
    vor 4 Wochen 3 Tagen
  • Ja natürlich. Dass ist etwas,
    vor 4 Wochen 4 Tagen

Statistik

Beiträge im Forum: 250233
Registrierte User: 20449

Neue User:

  • Mroppoofpaync
  • 4aficiona2
  • AppBuilder

» Alle User anzeigen

User nach Punkten sortiert:
wla9461
stBorchert6003
quiptime4972
Tobias Bähr4019
bv3924
ronald3857
md3717
Thoor3678
Alexander Langer3416
Exterior2903
» User nach Punkten
Zur Zeit sind 0 User und 15 Gäste online.

Hauptmenü

  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche

Quicklinks I

  • Infos
  • Drupal Showcase
  • Installation
  • Update
  • Forum
  • Team
  • Verhaltensregeln

Quicklinks II

  • Drupal Jobs
  • FAQ
  • Drupal-Kochbuch
  • Best Practice - Drupal Sites - Guidelines
  • Drupal How To's

Quicklinks III

  • Tipps & Tricks
  • Drupal Theme System
  • Theme Handbuch
  • Leitfaden zur Entwicklung von Modulen

RSS & Twitter

  • Drupal Planet deutsch
  • RSS Feed News
  • RSS Feed Planet
  • Twitter Drupalcenter
Drupalcenter Team | Impressum & Datenschutz | Kontakt
Angetrieben von Drupal | Drupal is a registered trademark of Dries Buytaert.
Drupal Initiative - Drupal Association