Startseite
  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche
Startseite › Forum › Drupalcenter.de › Allgemeines zu Drupal ›

[gelöst] MS Word Import

Eingetragen von Fekete777 (34)
am 16.08.2011 - 12:10 Uhr in
  • Allgemeines zu Drupal
  • Drupal 7.x oder neuer

Hi!

Ich würde gerne wissen, ob es durch irgendwelche Tools bzw. Module möglich ist aus Microsoft Word Dokumenten, Nodes zu erstellen, um nicht auf die Möglichkeit von Copy&Paste zurückgreifen zu müssen, da ich über 2000 Dateien besitze.
Die Word-Dokumente sollen in Beiträge (Artikel) umgewandelt werden, nicht an Beiträge verknüpft werden.
Es wäre auch nicht schlecht, wenn besagtes Tool gleichzeitig auch kategorisieren könnte, ist aber nicht ein muss.

Hoffe auf baldige Antwort :)

MFG
Fekete777

‹ Abstand zwischen den Blöcken E-Mails nach Registrierung werden nicht versendet ›
  • Anmelden oder Registrieren um Kommentare zu schreiben

hi fekete die idee dazu gabe

Eingetragen von 1kubik (903)
am 16.08.2011 - 12:27 Uhr

hi fekete

die idee dazu gabe wohl schonmal
http://drupal.org/node/236461
wurde aber nicht umgesezt

interesant ist vielleicht dieser kommentar dazu:

Zitat:

MS Word html is so ugly that even HTML tidy can't completely do the job, though. You probably need to do some clean up before HTML Tidy will wor

aber als pdf scheint das irgenwie zu gehen
als import in drupal als book

http://mapaspects.org/article/converting-word-doc-and-pdf-drupal-book-we...

gruss
stef

  • Anmelden oder Registrieren um Kommentare zu schreiben

Danke, ich werde mir mal

Eingetragen von Fekete777 (34)
am 16.08.2011 - 12:40 Uhr

Danke, ich werde mir mal anschauen was es da genau auf sich hat. :)

Noch eine weitere frage zu diesem thema: wo und als was genau (dateityp?) werden nodes für drupal gespeichert, eventuell kann ich ja selbst ein programm schreiben zum automatischen umwandeln und hochladen von nodes..

  • Anmelden oder Registrieren um Kommentare zu schreiben

da hilft dir die drupal api

Eingetragen von 1kubik (903)
am 16.08.2011 - 13:22 Uhr

da hilft dir die drupal api weiter

drupal 6
http://api.drupal.org/api/drupal/includes--database.inc/group/database/6

und drupal 7

http://api.drupal.org/api/drupal/includes--database--database.inc/group/...

dort findest du alles was du brauchst
um in die datenbank zu schreiben

viel erfolg
stef

  • Anmelden oder Registrieren um Kommentare zu schreiben

Import-Module

Eingetragen von Frank Ralf (2135)
am 17.08.2011 - 12:12 Uhr

Es gibt eine Menge leistungsfähiger Import-Module für Drupal. Vielleicht kannst du deine Word-Dokumente in etwas Textbasiertes umwandeln und dann importieren. Schau mal unter Comparison of Content and User Import and Export Modules.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Oke werd ich mir mal

Eingetragen von Fekete777 (34)
am 17.08.2011 - 11:06 Uhr

Oke werd ich mir mal ansehen...
Meine Aufgabe ist allerdings, eine Möglichkeit zu finden, Beiträge aus dem Intranet in das Drupal CMS zu übertragen. Dies soll möglichst automatisch geschehen, da es ja schon wie gesagt bis zu 2 oder 3000 Beiträge sein können.
Diese Beiträge werden als HTML-Datei und als Word-Dokumente gespeichert und ich hab mir gedacht es wäre sicher einfacher aus einem Word-Dokument auszulesen und einen Node in Drupal einzufügen als eine HTML-Datei durchzugehen.

Bin ich richtig mit der Annahme, dass Beiträge bzw. Artikel in einer Datenbank gespeichert werden, also nicht als xml-File?

  • Anmelden oder Registrieren um Kommentare zu schreiben

Feed API

Eingetragen von Frank Ralf (2135)
am 17.08.2011 - 12:10 Uhr
Fekete777 schrieb

Meine Aufgabe ist allerdings, eine Möglichkeit zu finden, Beiträge aus dem Intranet in das Drupal CMS zu übertragen. Dies soll möglichst automatisch geschehen, da es ja schon wie gesagt bis zu 2 oder 3000 Beiträge sein können.
Diese Beiträge werden als HTML-Datei und als Word-Dokumente gespeichert und ich hab mir gedacht es wäre sicher einfacher aus einem Word-Dokument auszulesen und einen Node in Drupal einzufügen als eine HTML-Datei durchzugehen.

Aha, also laufende Synchronisierung. Warum nicht das Intranet komplett auf Drupal umstellen? Ansonsten hab ich gehört, dass Leute mit der Feed API gute Erfahrungen gemacht haben.

EDIT:
Alt, aber interessant: DocImport API module

Fekete777 schrieb

Bin ich richtig mit der Annahme, dass Beiträge bzw. Artikel in einer Datenbank gespeichert werden, also nicht als xml-File?

Jo, bei Drupal landet alles in der Datenbank. Vielleicht doch mal das eine oder andere Buch aus der http://www.drupalcenter.de/handbuch/buecherecke lesen ;-)

  • Anmelden oder Registrieren um Kommentare zu schreiben

genau die inhalte werden

Eingetragen von 1kubik (903)
am 17.08.2011 - 11:37 Uhr

genau
die inhalte werden nicht in einem xml gespeichert
sondern wie in der api ersichtlich in der
(mysql) tabelle 'node'
hier aber nur zb der titel, der (content) type
der inhalt selber wird in tabellen mit einem
'field_data' präfix gespeichert
für den body also 'field_data_body'

gruss
stef

  • Anmelden oder Registrieren um Kommentare zu schreiben

ich werde mal versuchen feeds

Eingetragen von Fekete777 (34)
am 23.08.2011 - 11:32 Uhr

ich werde mal versuchen feeds in kombination mit xpath parser zu probieren und mal schauen wie es so läuft

mit feeds scheint es zu funktionieren.. ich würde mal sagen gelöst

  • Anmelden oder Registrieren um Kommentare zu schreiben

Lösung bitte skizzieren

Eingetragen von Frank Ralf (2135)
am 23.08.2011 - 12:37 Uhr
Fekete777 schrieb

mit feeds scheint es zu funktionieren.. ich würde mal sagen gelöst

Bitte die Lösung für andere Interessierte mal skizzieren. Vielen Dank!

  • Anmelden oder Registrieren um Kommentare zu schreiben

also für mich ist die lösung

Eingetragen von Fekete777 (34)
am 23.08.2011 - 13:35 Uhr

also für mich ist die lösung folgende:

zuerst wandle ich die word-dokumente in xml-dokumente um mit titel und body, eventuell noch andere tags, wie man es halt braucht

anschließend lade ich auf einen public oder private ordner rauf

die xml-dateien werden dann mithilfe von "Feeds Directory Fetcher" und "Feeds XPath Parser" geholt

probleme hatte ich bis jetzt nur bei der richtigen uri für das verzeichnis

tja das wars auch schon

  • Anmelden oder Registrieren um Kommentare zu schreiben

super sache! +1

Eingetragen von 1kubik (903)
am 23.08.2011 - 14:16 Uhr

super sache! +1

  • Anmelden oder Registrieren um Kommentare zu schreiben

Word in XML umwandeln

Eingetragen von Frank Ralf (2135)
am 23.08.2011 - 20:06 Uhr

Vielen Dank für die Anleitung!

Eine Frage hätte ich noch:

Machst du die XML-Umwandlung mit Word-Bordmitteln? Oder nutzt du direkt das neue XML-basierte DOCX-Format?

  • Anmelden oder Registrieren um Kommentare zu schreiben

Das hab ich noch nicht

Eingetragen von Fekete777 (34)
am 24.08.2011 - 08:07 Uhr

Das hab ich noch nicht entschieden, aber ich glaube ich werde versuchen, dass ganze automatisiert mit Visual Basic zu machen, da es mit Word basierten Mitteln zu lange dauern würde.

Ich habe aber noch keinen Weg gefunden, wie ich den Body vom XML formatieren soll, da der XML-Parser nicht erkennt, dass innerhalb des -tags HTML-tags, jedenfalls denke ich es mir so, da sobald ein HTML-tag im -tag vorkommt, der Inhalt vom Beitrag einfach leer gelassen wird.

  • Anmelden oder Registrieren um Kommentare zu schreiben

HTML innnerhalb von XML

Eingetragen von Frank Ralf (2135)
am 24.08.2011 - 08:25 Uhr
Fekete777 schrieb

Ich habe aber noch keinen Weg gefunden, wie ich den Body vom XML formatieren soll, da der XML-Parser nicht erkennt, dass innerhalb des -tags HTML-tags, jedenfalls denke ich es mir so, da sobald ein HTML-tag im -tag vorkommt, der Inhalt vom Beitrag einfach leer gelassen wird.

HTML innerhalb von XML ist immer etwas kniffelig. Du könntest den ganzen Inhalt in <![CDATA[ ... ]]>-Tags packen.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Nice, danke. :) Nun werde ich

Eingetragen von Fekete777 (34)
am 24.08.2011 - 08:36 Uhr

Nice, danke. :)

Nun werde ich mal schauen, wie ich das ganze in VB umsetze :)

  • Anmelden oder Registrieren um Kommentare zu schreiben

XML mit Visual Basic

Eingetragen von Frank Ralf (2135)
am 24.08.2011 - 09:08 Uhr

Nur mal auf die Schnelle gegoogelt:

  • XML in Visual Basic
  • XML-Dateien lesen und schreiben mit VB.NET

Und hier noch ein Link auf das nie richtig in die Gänge gekommene Word-Import-Modul: Microsoft Word resources, das inzwischen auf http://drupal.org/project/querypath verweist.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Benutzeranmeldung

  • Registrieren
  • Neues Passwort anfordern

Aktive Forenthemen

  • Drupal CMS installieren
  • [erledigt]MP3 in Drupal 10 einbinden
  • (gelöst)Drupal 11 installieren
  • Titel ausblenden
  • Ich brauche dringen Hilfe zu Updates oder ggf. wwie geht Composer?
  • Dynamische Ansicht von Seiteninhalt (als Tabelle?)
  • Vergabe von Berechtigungen für bestimmte Rollen; mir fehlt der Haken bzw. das „Veröffentlicht“
  • Medien und andere Daten mit Feeds von Drupal 7 auf Drupal 10 migrieren
  • Rolle erstellen nicht zu finden
  • für drupal11 ein Slider Modul
  • [gelöst] W3CSS Paragraphs Views
  • Drupal 11 neu aufsetzen und Bereiche aus 10 importieren
Weiter

Neue Kommentare

  • Verwende doch das Tag dafür,
    vor 4 Tagen 3 Minuten
  • Guckst du hier: step by step
    vor 3 Tagen 13 Stunden
  • Guckst du hier: step by step
    vor 3 Tagen 13 Stunden
  • Ich habe ja keine Angst vor
    vor 1 Woche 5 Tagen
  • Ist grundsätzlichmachbar – aber nichts für „einfach mal schnell“
    vor 2 Wochen 1 Tag
  • Vielen Dank erst einmal, aber
    vor 2 Wochen 2 Tagen
  • Du hast die "Trusted host
    vor 2 Wochen 3 Tagen
  • Bitte genauer den aktuellen Lösungs-Ansatz beschreiben
    vor 4 Wochen 2 Tagen
  • Git und rsync sind die wichtigsten Werkzeuge
    vor 4 Wochen 5 Tagen
  • Arrrrg. Nix Tabelle :-D /*
    vor 9 Wochen 21 Stunden

Statistik

Beiträge im Forum: 250284
Registrierte User: 20498

Neue User:

  • Inga GuAph
  • Robertolix
  • DavidBit

» Alle User anzeigen

User nach Punkten sortiert:
wla9464
stBorchert6003
quiptime4972
Tobias Bähr4019
bv3924
ronald3857
md3717
Thoor3678
Alexander Langer3416
Exterior2903
» User nach Punkten
Zur Zeit sind 0 User und 61 Gäste online.

Hauptmenü

  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche

Quicklinks I

  • Infos
  • Drupal Showcase
  • Installation
  • Update
  • Forum
  • Team
  • Verhaltensregeln

Quicklinks II

  • Drupal Jobs
  • FAQ
  • Drupal-Kochbuch
  • Best Practice - Drupal Sites - Guidelines
  • Drupal How To's

Quicklinks III

  • Tipps & Tricks
  • Drupal Theme System
  • Theme Handbuch
  • Leitfaden zur Entwicklung von Modulen

RSS & Twitter

  • Drupal Planet deutsch
  • RSS Feed News
  • RSS Feed Planet
  • Twitter Drupalcenter
Drupalcenter Team | Impressum & Datenschutz | Kontakt
Angetrieben von Drupal | Drupal is a registered trademark of Dries Buytaert.
Drupal Initiative - Drupal Association