Startseite
  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche
Startseite › Forum › Drupalcenter.de › Allgemeines zu Drupal ›

[gelöst] MS Word Import

Eingetragen von Fekete777 (34)
am 16.08.2011 - 11:10 Uhr in
  • Allgemeines zu Drupal
  • Drupal 7.x oder neuer

Hi!

Ich würde gerne wissen, ob es durch irgendwelche Tools bzw. Module möglich ist aus Microsoft Word Dokumenten, Nodes zu erstellen, um nicht auf die Möglichkeit von Copy&Paste zurückgreifen zu müssen, da ich über 2000 Dateien besitze.
Die Word-Dokumente sollen in Beiträge (Artikel) umgewandelt werden, nicht an Beiträge verknüpft werden.
Es wäre auch nicht schlecht, wenn besagtes Tool gleichzeitig auch kategorisieren könnte, ist aber nicht ein muss.

Hoffe auf baldige Antwort :)

MFG
Fekete777

‹ Abstand zwischen den Blöcken E-Mails nach Registrierung werden nicht versendet ›
  • Anmelden oder Registrieren um Kommentare zu schreiben

hi fekete die idee dazu gabe

Eingetragen von 1kubik (903)
am 16.08.2011 - 11:27 Uhr

hi fekete

die idee dazu gabe wohl schonmal
http://drupal.org/node/236461
wurde aber nicht umgesezt

interesant ist vielleicht dieser kommentar dazu:

Zitat:

MS Word html is so ugly that even HTML tidy can't completely do the job, though. You probably need to do some clean up before HTML Tidy will wor

aber als pdf scheint das irgenwie zu gehen
als import in drupal als book

http://mapaspects.org/article/converting-word-doc-and-pdf-drupal-book-we...

gruss
stef

  • Anmelden oder Registrieren um Kommentare zu schreiben

Danke, ich werde mir mal

Eingetragen von Fekete777 (34)
am 16.08.2011 - 11:40 Uhr

Danke, ich werde mir mal anschauen was es da genau auf sich hat. :)

Noch eine weitere frage zu diesem thema: wo und als was genau (dateityp?) werden nodes für drupal gespeichert, eventuell kann ich ja selbst ein programm schreiben zum automatischen umwandeln und hochladen von nodes..

  • Anmelden oder Registrieren um Kommentare zu schreiben

da hilft dir die drupal api

Eingetragen von 1kubik (903)
am 16.08.2011 - 12:22 Uhr

da hilft dir die drupal api weiter

drupal 6
http://api.drupal.org/api/drupal/includes--database.inc/group/database/6

und drupal 7

http://api.drupal.org/api/drupal/includes--database--database.inc/group/...

dort findest du alles was du brauchst
um in die datenbank zu schreiben

viel erfolg
stef

  • Anmelden oder Registrieren um Kommentare zu schreiben

Import-Module

Eingetragen von Frank Ralf (2135)
am 17.08.2011 - 11:12 Uhr

Es gibt eine Menge leistungsfähiger Import-Module für Drupal. Vielleicht kannst du deine Word-Dokumente in etwas Textbasiertes umwandeln und dann importieren. Schau mal unter Comparison of Content and User Import and Export Modules.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Oke werd ich mir mal

Eingetragen von Fekete777 (34)
am 17.08.2011 - 10:06 Uhr

Oke werd ich mir mal ansehen...
Meine Aufgabe ist allerdings, eine Möglichkeit zu finden, Beiträge aus dem Intranet in das Drupal CMS zu übertragen. Dies soll möglichst automatisch geschehen, da es ja schon wie gesagt bis zu 2 oder 3000 Beiträge sein können.
Diese Beiträge werden als HTML-Datei und als Word-Dokumente gespeichert und ich hab mir gedacht es wäre sicher einfacher aus einem Word-Dokument auszulesen und einen Node in Drupal einzufügen als eine HTML-Datei durchzugehen.

Bin ich richtig mit der Annahme, dass Beiträge bzw. Artikel in einer Datenbank gespeichert werden, also nicht als xml-File?

  • Anmelden oder Registrieren um Kommentare zu schreiben

Feed API

Eingetragen von Frank Ralf (2135)
am 17.08.2011 - 11:10 Uhr
Fekete777 schrieb

Meine Aufgabe ist allerdings, eine Möglichkeit zu finden, Beiträge aus dem Intranet in das Drupal CMS zu übertragen. Dies soll möglichst automatisch geschehen, da es ja schon wie gesagt bis zu 2 oder 3000 Beiträge sein können.
Diese Beiträge werden als HTML-Datei und als Word-Dokumente gespeichert und ich hab mir gedacht es wäre sicher einfacher aus einem Word-Dokument auszulesen und einen Node in Drupal einzufügen als eine HTML-Datei durchzugehen.

Aha, also laufende Synchronisierung. Warum nicht das Intranet komplett auf Drupal umstellen? Ansonsten hab ich gehört, dass Leute mit der Feed API gute Erfahrungen gemacht haben.

EDIT:
Alt, aber interessant: DocImport API module

Fekete777 schrieb

Bin ich richtig mit der Annahme, dass Beiträge bzw. Artikel in einer Datenbank gespeichert werden, also nicht als xml-File?

Jo, bei Drupal landet alles in der Datenbank. Vielleicht doch mal das eine oder andere Buch aus der http://www.drupalcenter.de/handbuch/buecherecke lesen ;-)

  • Anmelden oder Registrieren um Kommentare zu schreiben

genau die inhalte werden

Eingetragen von 1kubik (903)
am 17.08.2011 - 10:37 Uhr

genau
die inhalte werden nicht in einem xml gespeichert
sondern wie in der api ersichtlich in der
(mysql) tabelle 'node'
hier aber nur zb der titel, der (content) type
der inhalt selber wird in tabellen mit einem
'field_data' präfix gespeichert
für den body also 'field_data_body'

gruss
stef

  • Anmelden oder Registrieren um Kommentare zu schreiben

ich werde mal versuchen feeds

Eingetragen von Fekete777 (34)
am 23.08.2011 - 10:32 Uhr

ich werde mal versuchen feeds in kombination mit xpath parser zu probieren und mal schauen wie es so läuft

mit feeds scheint es zu funktionieren.. ich würde mal sagen gelöst

  • Anmelden oder Registrieren um Kommentare zu schreiben

Lösung bitte skizzieren

Eingetragen von Frank Ralf (2135)
am 23.08.2011 - 11:37 Uhr
Fekete777 schrieb

mit feeds scheint es zu funktionieren.. ich würde mal sagen gelöst

Bitte die Lösung für andere Interessierte mal skizzieren. Vielen Dank!

  • Anmelden oder Registrieren um Kommentare zu schreiben

also für mich ist die lösung

Eingetragen von Fekete777 (34)
am 23.08.2011 - 12:35 Uhr

also für mich ist die lösung folgende:

zuerst wandle ich die word-dokumente in xml-dokumente um mit titel und body, eventuell noch andere tags, wie man es halt braucht

anschließend lade ich auf einen public oder private ordner rauf

die xml-dateien werden dann mithilfe von "Feeds Directory Fetcher" und "Feeds XPath Parser" geholt

probleme hatte ich bis jetzt nur bei der richtigen uri für das verzeichnis

tja das wars auch schon

  • Anmelden oder Registrieren um Kommentare zu schreiben

super sache! +1

Eingetragen von 1kubik (903)
am 23.08.2011 - 13:16 Uhr

super sache! +1

  • Anmelden oder Registrieren um Kommentare zu schreiben

Word in XML umwandeln

Eingetragen von Frank Ralf (2135)
am 23.08.2011 - 19:06 Uhr

Vielen Dank für die Anleitung!

Eine Frage hätte ich noch:

Machst du die XML-Umwandlung mit Word-Bordmitteln? Oder nutzt du direkt das neue XML-basierte DOCX-Format?

  • Anmelden oder Registrieren um Kommentare zu schreiben

Das hab ich noch nicht

Eingetragen von Fekete777 (34)
am 24.08.2011 - 07:07 Uhr

Das hab ich noch nicht entschieden, aber ich glaube ich werde versuchen, dass ganze automatisiert mit Visual Basic zu machen, da es mit Word basierten Mitteln zu lange dauern würde.

Ich habe aber noch keinen Weg gefunden, wie ich den Body vom XML formatieren soll, da der XML-Parser nicht erkennt, dass innerhalb des -tags HTML-tags, jedenfalls denke ich es mir so, da sobald ein HTML-tag im -tag vorkommt, der Inhalt vom Beitrag einfach leer gelassen wird.

  • Anmelden oder Registrieren um Kommentare zu schreiben

HTML innnerhalb von XML

Eingetragen von Frank Ralf (2135)
am 24.08.2011 - 07:25 Uhr
Fekete777 schrieb

Ich habe aber noch keinen Weg gefunden, wie ich den Body vom XML formatieren soll, da der XML-Parser nicht erkennt, dass innerhalb des -tags HTML-tags, jedenfalls denke ich es mir so, da sobald ein HTML-tag im -tag vorkommt, der Inhalt vom Beitrag einfach leer gelassen wird.

HTML innerhalb von XML ist immer etwas kniffelig. Du könntest den ganzen Inhalt in <![CDATA[ ... ]]>-Tags packen.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Nice, danke. :) Nun werde ich

Eingetragen von Fekete777 (34)
am 24.08.2011 - 07:36 Uhr

Nice, danke. :)

Nun werde ich mal schauen, wie ich das ganze in VB umsetze :)

  • Anmelden oder Registrieren um Kommentare zu schreiben

XML mit Visual Basic

Eingetragen von Frank Ralf (2135)
am 24.08.2011 - 08:08 Uhr

Nur mal auf die Schnelle gegoogelt:

  • XML in Visual Basic
  • XML-Dateien lesen und schreiben mit VB.NET

Und hier noch ein Link auf das nie richtig in die Gänge gekommene Word-Import-Modul: Microsoft Word resources, das inzwischen auf http://drupal.org/project/querypath verweist.

  • Anmelden oder Registrieren um Kommentare zu schreiben

Benutzeranmeldung

  • Registrieren
  • Neues Passwort anfordern

Aktive Forenthemen

  • für drupal11 ein Slider Modul
  • [gelöst] W3CSS Paragraphs Views
  • Drupal 11 neu aufsetzen und Bereiche aus 10 importieren
  • Wie erlaubt man neuen Benutzern auf die Resetseite zugreifen zu dürfen.
  • [gelöst] Anzeigeformat Text mit Bild in einem Artikel, Drupal 11
  • Social Media Buttons um Insteragram erweitern
  • Nach Installation der neuesten D10-Version kein Zugriff auf Website
  • Composer nach Umzug
  • [gelöst] Taxonomie Begriffe zeigt nicht alle Nodes an
  • Drupal 11 + Experience Builder (Canvas) + Layout Builder
  • Welche KI verwendet ihr?
  • Update Manger läst sich nicht Installieren
Weiter

Neue Kommentare

  • melde mich mal wieder, da ich
    vor 1 Woche 3 Tagen
  • Hey danke
    vor 1 Woche 4 Tagen
  • Update: jetzt gibt's ein
    vor 1 Woche 4 Tagen
  • Hallo, im Prinzip habe ich
    vor 2 Wochen 2 Tagen
  • Da scheint die Terminologie
    vor 2 Wochen 2 Tagen
  • Kannst doch auch alles direkt
    vor 2 Wochen 6 Tagen
  • In der entsprechenden View
    vor 2 Wochen 6 Tagen
  • Dazu müsstest Du vermutlich
    vor 2 Wochen 6 Tagen
  • gelöst
    vor 5 Wochen 3 Tagen
  • Ja natürlich. Dass ist etwas,
    vor 5 Wochen 4 Tagen

Statistik

Beiträge im Forum: 250233
Registrierte User: 20450

Neue User:

  • Mroppoofpaync
  • 4aficiona2
  • AppBuilder

» Alle User anzeigen

User nach Punkten sortiert:
wla9461
stBorchert6003
quiptime4972
Tobias Bähr4019
bv3924
ronald3857
md3717
Thoor3678
Alexander Langer3416
Exterior2903
» User nach Punkten
Zur Zeit sind 0 User und 17 Gäste online.

Hauptmenü

  • » Home
  • » Handbuch & FAQ
  • » Forum
  • » Übersetzungsserver
  • » Suche

Quicklinks I

  • Infos
  • Drupal Showcase
  • Installation
  • Update
  • Forum
  • Team
  • Verhaltensregeln

Quicklinks II

  • Drupal Jobs
  • FAQ
  • Drupal-Kochbuch
  • Best Practice - Drupal Sites - Guidelines
  • Drupal How To's

Quicklinks III

  • Tipps & Tricks
  • Drupal Theme System
  • Theme Handbuch
  • Leitfaden zur Entwicklung von Modulen

RSS & Twitter

  • Drupal Planet deutsch
  • RSS Feed News
  • RSS Feed Planet
  • Twitter Drupalcenter
Drupalcenter Team | Impressum & Datenschutz | Kontakt
Angetrieben von Drupal | Drupal is a registered trademark of Dries Buytaert.
Drupal Initiative - Drupal Association