Große Menge Files mit Metadaten importieren (1 Leser) (1) Gast
Beliebt: 0
|
|
THEMA: Große Menge Files mit Metadaten importieren
|
|
Große Menge Files mit Metadaten importieren vor 9 Jahren, 4 Monaten
|
Karma: 0
|
Hallo,
in meinem Projekt habe ich folgende Herausforderung:
Ich habe knapp 180.000 Dateien in PDF, TIFF und HPGL (kann nach TIFF oder PDF konvertiert werden) und zu jeder Datei eine Textdatei mit gleichem Basename, die Schlüsselwörter für die Suche enthält. Diese Dateien sollen auf möglichst elegante Weise in agorumcore importiert und zugleich mit den Schlüsselwörtern als Metadaten versehen werden.
Ich habe schon die Schulungsbeispiele und die Entwicklerdoku angeschaut. Einzelne Dateien mittels XML-Skript im base64 Format zu importieren scheint mir danach klar zu sein, aber wie kann ich das automatisieren. Mein erster Ansatz wäre je Datei ein XML-Skript zu erstellen und alle XML-Skripte mittels FTP-Skript hochzuladen. Da die XML-Skripte dann automatisch ausgeführt würden, sollten hinterher alle Daten im System sein. Wahrscheinlich könnte man auch mehrere Dokumente in je eine XML-Datei packen, aber das scheint mir weniger sinnvoll, da dann die Skripte zum Erstellen der XML schwieriger werden.
Das ganze ist ein Pilotprojekt. Wenn es sich bewährt, beabsichtigt mein Kunde das System für ein Records Managements auszubauen. Dann sind einige zig Meter Akten zu importieren, wobei ich da dann denke, dass ein Filesystem-Adapter sinnvoller wäre, da sonst MySQL ggf. an seine Grenzen kommt.
Für ein paar nützliche Tipps wäre ich sehr dankbar.
Mit freundlichen Grüßen
Ulrich Moser
|
|
|
|
|
Kein öffentlicher Schreibzugriff erlaubt, bitte erst registrieren!
|
|
Aw: Große Menge Files mit Metadaten importieren vor 9 Jahren, 4 Monaten
|
Karma: 3
|
Hallo,
mir fallen spontan zwei grundsätzliche Möglichkeiten ein, diesen Import zu bewerkstelligen.
Variante 1: Sie können ein externes Programm implementieren, das den XML-Code für Sie generiert (Verzeichnis durchiterieren, Bild in base64 wandeln, zugehörige Metadaten laden) und abspeichert oder gleich per Webservice nach agorum core hochlädt.
Variante 2: Falls Sie das Workflow-Modul verwenden, könnten Sie einen Workflow implementieren, der einen Eingangsordner überwacht und die Metadaten zuordnet, sobald Objekte hineinkopiert werden.
Vorteil von Variante 1: Freie Wahl der Programmiersprache, auch Skriptsprachen möglich.
Vorteile von Variante 2: Höhere Performance, da der Overhead durch Konvertierung und Webservice wegfällt. Ausführung komplett in agorum core, damit Transaktionssicherheit und automatisches Fortsetzen nach einem eventuellen Serverausfall.
|
|
|
|
|
Kein öffentlicher Schreibzugriff erlaubt, bitte erst registrieren!
|
|
|
|
|