Wir erstellen reguläre Ausdrücke (Muster zum Durchsuchen von Texten) nach Ihren Anforderungen und vergeben damit Dokumententypen und Schlagworte, die das Auffinden und Gruppieren Ihrer PDF-Dokumente erleichtern. Zudem konvertieren wir die PDF-Dokumente in ein für die Langzeitarchivierung vorgesehenes Format und machen sie via OCR durchsuchbar.
Unser Advernet.de Offline-Archiv wird als Serverless Single-Page-Application erstellt. Dies ist eine auf HTML und JavaScript basierte Anwendung, die lokal auf Ihrem Computer auch ohne Internet-Zugang lauffähig ist. Alle Daten der Anwendung sind in der bereitgestellten ZIP-Datei enthalten und nach dem Entpacken verwendbar. Nach dem Öffnen der Datei index.html in Ihrem Browser können Sie offline Dokumente suchen und anzeigen.
Zu den Produkteigenschaften ↓ Zur Bestellung ↓
Zunächst klären wir einige Punkte per E-Mail und Online-Meeting. Sie stellen uns Ihre PDF-Dokumente im ZIP-Format bereit. Wir erstellen daraus Ihr Offline-Archiv.
Dokumente zu abgeschlossenen Projekten archivieren. Dokumente für Geschäftspartner bereitstellen. Wichtige Unterlagen bei Vertrauenspersonen hinterlegen.
Suche nach Dateinamen. Suche nach Dokumententyp. Suche nach Schlagwort. Herunterladen der gefundenen Dokumente. Volltextsuche. Vorschaugrafiken.
Beispiele zu einigen einfachen regulären Ausdrücken.
Die folgenden Screenshots sind Beispiele zur Benutzeroberfläche eines Advernet.de Offline-Archivs. Klicken zum Vergrößern.
Suche nach Schlagwort Mustermann und Dokumententyp Rechnung
Suche nach Schlagwort Gekündigt und Dokumententyp Vertrag
Suche nach Datumsintervall
Wir stellen Ihnen für den Zeitraum bis zur Fertigstellung Ihres Offline-Archivs einen passwortgeschützten Account auf unserem Server bereit. Der Account dient dem Austausch von Dokumenten über eine Web-Oberfläche. Die Zugangsdaten erhalten Sie unverzüglich nach Ihrer Bestellung.
Es werden nur PDF-Dokumente verarbeitet. Die Dokumente werden in maximal 25 ZIP-Dateien von bis zu 200 MB bereitgestellt. Enthält eine bereitgestellte ZIP-Datei eine Datei, die keine PDF-Datei ist, wird die jeweilige ZIP-Datei nicht verarbeitet und muss ggf. neu bereitgestellt werden. Stellen Sie uns bitte die Dateien über Ihren Account auf unserem Server bereit.
Ein reglärer Ausrück, auch regular expression oder RegEx genannt, kann für die Ermittlung des Dokumententyps oder von Schlagworten verwendet werden. Wir stellen Ihnen die Anzahl reglärer Ausrücke wie in der bestellten Produktvariante vorgesehen bereit. Hinsichtlich einer für Sie passenden Auswahl beraten wir Sie vorher. Sollten wir keine für Ihre Anforderung passende RegEx bereits in unserer internen Datenbank finden, erstellen wir diese! Wir stellen Ihnen nur durch uns getestete regläre Ausrücke bereit. Da reguläre Ausdrücke sehr komplex sein können, behalten wir uns vor, die Erstellung einer RegEx abzulehnen, die nicht in einer Länge bis zu 40 Zeichen darstellbar ist. Zudem behalten wir uns bei allen neu zu erstellenden reglären Ausrücken vor, in Absprache mit Ihnen eine alternative RegEx zu erstellen, die Ihre Anforderung hinreichend erfüllt. Im Rahmen der Dokumentation Ihres Offline-Archivs erhalten Sie eine Beschreibung der verwendeten RegEx.
Die Dokumente werden in PDF/A-2b, einem Format für die Langzeitarchivierung, konvertiert. Ziel ist es, das Erscheinungsbild des Dokumentes langfristig zu erhalten. PDF/A-2b ist zwar ein Format für die Langzeitarchivierung, ohne weitere Maßnahmen ist Ihr Offline-Archiv jedoch nicht revisionssicher und sollte nicht als Langzeitarchiv verwendet werden. Da PDF/A-2b verschiedenen Einschränkungen gegenüber PDF unterliegt, kann die Übernahme aller Elemente aus dem ursprünglichen PDF-Dokument nicht garantiert werden. Das Offline-Archiv enthält auch die jeweiligen Originaldateien. Die Suchfunktion findet Dokumente anhand der konvertierten PDF-Dokumente. Bei der Anzeige eines Suchergebnisses wird sowohl das Herunterladen der konvertierten Datei wie auch das Herunterladen der Originaldatei über einen Link angeboten.
Die Volltextsuche stellt eine zusätzliche Möglichkeit dar, Dokumente zu finden. Die Ermittlung der Volltexte geschieht zum Teil via OCR. Durch OCR ermittelte Texte können je nach Scanqualität und anderen Faktoren falsch erkannte Zeichenketten enthalten.
Die Größe der einzelnen Dokumente ist auf 50 MB (nicht komprimiert) begrenzt. Enthält eine bereitgestellte ZIP-Datei ein größeres Dokument, wird die jeweilige ZIP-Datei nicht verarbeitet und muss ggf. neu bereitgestellt werden.
Für die Erstelung Ihres Offline-Archivs benötigen wir gemäß DSGVO einen Auftragsverarbeitungsvertrag (AVV) mit Ihnen. Sie erhalten nach Ihrer Bestellung unverzüglich einen solchen Vertrag. Änderungswünsche Ihrerseits berücksichtigen wir gerne. Die Bereitstellung einer ZIP-Datei zur Erstellung eines Offline-Archivs vor einer Bestätigung des AVV Ihrerseits oder dem Abschluss eines anderen AVV geschieht nur nach den Regelungen des von uns bereitgestellten AVV.
Über das Einlesen Ihrer Dokumente sowie die OCR-Verarbeitung erhalten Sie ein Protokoll in dem auch eventuell aufgetretene Fehler aufgeführt sind.
Jedes Dokument erhält einen Dokumententyp aus einer von Ihnen bereitgestellten Liste. Diese besteht aus einer Textdatei mit bis zu 30 Zeilen mit je einer Bezeichnung. Jede Bezeichnung besteht nur aus Buchstaben und hat eine Länge von jeweils maximal 30 Zeichen.
Der erste gefundene Dokumententyp aus einer Reihe von Versuchen wird verwendet. Bei Übereinstimmung eines Musters wird unabhängig von Groß-/Kleinschreibung die Schreibweise aus der Liste mit Dokumententypen verwendet. Zunächst werden die regulären Ausdrücke auf den Dateinamen angewendet, dann auf den Volltext. Bei Misserfolg wird versucht, den Namen eines der Datei übergeordneten Verzeichnisses des ZIP-Archivs zu verwenden. Der erste einem Dokumententyp entsprechende Name wird verwendet. Als nächstes wird die erste im Dateinamen gefundene, durch „.“, „_“ oder Leerzeichen von den übrigen Zeichen getrennte Zeichenkette verwendet, die einem Dokumententyp entspricht. Falls damit auch kein Dokumententyp ermittelt werden kann, wird Standard vergeben.
Sofern eine Datei bereits in das Archiv übernommen wurde, übernehmen wir weitere Dateien mit Duplikaten nicht. Dies gilt auch dann, wenn das Duplikat einen anderen Dateinamen hat, in einem anderen Verzeichnis einer ZIP-Datei oder in einer anderen ZIP-Datei vorhanden ist. Für das Duplikat werden auch keine Schlagworte, Dokumententyp und Dokumentendatum gebildet, auch wenn diese von den Angaben des übernommenen Dokumentes abweichen.
Das Ändern des Offline-Archivs ist nicht vorgesehen. Bei einer diesbezüglichen Anforderung sollte das Archiv entsprechend neu erstellt werden. Ist ausnahmsweise, z. B. aus Datenschutzgründen, eine Löschung einzelner Dokumente notwendig, ist dies dennoch möglich.
Benutzeroberfläche und Dokumentation liegen auf Deutsch vor. Das Offline-Archiv ist nicht mehrsprachfähig.
In einem etwa 30 Minuten dauernden Online-Meeting besprechen wir die Vergabe von Dokumententyp und Schlagworten. Terminvorschläge erhalten Sie zusammen mit Ihren Zugangsdaten zu unserer Dokumentenaustauschanwendung.
Wir stellen Ihnen Ihr Offline-Archiv innerhalb von zwei Wochen nach vollständiger Bereitstellung der ZIP-Dateien und Klärung der Vergabe von Dokumententyp und Schlagworten in Ihrem Account auf unserem Server bereit.
Sie erhalten an der Software und Dokumentation des Offline-Archivs ein einfaches Nutzungsrecht. Sie dürfen Kopien zum privaten Gebrauch oder zum Einsatz in Ihrem Unternehmen erstellen. Eine Weitergabe ist nur zum privaten Gebrauch, innerhalb Ihres und verbundener Unternehmen sowie an Geschäftspartner zulässig. Eine Veröffentlichung ist nicht gestattet. Veränderungen dürfen Sie nur zur Fehlerbehebung vornehmen. Unsere Software enthält Open-Source-Komponenten, deren Lizenz Ihnen möglicherweise weitere Nutzungsrechte bezüglich der jeweiligen Open-Source-Komponente einräumt.
Unser Advernet.de Offline-Archiv wird als Serverless Single-Page-Application erstellt. Dies ist eine auf HTML und JavaScript basierte Anwendung, die lokal auf Ihrem Computer auch ohne Internet-Zugang lauffähig ist. Alle Daten der Anwendung sind in der bereitgestellten ZIP-Datei enthalten und nach dem Entpacken verwendbar. Nach dem Öffnen der Datei index.html in Ihrem Browser können Sie offline Dokumente suchen und anzeigen. Sowohl die konvertierten Dokumente als auch die Originaldokumente befinden sich in Verzeichnissen des Archivs. Die Metadaten (z. B. Dokumententyp und Schlagworte) werden als SQLite-Datenbank erstellt und in ein Format für JavaScript umgewandelt.
Das Offline-Archiv ist zur lokalen Nutzung gedacht. Falls Sie das Archiv für Andere zugänglich machen, sollten Sie die Notwendigkeit der Erstellung eines Impressums und einer Datenschutzerklärung prüfen. Entsprechende Links müssen in diesem Fall beispielsweise in den Dateien index.html und hilfe.html hinzugefügt werden.
Das erste im Dateinamen gefundene gültige Datum im Format JJJJ-MM-TT oder TT.MM.JJJJ das nicht in der Zukunft liegt, wird als Dokumentendatum übernommen. Falls kein Datum gefunden wurde, wird das erste gültige Datum im Format JJJJ-MM-TT oder TT.MM.JJJJ, das nicht in der Zukunft liegt, aus dem Text der PDF als Dokumentendatum übernommen. Wurde auch damit kein Dokumentendatum ermittelt, wird das Datum der letzten Änderung der Datei laut ZIP-Archiv verwendet.
Es werden alle Schlagworte vergeben, die aus dem Dateinamen oder Volltext des Dokumentes via der regulären Ausdrücke ermittelt wurden. Ein einziger der in runden Klammern stehenden Teile (Gruppen) kann in einem Schlagwort verwendet werden. Anschließend werden die Verzeichnisnamen aus dem Pfad zur Datei aus dem ZIP-Archiv als Schlagworte vergeben, sofern gültig. Pro Dokument können bis zu 100 Schlagworte mit einer Länge von jeweils bis zu 64 Zeichen vergeben werden.
Nachfolgende Preise verstehen sich als Einmalzahlung inkl. der gesetzlichen Umsatzsteuer. Keine Versandkosten. Bei Klick auf einen der weiter unten stehenden Bestellbuttons werden Sie an Digistore24 weitergeleitet.
Wir erstellen für die Ermittlung des Dokumententyps und der Schlagworte insgesamt bis zu 20 reguläre Ausdrücke innerhalb der beschriebenen Komplexität.
Die Anzahl von Dokumenten im Archiv ist auf 2000 begrenzt. Bei einer größeren bereitgestellten Anzahl werden die ZIP-Dateien nicht verarbeitet und müssen neu bereitgestellt werden.
Die unkomprimierte Gesamtgröße der eingereichten Dokumente ist auf 2 GB begrenzt.
Wir erstellen für die Ermittlung des Dokumententyps und der Schlagworte insgesamt bis zu 30 reguläre Ausdrücke innerhalb der beschriebenen Komplexität.
Die Anzahl von Dokumenten im Archiv ist auf 3000 begrenzt. Bei einer größeren bereitgestellten Anzahl werden die ZIP-Dateien nicht verarbeitet und müssen neu bereitgestellt werden.
Die unkomprimierte Gesamtgröße der eingereichten Dokumente ist auf 3 GB begrenzt.
Wir erstellen für die Ermittlung des Dokumententyps und der Schlagworte insgesamt bis zu 40 reguläre Ausdrücke innerhalb der beschriebenen Komplexität.
Die Anzahl von Dokumenten im Archiv ist auf 4000 begrenzt. Bei einer größeren bereitgestellten Anzahl werden die ZIP-Dateien nicht verarbeitet und müssen neu bereitgestellt werden.
Die unkomprimierte Gesamtgröße der eingereichten Dokumente ist auf 4 GB begrenzt.
Wir bieten außer der Erstellung von Offline-Archiven auch andere Dienstleistungen, z. B. IT-Beratung zum Thema der Digitalisierung im Bürobetrieb, sowie weitere Produkte an.
Nutzen Sie unser Kontaktformular, schreiben Sie uns eine E-Mail oder rufen Sie uns an!
040 18298369
oder
info@advernet.de
(Informationen zu E-Mail-Verschlüsselung)