OCR-Texterkennung

Eine sehr nützliche Zusatz-Lösung ist die sogenannte OCR-Texterkennung. Mit deren Hilfe ersparen Sie sich unnötige Suchzeiten und finden Ihre Dokumente jederzeit schnell und einfach auf.

OCR-Texterkennung
Highlights

Texterkennung von Dokumenten in der TecArt-Software

Bei der sogenannten OCR-Texterkennung von Dokumenten handelt es sich um eine Funktion, die Ihnen alle Ihre Dateien beim Hochladen in Ihr TecArt-System komplett indiziert. Dabei wird jede Datei vollständig nach Schriftelementen durchsucht. Im Rahmen der Indizierung erfolgt also die Umwandlung von Dokumenten in systemlesbare Schriftelemente.
  1. Zeichensatzpakete

    Zeichenerkennung nach verschiedensten Sprachmustern möglich
  1. Volltextsuche

    Vollständige Suche (auch innerhalb von PDF- oder Bilddateien) möglich
  1. Versionierung

    Uneingeschränkte Versionierungsfunktion zu allen Dokumententypen

Vollständige Datei-Indizierung zur Texterkennung in Dokumenten

Suche nach verschiedensten Schriftelementen in allen möglichen Dateitypen Durch die Integration von Google Tesseract OCR in das TecArt-System ist eine moderne Komponente für gescannte Dokumente oder Bilder mit Textinhalten hinzukommen. Tesseract bietet eine sehr hohe Trefferquote, was die optische Zeichenerkennung (Optical Character Recognition – kurz OCR) anbelangt. Die Übereinstimmung der gescannten Pixel, die die Software in einem Bild überprüft, ergibt also auch einen entsprechenden Treffer in der Zeichenliste des jeweils angewandten Sprachpakets, d.h. die Bildpunkte passen am Ende genau zu einem Buchstaben oder Sonderzeichen. Auch die Texterkennung von fremdsprachigen Dateien bzw. Dateien mit sprachspezifischen oder historischen Zeichensätzen (wie bspw. kyrillischen Zeichen oder Frakturlettern) wird hiermit zum Kinderspiel.

Die final generierten Textinformationen werden im TecArt-System hinterlegt und anschließend für die integrierte Suchfunktion bereitgestellt. Schlussendlich wird Ihnen so eine Volltextsuche über alle indizierten Dokumente - egal ob schreibgeschützte PDF-Dokumente, Bildformate oder sogar Faxe - ermöglicht, was natürlich auch für die Versionierung im Rahmen des Dokumentenmanagements uneingeschränkt funktioniert. Sie können also nach einem beliebigen Wort, welches Sie innerhalb einer bestimmten Datei vermuten, suchen und werden die entsprechenden Dokumente schnell und einfach auffinden.
Wichtiger Hinweis: Die Integration von Google Tesseract OCR steht erst ab der TecArt-Software Version 4.2 und hauptsächlich für Server-Systeme zur Verfügung!

Bei dieser Zusatz-Lösung sind lediglich die Dienstleistungen rund um die OCR-Software kostenpflichtig – nicht die Software selbst. Hierzu zählen die einmalige Installation und Konfiguration sowie die Bereitstellung von Ressourcen für das Auslesen im Hintergrund. Letztgenannte sind je nach Dokumentenmenge und Performancelast individuell für jeden Kunden zu betrachten. Sprechen Sie uns einfach an!
auf Anfrage
Die Preise für dieses Produkt können je nach gewähltem Software-Paket unterschiedlich ausfallen. Weitere Infos finden Sie in der Preisliste.

Jetzt anfragen


Verfügbar für:
 
 
Ausgezeichnet &
zertifiziert:
Auch erhältlich in der:
Made in Germany
incl Im Paket inklusive
cost Kostenpflichtig