Switcher

  • <img class="language-icon" typeof="foaf:Image" src="http://www.averbis.de/sites/all/modules/languageicons/flags/en.png" width="16" height="12" alt="English" title="English" />
  • <img class="language-icon" typeof="foaf:Image" src="http://www.averbis.de/sites/all/modules/languageicons/flags/de.png" width="16" height="12" alt="Deutsch" title="Deutsch" />

Image Block Strukturieren

Daten strukturieren

Unternehmen, Behörden und Forschungseinrichtungen sehen sich mit einer immer größeren Datenflut konfrontiert. Weltweit existieren zum Beispiel über 20 Millionen wissenschaftliche Fachartikel zu bestimmten Gebieten und jedes Jahr kommen etwa 500.000 hinzu. Doch auch in anderen Bereichen steigt der Bedarf an gezielter Informationsextraktion: Handelsunternehmen nehmen täglich mehrere hundert Bestellungen in ihr Warenwirtschaftssystem auf, Krankenhäuser erfassen und bearbeiten pro Jahr mehrere Millionen Arztbriefe oder Anwälte prüfen bei Firmenübernahmen terrabyteweise E-Mails und Serverdaten.

Aus Freitexten werden strukturierte Daten

Um mit diesen enormen Datenmengen arbeiten zu können, müssen diese erfasst, klassifiziert und verschlagwortet werden. Denn meist stehen nur unstrukturierte Freitexte zur Verfügung, die sich weder systematisch durchsuchen noch auswerten lassen. Bislang war dazu eine manuelle Klassifizierung und Verschlagwortung nötig, die vor allem im Bereich des Bibliothekswesens eine lange Tradition hat. Heute setzen sich immer mehr automatisierte, softwarebasierte Verfahren durch.

Diese Methoden reichen mittlerweile qualitativ sehr nahe an die manuelle Erfassung heran – und dass bei deutlich vermindertem Zeitaufwand. Neben der reinen Strukturierung der Daten ermöglichen sie auch deren rasche und detaillierte Auswertung. Innerhalb der Averbis Extraction Platform sind Methoden des Information Retrieval und Text-Mining realisiert, welche in der Lage sind, einen realen Erkenntnisgewinn zu erzielen. Hier werden  Inhalte über unterschiedlich strukturierte Dokumente hinweg und sprachübergreifend durchsucht, miteinander vernetzt und ausgewertet.