Vorauswertung von KB mittels OCR

PD1964
Mitglied seit
02.11.2016

100 Beiträge

Hallo alle,

ich ärgere mich oft, dass es von vielen KB keine "Register" gibt. In den ostpreußischen KB war das wohl mehr oder weniger Standard, so dass dort eine Suche nur nach Namen (ohne ein genaues Datum zu wissen) bei mir oft zu Treffern führte :-)

In meinen Heimat-KB (nördliches Westfalen) gibt es leider nahezu keine Register, so dass man ohne dem ungefähren Jahr sich einen Wolf sucht :-(

Nun leben wir ja im Jahr 2017, wo die selbstfahrenden Autos schon angekündigt sind, und wo die IT-Technik immens große Fortschritte gemacht hat und noch macht.

Ich frage mich, ob es nicht möglich wäre eine ART OCR-Software über die Digitalisate laufen zu lassen um dann eine gewisse Indexierung aller gefundenen Namen und Begriffe zu erstellen?

Sicherlich bringt das bei wahrscheinlich 70% aller KB nichts, da die Schrift (wenn man von Schrift reden kann) oft sehr unleserlich ist (harmlos ausgedrückt), so dass selbst die erfahrensten Menschen es nicht entziffern können.

Trotzdem würden vielleicht 30% an erkannten Worten reichen, um zumindest eine Basis-Suche durchzuführen. Dabei müsste man sicher oft verschiedene Buchstaben in den Namen testen, aber man bekäme eine Seiten-Vorauswahl, wo man dann mal eben schnell nachschauen kann.

Eure Meinung?

Viele Grüße
Peter

Benthaus
Mitglied seit
12.01.2015

59 Beiträge

Welcher ernsthafte Forscher, würde auf eine 30% Lösung verlassen?

PD1964
Mitglied seit
02.11.2016

100 Beiträge

Zitiert von: Benthaus
Welcher ernsthafte Forscher, würde auf eine 30% Lösung verlassen?

Habe ich mich so missverständlich ausgedrückt? Es geht nicht darum auf Knopf-Druck eine kompletten Stammbaum aus KB zu erstellen, sondern nur zur Verkürzung der Suchzeit.

Ein mehr oder weniger korrekte Auswertung von KB-Einträgen wird auf längere Sicht nicht ohne das menschliche Gehirn gehen (Alleinstellungsmerkmal ;-) )

Grüße
Peter

PD1964
Mitglied seit
02.11.2016

100 Beiträge

Hier:

http://www.ancestryinsider.org/2011/01/we-want-tech-ocr-handwriting.html

und hier:

http://www.ai.rug.nl/alice/nwo-catch-scratch/index_english.html

gibt es bereits Ansätze für "genealogisches" OCR.

In dem Thema kenne ich mich so gar nicht aus, aber interessant wäre so was schon ;-)

Viele Grüße
Peter

baukuthi
Mitglied seit
16.01.2015

458 Beiträge

Mit Eintippen eines einfachen (nicht zu einfachen) Namensregisters ist man alle mal schneller als mit der Nachbearbeitung irgend welcher Maschinenübersetzungen aus Handschriften.

Martina

Bernd
Mitglied seit
15.12.2014

236 Beiträge

Hallo PD1964
In welchem Kirchenbuch suchst Du denn? Mancherorts ist man schon recht weit mit der Indexierung, oder es gibt Verkartungen...

MfG
Bernd

PD1964
Mitglied seit
02.11.2016

100 Beiträge

Zitiert von: Bernd
In welchem Kirchenbuch suchst Du denn? Mancherorts ist man schon recht weit mit der Indexierung, oder es gibt Verkartungen...

Hallo Bernd,

irgendwie habe ich das Gefühl etwas verpasst zu haben? Was sind Indexierungen (Indizierungen?) und Verkartungen? Habe ich hier noch nie gesehen -> bitte mal ein Beispiel-Link! Wer hat diese Such-Hilfe erstellt?

Ich war bisher nur in den KB von Ostpreußen und Westfalen unterwegs und in Westfalen gibt es keine Namensregister-KB. Z.B. hier:

http://www.archion.de/p/1a195f1401/

Das sind über 500 Seiten mit je 8 Taufeinträgen ergibt 4000 Taufeinträge (in 52 Jahren). Eigentlich nicht wirklich viel, aber wenn man einen Bereich von 20 Jahren absuchen muss, gehen doch "einige" Minuten bei drauf...

Viele Grüße
Peter

Linde
Mitglied seit
13.01.2015

1091 Beiträge

... zum Beispiel
http://online-ofb.de/

... nördliches Westfalen = etwas genauere Region ?

Freundliche Grüße

MattSchulz
Mitglied seit
20.03.2015

5 Beiträge

Hallo Peter!

Zitiert von: PD1964
nur zur Verkürzung der Suchzeit.

Eine (bis zu) 30% korrekte Erfassung von Handschriften ist nicht sehr sinnvoll. Zumal es maschinell noch schlechter geht, wenn "selbst die erfahrensten Menschen es nicht entziffern können".

Dazu zwei mögliche Szenarien:

1. In einem solchen Index/Register findet man nichts, was passen könnte. Was ist die Konsequenz? Man sucht "per Hand" das komplette Kirchenbuch bzw. den in Frage kommenden Zeitraum durch.

2. In einem solchen Index/Register findet man etwas, das passen könnte. Was ist die Konsequenz? Man sucht "per Hand" das komplette bzw. restliche Kirchenbuch durch, weil etwas beim Indizieren übersehen worden, original anders notiert, anders gelesen, im Index anders aufgeschrieben worden sein könnte.

Das ist das übliche Vorgehen bei einer Fehlerquote größer 0. Und selbst bei Registern und Indizes, die als fehlerfrei gelten (gibt es die?), sieht man sich die Originaleinträge an, ob es auch wirklich keine Übertragungsfehler gibt.

Wer schon mit indizierten Kirchenbüchern gearbeitet hat (z.B bei familysearch, ancestry, PTG), weiß, dass selten alles stimmt, auch wenn eine vollständige (wenn auch fehlerbehaftete) Erfassung durchaus Zeit sparen und Anhaltspunkte zur weiteren Suche geben kann. Den Blick in die Originale erspart es dennoch nicht.

Übrigens spricht nichts dagegen, selbst ein Register zu erstellen oder wenigstens anzufangen. Der Nächste, der in der gleichen Gegend forscht, freut sich!

Beste Grüße

PD1964
Mitglied seit
02.11.2016

100 Beiträge

Zitiert von: Linde
... nördliches Westfalen = etwas genauere Region ?

Siehe Link im Beitrag vorher ;-)

Kreis Tecklenburg!

An alle: Ich staune, dass viele von euch so "negativ" eingestellt sind?

Habt ihr Angst ein Computer nimmt euren "Arbeitsplatz" weg? ;-)

Ich hätte eigentlich mehr positives Feedback erwartet?

Grüße
Peter