Hallo silberpunze,
da ich selbst Software-Entwickler bin hatte mich dieses Projekt auch interessiert, denn eine automatische Indexierung von KB per OCR wäre nobelpreis-würdig
Daher habe ich das Transkribus-System mal zum Testen installiert und einige wenige Beispiel-KB-Seiten auswerten lassen. Das Ergebnis war - um es diplomatisch auszudrücken - "bescheiden".
Natürlich gibt es KB, die sich vermutlich zufriedenstellend scannen lassen, aber bei 99% der KB, die mir unter gekommen sind, fehlt dem System noch ein gewaltige Portion KI.
Gerade KB aus dem 18. Jahrhundert oder älter sind nur von Menschen mit umfangreicher Erfahrung lesbar. Als Mensch lernt man die Schreibweise des Autors nach einiger Zeit zu deuten und vergleicht dann bei schwer lesbaren Passagen den Text mit anderen Text-Passagen auf der gleichen oder anderer Seiten. So etwas kann m.E. heute noch kein Computer-Programm (zumindest was mir bekannt ist).
Sicherlich wäre es toll, wenn man mit Transkrisbus schon Indizes hätte, die ansatzweise Namen einigermaßen verständlich darstellen würde. Selbst wenn aus "Müller" "Miller" oder "Maller" geworden ist, wäre es eine kleine Hilfe für uns Ahnenforscher.
Momentan ist m.E. der Mensch für diese Aufgabe immer noch die beste Wahl, aber ich bin nicht technologie-feindlich. Wenn es da bald etwas gäbe, wäre ich der erste, der es nutzen würde.
Viele Grüße
Peter