Vorauswertung von KB mittels OCR

baukuthi
Mitglied seit
16.01.2015

514 Beiträge

Da ist nichts "negativ eingestellt". Es ist einfach unrealistisch. Die Fehlerquote ist zu hoch.

Ich habe die letzten 10 Jahre täglich solche Register geschrieben, mit Sicherheit auch nicht komplett fehlerfrei. Und bei mancher Sauklaue mußte ich auch mit 20jähriger Leserfahrung kapitulieren.

Martina

Bernd
Mitglied seit
15.12.2014

248 Beiträge

Leider kann ich Martina nur zustimmen. Ein Computerprogramm, das altdeutsche Handschriften mit der Sicherheit eines geübten Menschen erkennt - vielleicht in 100 Jahren.
Ich wüsste da was besseres - Spracherkennung. Diktieren geht schneller als Schreiben und selbst komplizierte Familiennamen braucht man nur ein Mal zu schreiben. Das Propramm merkt sich die Schreibweise. Eine Liste mit 100 Vor- und Nachnamen ist in 10 Minuten erstellt.

MfG
Bernd

PD1964
Mitglied seit
02.11.2016

122 Beiträge

Zitiert von: Bernd
Leider kann ich Martina nur zustimmen. Ein Computerprogramm, das altdeutsche Handschriften mit der Sicherheit eines geübten Menschen erkennt - vielleicht in 100 Jahren.
Ich wüsste da was besseres - Spracherkennung. Diktieren geht schneller als Schreiben und selbst komplizierte Familiennamen braucht man nur ein Mal zu schreiben. Das Propramm merkt sich die Schreibweise. Eine Liste mit 100 Vor- und Nachnamen ist in 10 Minuten erstellt.

Hallo Bernd,

ich bin für jeden alternativen Vorschlag dankbar :-)

Nur wie setzt man so etwas um?

Dazu müsste es eine zentrale Stelle geben, die alles organisiert, damit keine Mehrfach-Analysen ein und desselben KB erfolgen und wo die Daten dann gespeichert und zugreifbar gemacht werden.

Dein "Verfahren" ist natürlich auch mit Aufwand und Kosten verbunden. Wert zahlt dass?

Mehr Fragen als Antworten, aber trotzdem vielen Dank für die vielen Beiträge!

Viele Grüße
Peter

melzig
Mitglied seit
09.01.2015

13 Beiträge

Hallo zusammen,

es gab - wenn ich mich richtig erinnere - schon einmal die Anfrage nach der Nutzung von UGC. Dort könnte man solche Infos doch sicherlich ablegen. Dann müsste das nur noch durchsuchbar sein, so dass man nicht alle Seiten durchblättern muss...

Oder Archion richtet eine neue Datenbank ein, in der solche Indizes gespeichert werden können. Vielleicht Name, Vorname, Ort, Kirchenbuch (wobei dies sicher automatisch übernommen werden könnte).

Viele Grüße
Jan

PS: Kann man im Forum gar nicht suchen? Das war mir neu...

Bernd
Mitglied seit
15.12.2014

248 Beiträge

Zitiert von: melzig
Hallo zusammen,

es gab - wenn ich mich richtig erinnere - schon einmal die Anfrage nach der Nutzung von UGC.


Das geht zwar allmächlich in ein anderes Thema über, aber ich poste es hier mal:
Vor wenigen Tagen hat Herr Müller-Baur in Detmold einen Vortrag gehalten, und da ging es auch kurz um UGC. Die Funktion ist ja generell implementiert, aber bisher nicht aktiviert, weil anderes wichtiger war. Das soll sich jetzt ändern. In naher Zukunft (wenn ich ihn richtig verstanden habe, noch in diesem Jahr) soll die UGC-Funktion aktiviert werden und man soll dann Texte - vom ganzen Kirchenbuch über einzelne Seiten bis zu einzelnen Einträgen - bei ARCHION einstellen können. Wenn ich ihn weiterhin richtig verstanden habe soll ein Symbol auf der Seite oder beim Eintrag anzeigen,dass da jemand schon gearbeitet hat und beim Klick darauf erscheint der übertragene Text. Das ganze ist mit der Suchfuktion auffindbar, liegt aber - wenn es so weit ist - innerhalb der Paywall, d.h. man muß seinen Obolus entrichtet haben, um darauf zugreifen zu können.
Wolln wir mal sehen was draus wird.
Um jetzt wieder zu Thema zurück zu kommen: Die Arbeit haben natürlich die Familienforscher. ARCHION wird da nicht helfen können, dazu sind sie einfach zu wenig Leute. Es wäre natürlich schön, wenn die UGC-Funktion Texte, die schon in Familienforschers Datenbank vorliegen, darstellen könnte, am besten natürlich aus dem Gedcom-Format übertragen.
Die dürfte es reichlich im Lande geben und es ist wirklich ein Unsinn, dass Kirchenbuch-Texte immer und immer wieder abgeschrieben werden. Einmal reicht und in Verbindung mit der Ablichtung des Orginals wäre die Sache auch schnell überprüfbar.
Wie man einen höchst individuellen Stammbaun ohne viel Arbeit wieder in seine einzelnen Eintragungen zerlegt ist mir dabei nicht klar. Ich hoffe, das die Sache daran nicht scheitert.

MfG
Bernd

baukuthi
Mitglied seit
16.01.2015

514 Beiträge

Zitiert von: Bernd
[quote=33061].....Es wäre natürlich schön, wenn die UGC-Funktion Texte, die schon in Familienforschers Datenbank vorliegen, darstellen könnte, am besten natürlich aus dem Gedcom-Format übertragen.....

MfG
Bernd

Wie willst du aus einer Gedcom die Abschrift eines Kirchenbuches erstellen? Eine Abschrift sollte ja buchstabengetreu sein. Alles andere sind Hilfsdateien, aber keine Abschrift.

Martina

libero
Mitglied seit
01.01.2015

436 Beiträge

Da sollten wir wohl unterscheiden nach "wörtlicher Abschrift", also eine Art von Übersetzung, und einem alphabetischen Register mit den Familiennamen und ggfl. Vornamen der Personen.

UGC eignet sich vermutlich in erster Linie für die Abschrift einer ganzen Seite oder eines Teils davon.

Das alphabetische Register sehe ich da noch nicht. Es wäre aber für den Familienforscher mindestens ebenso interessant. Allerdings sind da auch Probleme, denn wie soll man aus "Diemanns Backhäuser" einen Familiennamen machen?

Gruß
Libero

falx_manubrium
Mitglied seit
25.12.2014

69 Beiträge

Schönen guten Tag miteinander,

einen vielversprechenden Weg für OCR bei Handschriften beschreitet des READ Projekt.
https://transkribus.eu/Transkribus/

Grüße
Andreas Sichelstiel

PD1964
Mitglied seit
02.11.2016

122 Beiträge

Zitiert von: falx_manubrium
einen vielversprechenden Weg für OCR bei Handschriften beschreitet des READ Projekt. https://transkribus.eu/Transkribus/[/quote]
Hallo Andreas,

vielen Dank für den interessanten Link. Wer hätte dass von den Österreichern gedacht ;-)

Die Software werde ich die nächsten Tage mal ausprobieren...

Mal sehen, ob "hui" oder "pfui" ;-)

Viele Grüße
Peter

falx_manubrium
Mitglied seit
25.12.2014

69 Beiträge

Guten Morgen,

noch ist sie etwas umständlich und nicht so ausgereift, aber da wird ständig weitergebastelt. Meiner Meinung nach das vielversprechendste Prjekt in der Richtung.

Grüße