Texterkennung

KI und automatische Texterkennung von Kirchenbüchern ist die Zukunft, und ich hab diesen Schritt von Archion in der kurzen Zeit nicht erwartet und eher gedacht die brauchen noch 10 Jahre oder sowas. Dafür großes Lob, dass man technisch am Puls der Zeit bleibt.

Ich seh das als Testphase und denke hier werden in den nächsten Jahren verbesserungen folgen.
Das Wichtigste wäre wohl eine Korrekturmöglichkeit durch die Nutzer => Damit würde Archion kostenfrei bessere Transkriptionen bekommen, die dann besser vermarktet werden können, wäre doch doof wenn man das Potential nicht nutzt.
Gerade dann für die Suchmöglichkeit.
Die macht aber erst Sinn wenn genug Seiten (ohne große Fehler) transkripiert wurden.

Dass die KI schlecht geschriebene Kirchenbücher auch nicht richtig lesen kann, ist bekannt, man sollte hier keine Wunder erwarten, Transkribus und Co. haben dort auch ihre Probleme.

Wie weit mir die KI hilft weiß ich noch nicht, was die lesen kann, kann ich meist auch selber lesen, dazu sind 10 Texterkennung pro Monat sehr wenig, die hab ich schnell an einem halben Tag verbraucht.
Aber eine Volltextsuche für ein Kirchenbuch würde mir viel helfen.
 
...
Das Wichtigste wäre wohl eine Korrekturmöglichkeit durch die Nutzer => Damit würde Archion kostenfrei bessere Transkriptionen bekommen, die dann besser vermarktet werden können,
...
Dann sollte aber auch jedes richtig transkriptierte Wort honoriert werden (neues Monatsabo mit entsprechender Anzahl neuer Texterkennungen). Archion kassiert ja bereits.
 
Hallo,
der Gedanke ist für mich der richtige Weg.
Weil die Fehlerquote ist erschreckend!!!
Besonders bei Abweichungen in der Schriftform, Zeilenänderungen, Schrägschriften usw.
Der Zeitaufwand und die jetztige Möglichkeit die Fehler anzuzeigen ist nicht die Lösung.
Besonders der langsame Seitenaufbau(z.B. Gestern) ist für mich ein Grund mich nur um meine Sachen zu kümmern oder ganz abzuschalten.

Einen schönen Sonntag Allen, Rainer
 
Als Hilfe zur Selbsthilfe finde ich die Funktion super !

Sie hat mich bisher jedesmal weiter gebracht. Sei es dadurch, dass ich erkennen konnte, dass ich an der falschen Stelle gewühlt habe, oder dass ich eben doch auf der richtigen Fährte war.

Für mich, ohne jedes Talent dafür alte Schriften zu entziffern, ist das eine Hilfe !

Ein kleiner Verbesserungsvorschlag dennoch:
Den Menü-Button (und ggf. das "TXT" im unteren Menü) farblich hervorheben, falls die Seite bereits transribiert wurde.
Dito wenn man selbst eine Erkennung gestartet hat, und die dann abgeschlossen ist.
 
Hallo, ich bin ja auch eigentlich Optimist, aber so lange die KI aus einer Textklammer Buchstaben macht, fil. als Fri. erkennt und aus einem Hans ein Taus macht, sehe ich noch viel Arbeit vor uns.
Kann ich so eine "Seite" bearbeiten und bearbeitet zurückgeben?

Gruß und schöne Woche Allen, RAiner
 
Hallo und schade, wie soll die KI aus den Fehlern lernen?

Gruß und Ende Rainer
Hier gar nicht, die KI wird bei Transkribus trainiert und von Archion "nur" als Kunde genutzt. (wenn ich das richtig verstanden haben)
Archion trainiert selber keine KI und wird wahrscheinlich auch keine Trainingsdaten an Transkribus geben.

KI nutzen und KI trainieren ist ein gewaltiger Unterschied, in etwa so wie ein Auto fahren und ein Auto bauen.
 
Das wird wie auf anderen Portalen werden. Die Fehler werden in Stammbäume übernommen und verbreiten sich so munter durch die Welt. Für Handschriften ist KI einfach noch nicht weit genug. Da muß sehr viel kontrolliert/nachgearbeitet werden bevor man so etwas als Transkription frei gibt. Ich mache das für mich nur noch/täglich um die vielen, eigentlich tollen Unterlagen sicher nutzen zu können.
Eigentlich kann man die KI nur sinnvoll beim Keyword-Spotting einsetzen, wenn man mehrere Suchbegriffe gleichzeitig eingeben kann und das System mir dann die Seiten und Textstellen auf einem Buch anzeigt, die diese Wörter enthalten.
 
Ich muss doch noch einmal nachfragen.
Ist geplant in komplett transkribierten Büchern, dass man darin gezielt nach bestimmten Begriffen (mehrere Wörter beispielsweise mit Komma getrennt) suchen kann, so dass man nicht jede Seite einzeln aufrufen muss, sondern das ganze Buch nach Begriffen durchsucht und nur die Seiten am Ende anschaut, wo eines dieser Wörter vorkommt? Bei Transkribus geht das ja und dadurch würde man eine Menge Datenverkehr einsparen und meine Zeit.
Vor allem wäre diese Funktion bei kleineren Orten interessant, wenn von einer größeren Stadt die Kirchenbücher vernichtet worden sind oder keine Berufsangaben gemacht worden sind, wären die Orte in der Umgebung eine Chance, einen Bürger als Taufpaten usw. zu finden.
Das wäre dann fast die einzige Chance, die Lücken zu schließen.
 
Wenn ich die Suche nach bereits transkribierten Büchern starte und den Zeitraum auf die Zeit vor 1799 festlege, dann erscheinen erst einmal 3 Bücher. Offensichtlich wird erst einmal nur das 19. Jh. beackert und da stellt sich mir die Frage:
Warum?
Liegt es daran, dass die Schriftart des 19. Jh. mit Transkribus zuverlässiger erkannt wird?

Ich finde es jedenfalls gut, dass Archion diesen innovativen Weg geht, der für die Wissenschaft einmal bedeutend sein könnte. Man könnte auf diese Weise eines Tages versuchen, Städte, die ihr Gedächtnis verloren haben, weil Archive bei Bränden oder Krieg zerstört worden sind, über Zufallsfunde zu rekonstruieren. Manchmal zog auch ein Künstler fort oder wurde verbannt und keiner weiß, wohin es ihn verschlagen hat. Auch hier könnten die Transkribierten Bücher eine wichtige Hilfe sein.
 
Offensichtlich wird erst einmal nur das 19. Jh. beackert und da stellt sich mir die Frage:
Warum?
Liegt es daran, dass die Schriftart des 19. Jh. mit Transkribus zuverlässiger erkannt wird?

Zum momentanen Focus der bei Archion im Hintergrund laufenden automatischen Texterkennung:


[Zitat aus dem Abschnitt "automatische Texterkennung"]
Schwerpunkt: Taufen im 19. Jahrhundert
[Zitat Ende]


Wer in die Familienforschung einsteigt, beginnt i.d.R. dort. ;)
 
Hallo und "Allen" einen schönen Feiertag.

Ich kann nur "Jeden" raten keinen Text ohne Kontrolle zu übernehmen!
Für mich war das was ich gelesen habe besonders für "Anfänger" sehr sehr schlecht.
Zeichen werden zu Buchstaben gemacht, Schrägschriften und andere Änderungen falsch zugeordnet oder falsch gelesen.
Zeilenumbrüche falsch zugeordnet.
Wörter und Abkürzungen falsch gelesen usw.
Besonders wenn aus Begriffen im Text Namen werden.

Was ist mit Text, der quer oder auf dem Kopf geschrieben wurde?

Gruß Rainer
 
Guten Morgen in die Runde,

ich habe mittlerweile auch einige Texterkennungen angestoßen - mit wie bereits mehrfach angemerkt - "durchwachsenen" Ergebnissen; genaueste Prüfungen bleiben unerlässlich.

Es ergibt sich für mich eine Detailfrage:

Kann man als immerhin zahlender Nutzer irgendwo sehen, welche Erkennungen man schon selbst beauftragt hat? Wenn ja, wo? :unsure:

Sonnige Grüße aus OWL

Peter
 
In der Kontoübersicht kann man die Anzahl der verbrauchten/verbliebenen Texterkennungen sehen.

Aber wo würde der Sinn liegen zu sehen, für welche Dokumente man selbst eine Erkennung gemacht hat ?
Man muss sich ja nicht "merken", welche Seiten man transkribiert hat, weil eine Seite nie doppelt bearbeitet werden kann.
 
Mir geht es auch nicht darum, welche Erkennungen man selbst "gemacht" hat, sondern welche sich noch in der Warteschlange befinden und zur Sichtung/Prüfung anstehen ;) - gerade, wenn man anderweitig in Kirchenbüchern "unterwegs ist".
 
Mir geht es auch nicht darum, welche Erkennungen man selbst "gemacht" hat, sondern welche sich noch in der Warteschlange befinden und zur Sichtung/Prüfung anstehen ;) - gerade, wenn man anderweitig in Kirchenbüchern "unterwegs ist".
Du brauchst nur kurz in ein anderes Bild gehen und zurück, eventuell siehst du dann auch wie der Text gerade eingefügt wird. Länger wie 1 bis 2 Minuten hat es bei meinen Versuchen nicht gedauert.
 
Zurück
Oben