×

P2PaLA

P2PaLA ist ein Layout-Analysewerkzeug, das Strukturtypen auf Regionenebene und Grundlinien einer Seite auf der Basis von vortrainierten Modellen erkennt.
Das Tool wurde von Lorenzo Quirós Díaz an der UPVLC in Valencia entwickelt, siehe https://github.com/lquirosd/P2PaLA für die vollständige Open-Source-Codebasis.

Erkennung

Derzeit ist die Erkennung in den Transkribus-Expertenclient (TranskribusX) für vortrainierte Modelle integriert.
Dabei erzeugt das P2PaLA-Tool neue Textregionen aus trainierten Strukturtypen und optional auch aus den darin enthaltenen Baselines.
Die Tabelle zeigt detaillierte Informationen zu allen verfügbaren Modellen.
Die Spalte "Strukturtypen" zeigt die Liste der Regionstypen, die dieses Modell erkennt, und die Spalte "Grundlinien" zeigt, ob dieses Modell auch auf die Erkennung von Grundlinien trainiert wurde.

Parameter
  • Regionen entzerrt -> alle Regionen werden auf das Begrenzungsrechteck der tatsächlich erkannten Form vereinfacht
  • Min-Area -> Formen mit einer *Fläche*, die kleiner als dieser Bruchteil der Bild *Breite* ist, werden nach der Erkennung entfernt. Verwenden Sie diesen Parameter, um kleine "Müll"-Bereiche zu entfernen. Voreinstellung = 0.01

Training

  • Wenn Sie Interesse haben, Ihre eigenen Modelle zu trainieren, senden Sie uns bitte eine E-Mail (info@readcoop.eu) und wir können die Trainingsoberfläche für Sie freischalten.
  • Trainierte Modelle werden mit der aktuell ausgewählten Sammlung verknüpft und der Besitzer wird auf den Benutzer festgelegt, der das Training gestartet hat.
  • Vermeiden Sie beim Markieren von Regionen Überschneidungen zwischen verschiedenen Regionen.
  • Baseline-Training ist nur dann sinnvoll, wenn Ihr Datensatz groß genug ist, d.h. mindestens 500-1000 korrigierte Baselines.
  • Für die Erkennung von Strukturtypen sollte eine Trainingsmenge von ca. 50-100 Seiten ausreichen, um ein anständiges Modell zu generieren, natürlich abhängig von der Komplexität Ihrer Layouts.
  • Datensatzabgleich: Es ist immer eine gute Idee, dass Ihr Datensatz ausgeglichen ist, d. h. dass die Anzahl der Stichproben über alle Strukturtypen ungefähr gleich ist. Andernfalls können Strukturen mit weniger Stichproben unterdrückt werden, insbesondere je mehr Epochen Sie trainieren.
  • Bitte beachten Sie, dass das Werkzeug nur Strukturtypen erkennen kann, die in irgendeiner Weise visuell oder positionally auf einer Seite zu unterscheiden.
  • Beachten Sie auch, dass P2PaLA derzeit nicht ein produktionsreifes Werkzeug, erwarten Sie also bitte keine "perfekten" Ergebnisse.

Trainings-Parameter

Siehe P2PaLA-Trainingsparameter