×

P2PaLA

P2PaLA è uno strumento di analisi del layout che riconosce i tipi di struttura a livello di regione e le linee di base di una pagina sulla base di modelli pre-addestrati.
Lo strumento è stato sviluppato da Lorenzo Quirós Díaz alla UPVLC di Valencia, vedi https://github.com/lquirosd/P2PaLA per l'intero codice Open Source.

Riconoscimento

Attualmente, il riconoscimento è integrato nell' Expert Client Transkribus (TranskribusX) per i modelli pre-addestrati.
In questo processo, lo strumento P2PaLA crea nuove regioni di testo dai tipi di struttura addestrati e opzionalmente anche le linee di base contenute in quelle regioni.
La tabella mostra informazioni dettagliate su tutti i modelli disponibili.
La colonna "Structure types" mostra la lista dei tipi di regioni che questo modello riconosce e la colonna "Baselines" mostra se questo modello è stato anche addestrato a rilevare le baseline.

Parametri
  • Rettifica regioni -> tutte le regioni saranno semplificate al riquadro di delimitazione della forma attuale riconosciuta
  • Min-Area -> Le forme con un *area* più piccola di questa frazione della *larghezza* dell'immagine saranno rimosse dopo il riconoscimento. Usa questo parametro per rimuovere piccole regioni "spazzatura". Predefinito = 0,01

Addestramento

  • Se sei interessato ad addestrare i tuoi modelli, mandaci un'email (info@readcoop.eu) e possiamo abilitare l'interfaccia di addestramento per te.
  • I modelli addestrati saranno associati alla collezione attualmente selezionata e il proprietario è impostato sull'utente che ha iniziato l'addestramento.
  • Quando etichettate le regioni, evitate la sovrapposizione tra regioni diverse.
  • L'addestramento Baseline ha senso solo se il tuo set di dati è abbastanza grande, cioè almeno 500-1000 linee di base corrette.
  • Per il riconoscimento del tipo di struttura, un set di addestramento di circa 50-100 pagine dovrebbe essere sufficiente per generare un modello decente, a seconda ovviamente della complessità dei vostri layout.
  • Bilanciamento del datasetè sempre una buona idea avere un set di dati bilanciato, cioè che il numero di campioni in tutti i tipi di struttura sia approssimativamente lo stesso. In caso contrario, le strutture con un minor numero di campioni possono essere soppresse, soprattutto con il maggior numero di epoche di addestramento.
  • Si noti che lo strumento può riconoscere solo i tipi di struttura che sono in qualche modo visivamente o in posizione distinguibili su una pagina.
  • Notate anche che P2PaLA è attualmente Non uno strumento pronto per la produzione, quindi non aspettatevi risultati "perfetti".

Parametri di addestramento

Vedere Parametri di addestramento P2PaLA