Questo modello di riconoscimento del testo si basa sui giornali della fine del XIX secolo. An Gaodhal, una pubblicazione bilingue (irlandese e inglese) prodotta a Brooklyn dall'emigrante irlandese Micheál Ó Lócháin. In particolare, questo modello monolingue deriva da pagine stampate esclusivamente o principalmente in lingua irlandese (nota come Gaeilge). È stato sviluppato nel corso del progetto "Building a Digitally Enhanced Edition of the Brooklyn-Published Irish-Language Newspaper An Gaodhal, 1881-1904", un'iniziativa di collaborazione tra la New York University e l'Università di Galway.
Il testo in lingua irlandese di questo giornale è quasi esclusivamente in cló Gaelach, una scrittura non romana comunemente usata all'epoca. Tutte le pagine utilizzate per il modello sono state corrette da uno specialista delle forme storiche della lingua irlandese e le immagini digitali sono state fornite dalla biblioteca digitale della James Hardiman Library dell'Università di Galway. Il modello conserva le caratteristiche principali della forma cló Gaelach: in particolare, utilizza caratteri unicode che conservano il punctum utilizzato per indicare la lenizione delle consonanti presenti nel testo originale.
Il progetto è stato condotto con il sostegno finanziario della Robert D. L. Gardiner Foundation, dell'Irish Institute di New York, della Glucksman Ireland House e dell'Università di Galway. Una serie completa di risultati OCR di questo modello e ulteriori informazioni sul progetto sono disponibili QUI.