Die Zeichenfehlerrate (CER) vergleicht für eine bestimmte Seite die Gesamtzahl der Zeichen (n), einschließlich Leerzeichen, mit der minimalen Anzahl von Einfügungen (i), Ersetzungen (s) und Löschungen (d) von Zeichen, die erforderlich sind, um die Ground Truth Ergebnis. Die Formel zur Berechnung des CER lautet wie folgt: CER = [ (i + s + d) / n ]*100
Jeder kleine Transkriptionsfehler ist statistisch ein vollwertiger Fehler. Das bedeutet, dass jedes fehlende Komma, ein "u" statt eines "v", ein zusätzliches Leerzeichen oder auch ein Großbuchstabe statt eines Kleinbuchstabens als Fehler in die CER eingehen.