SOLR Keyword Spotting | API

Questa ricerca è possibile solo se l'HTR è stato post-processato (tipicamente da UPVLC, contattare info@readcoop.eu per domande)

La ricerca di parole chiave attraverso l'indice SOLR può essere fatta tramite una richiesta GET a

https://transkribus.eu/TrpServer/rest/keyword

con i seguenti parametri:

query stringa - la parola chiave da cercare
start int (predefinito: 0) - primo risultato
rows int (predefinito: 10) - numero di risultati successivi da recuperare
- Al fine di elaborare grandi quantità di risultati, SOLR permette di definire un determinato risultato e mostrare solo i successivi risultati N da lì in poi. Questo può essere usato per sfogliare i risultati in base alla pagina (ad esempio, la prima pagina inizia a 0 e mostra 10 risultati, la pagina successiva inizia a 11 e mostra i successivi 10 ecc.)
probL float - limite inferiore per la probabilità della parola chiave (di solito tra 0,0 e 1,0)
probL float - limite superiore per la probabilità della parola chiave (di solito 1.0)
- Ogni parola chiave è memorizzata con un valore di probabilità. È possibile limitare le ricerche ai risultati al di sopra o al di sotto di una certa probabilità. (Nota: attualmente, le probabilità delle parole chiave sono memorizzate direttamente come fornite. Per trasformare queste probabilità in vere probabilità di rilevanza, è necessaria una funzione di calibrazione nell'interfaccia utente).
filter stringa - permette di specificare certi campi e valori per filtrare i risultati della ricerca (può prendere più valori come in ...&filter=cId:1895&filter=id:4243_221_*...)
- i campi da filtrare sono
- id: (stringa) id dell'elemento dell'indice, composto dall'id del documento, dal numero di pagina e da un numero corrente per la parola nella pagina, separati da trattini bassi -> ad esempio 4432_15_10 sarebbe la parola 10 a pagina 15 del documento 4432. Impostando una stringa di filtro a 4432_15_* si limiterebbe la ricerca a questo documento e pagina; *_20_* limiterebbe la ricerca alla pagina 20 di qualsiasi documento.
- title: (stringa) titolo del documento
- cId: (int) id della collezione
- auth: (stringa) nome dell'autore
fuzzy: int - accetta tutti i valori interi, ma SOLR attualmente supporta solo valori tra 0 e 2
- SOLR permette di includere risultati che differiscono per un certo numero di caratteri.
sorting stringa - permette di ordinare per certi campi. (di solito "rp desc" per mostrare i risultati con probabilità decrescente)

Esempio:

Ricerca della parola chiave "london" nella collezione 1234 con qualsiasi probabilità, visualizzando i primi 100 risultati ordinati per probabilità decrescente.

https://transkribus.eu/TrpServerTesting/rest/search/keyword?query=london&start=0&rows=100&probL=0.0&probH=1.0&filter=cId:1234&fuzzy=0&sorting=rp+desc

Cookie	Descrizione	Durata
politica dei cookie visualizzati	Il cookie è impostato dal plugin GDPR Cookie Consent e viene utilizzato per memorizzare se l'utente ha acconsentito o meno all'uso dei cookie. Non memorizza alcun dato personale.	1 ora
PHPSESSID	Questo cookie è nativo delle applicazioni PHP. Il cookie viene utilizzato per memorizzare e identificare l'ID di sessione unico di un utente allo scopo di gestire la sessione dell'utente sul sito web. Il cookie è un cookie di sessione e viene cancellato quando tutte le finestre del browser vengono chiuse.	1 anno

Cookie	Descrizione	Durata
VISITATORE_INFO1_LIVE	Questo cookie è impostato da Youtube. Utilizzato per tracciare le informazioni dei video di YouTube incorporati in un sito web.	5 mesi
IDE	Utilizzato da Google DoubleClick e memorizza le informazioni su come l'utente utilizza il sito web e qualsiasi altra pubblicità prima di visitare il sito. Questo viene utilizzato per presentare agli utenti gli annunci che sono rilevanti per loro in base al profilo dell'utente.	2 anni

Cookie	Descrizione	Durata
GPS	Questo cookie è impostato da Youtube e registra un ID unico per tracciare gli utenti in base alla loro posizione geografica	30 minuti
tk_or	Questo cookie è impostato dal plugin JetPack sui siti che utilizzano WooCommerce. Questo è un cookie di riferimento utilizzato per analizzare il comportamento dei referrer per Jetpack	5 anni
tk_r3d	Il cookie è installato da JetPack. Utilizzato per le metriche interne delle attività dell'utente per migliorare l'esperienza dell'utente	3 giorni
tk_lr	Questo cookie è impostato dal plugin JetPack sui siti che utilizzano WooCommerce. Questo è un cookie di riferimento utilizzato per analizzare il comportamento dei referrer per Jetpack	1 anno
{\an8}Che cosa?	Questo cookie è installato da Google Analytics. Il cookie viene utilizzato per calcolare i dati del visitatore, della sessione, del camapign e per tenere traccia dell'utilizzo del sito per il rapporto di analisi del sito. Il cookie memorizza le informazioni in modo anonimo e assegna un numero generato randoly per identificare i visitatori unici.	2 anni
_gid	Questo cookie è installato da Google Analytics. Il cookie viene utilizzato per memorizzare informazioni su come i visitatori utilizzano un sito web e aiuta a creare un rapporto analitico su come sta andando il sito web. I dati raccolti includono il numero di visitatori, la fonte da cui provengono e le pagine visitate in forma anonima.	1 giorno
matomo	Per l'analisi statistica, usiamo "Matomo" su questo sito web. Si tratta di uno strumento open source per l'analisi del web. Matomo non trasmette dati a server al di fuori del controllo di READ-COOP. Matomo viene disattivato quando si visita il nostro sito web. Solo se lei acconsente attivamente, il suo comportamento d'uso viene registrato in modo anonimo.	1 anno

Cookie	Descrizione	Durata
YSC	Questo cookie è impostato da Youtube e viene utilizzato per monitorare le visualizzazioni dei video incorporati.	1 anno
_gat	Questo cookie è installato da Google Universal Analytics per strozzare il tasso di richiesta per limitare la raccolta di dati su siti ad alto traffico.	1 minuto

SOLR Keyword Spotting | API

La COOP

Prodotti e servizi

Informazioni utili

Risorse utili

Community