- Misurazioni che vengono effettuate sui sistemi di
- Per ottenere delle metriche, solitamente si preparano in anticipo delle query dette benchmark delle quali si è già a conoscenza dei documenti rilevanti. + Per ottenere delle misure, solitamente si preparano in anticipo delle query dette benchmark delle quali si è già a conoscenza dei documenti rilevanti.
- Le due metriche usate più di frequente per misurare l'utilità dei risultati sono recall e precision. + Le due misure usate più di frequente per misurare l'utilità dei risultati sono recall e precision.
- Visto che la maggior parte dei modelli IR ordinano i risultati, è possibile decidere di configurarli in maniera tale che richiamino una percentile dei risultati, e misurare la precisione a quella percentile, creando una curva dai risultati alle varie percentili. -
+
- Confronta la precisione a varie percentili di richiamo.
+ La precisione di una query che richiama
+
+ Curva che associa percentili di richiamo ai corrispondenti valori di R-Precision.
- -- Confronta la precisione massima di tutte le percentili di richiamo maggiori o uguali a quella corrente. + È detta naturale se include un punto per ogni documento richiamato. +
++ È detta standard se usa le percentuali da 10% a 100% come punti. +
++ Mostra il valore massimo di precisione per valori di richiamo maggiori o uguali a quelli del punto.
-- Se si hanno più benchmark, si può effettuare la media tra i benchmark dei valori sulle curve di richiamo, ottenendo così una curva di precisione media. -
-- + Esistono misure che riassumono i risultati di più benchmark in una sola.
++ Se si hanno più benchmark, corrispondenti a più curve di richiamo, si possono ottenere le medie dei valori ai vari livelli, ottenendo così una curva di precisione media. +
++ La media di tutti i livelli di precisione media. +
++ Misura che combina richiamo e precisione in un singolo valore: +
+
+ Complemento della media armonica configurabile che permette di selezionare se dare priorità
+ Misura che attribuisce guadagni decrescenti in base alla precisione di ogni documento richiamato. +
+ ++ Variante del Discounted Cumulative Gain che divide il punteggio finale per il valore perfetto ottenibile. +
++ Normalizzando la formula precedente si ottiene: +
++ Il modo in cui i risultati vengono visualizzati all'utente. +
++ Permettere all'utente di vedere velocemente tutti i risultati e di scegliere il risultato a lui più utile. +
++ Il motore di ricerca web mostra all'utente un elenco di collegamenti ai documenti richiamati. +
++ Solitamente include alcuni dati del documento, come titolo, sommario e url. +
++ Un breve riassunto del contenuto del documento richiamato. +
++ Un sommario i cui contenuti dipendono solo dal documento, e non dalla query immessa. +
+manifest.json
, dai tag OpenGraph, dalle prime righe del documento e quelli che Google genera dalle applicazioni web (Web 3.0).
+ + Un sommario che varia da query a query, evidenziando le parti rilevanti del documento. +
+