diff --git a/src/routes/GestioneDellInformazione/09_Modeling.js b/src/routes/GestioneDellInformazione/09_Modeling.js index c602010..4b56e6b 100644 --- a/src/routes/GestioneDellInformazione/09_Modeling.js +++ b/src/routes/GestioneDellInformazione/09_Modeling.js @@ -75,12 +75,15 @@ export default function () { Come il modello classico, ignora l'ordine delle parole.
-- Modello IR che effettua il ranking in base alla probabilità che un documento sia rilevante. + Modello IR che effettua il ranking in base alla probabilità di comparsa dei termini della query nei documenti.
- To be continued...
+ Si basa sul calcolare un peso
+ Ci sarebbe una dimostrazione complessa che ho omesso per brevità.
- Non ho seriamente capito. + Modello IR simile ai modelli classici che però tiene conto anche della frequenza dei termini nei documenti e della lunghezza dei documenti. +
++ Permette anche di tenere in considerazione la frequenza dei termini nella query, nel caso essa sia molto lunga. +
++ Ci sono formule che ho omesso per brevità.
+ La frazione dei documenti rilevanti totali restituita: +
++ La frazione dei documenti restituiti che sono rilevanti: +
++ Si effettuano test e si valutano precisione e richiamo ottenuti. +
+ ++ Il modello IR ideale ha valori di richiamo e precisione di 1, ma nella realtà questi valori tendono ad essere inversamente proporzionali. +
++ Si fissano un certo numero di livelli di richiamo desiderati e si misura la precisione che ha il modello in quei punti, creando una curva di richiamo standard. +
++ È possibile ottenere una curva di richiamo interpolata prendendo per ogni punto il valore di massima precisione tra esso e i punti precedenti. +
++ È possibile misurare la curva di richiamo media effettuando la media su più query dei vari valori, e la curva di richiamo a valore singolo effettuando una query sola. +
++ Sono entrambe importanti per effettuare una valutazione, perchè la curva media potrebbe mascherare problemi di specifiche query nei modelli. +
+