La similitudine -based è quindi un modo di misurare la similitudine basato sull'.
+
Si basa sull' del minimo antenato comune:
@@ -407,161 +413,184 @@ export default function Gestinfo() {
-
-
+
+
+ È possibile trovare per ogni token dei suoi vicini utilizzabili per migliorare la query:
+
+
- È possibile applicare trovare per ogni token dei suoi vicini utilizzabili per migliorare la query:
+ Dato un token, si cercano tutti i token entro un certo valore di edit distance.
-
+
- Dato un token, si cercano tutti i token entro un certo valore di edit distance.
-
-
-
- Il numero minimo di operazioni per convertire un token in un altro.
-
-
-
-
- Definisce operazioni le seguenti azioni:
-
-
-
Inserimento di un singolo carattere
-
Rimozione di un singolo carattere
-
Sostituzione di un singolo carattere
-
-
-
-
-
-
- Estende la distanza di Levenshtein con una nuova operazione:
-
-
-
Trasposizione di un singolo carattere
-
-
-
-
-
- Differenzia i costi delle varie operazioni, diffenenziando ad esempio in base al carattere sostituito.
-
-
-
-
-
-
- Tramite overlap dei {`q`}-grammi}>
-
- Dato un token, si ordinano i token del vocabolario in base al numero di {`q`}-grammi in comune.
-
-
-
- Misura di overlap tra due insiemi di {`q`}-grammi {`X`} e {`Y`}:
-
- Esistono modi veloci per approssimare l'edit distance {`E`} dei token del vocabolario. Sono dei "se e solo se", giusto?
+ Il numero minimo di operazioni per convertire un token in un altro.
+ Calcolare l'edit distance {`E`} tra due token è un processo computazionalmente molto costoso {`O(n^2)`}.
+
+
- Richiede che venga tenuto traccia delle posizione dei {`q`}-grammi, e prevede che i {`q`}-grammi a più di {`k`} posizioni di distanza non vengano considerati uguali.
+ È possibile evitare di calcolare l'edit distance per la maggior parte dei termini del vocabolario filtrandoli su criteri più veloci.
+ Richiede che venga tenuto traccia delle posizione dei {`q`}-grammi, e prevede che i {`q`}-grammi a più di {`k`} posizioni di distanza non vengano considerati uguali.
+
+
+
+ Scoperti i token "vicini", si può optare per varie soluzioni:
+
+
+
+ Mostrare le possibili correzioni all'utente
+
+
+
+ Aggiungere i token vicini alla query
+
+
+
+ Sostituire il token originale con il più vicino ad esso
+
+
+
-
- Scoperti i token "vicini", si può optare per varie soluzioni:
-
-
-
- Mostrare le possibili correzioni all'utente
-
-
-
- Aggiungere i token vicini alla query
-
-
-
- Sostituire il token originale con il più vicino ad esso
-
-
-
-
+ Tramite overlap dei {`q`}-grammi}>
+
+ Dato un token, si ordinano i token del vocabolario in base al numero di {`q`}-grammi in comune.
+
+
+
+ Misura di overlap tra due insiemi di {`q`}-grammi {`X`} e {`Y`}:
+
- Si dimostra che è possibile capire quanto la presenza di un dato token {`k_i`} in un documento ne contribuisca alla rilevanza:
+ Si dimostra che è possibile capire quanto la presenza di un dato token {`k_i`} in un documento {r`d`} ne contribuisca alla rilevanza per la query {r`\vec{q}`}:
- Deriva dal peso , dalla lunghezza media dei documenti {`L_{avg}`}, la lunghezza del documento specifico {`L_d`} e da due parametri di configurazione {`k_1`} e {`b`}:
+ Deriva dal peso , dalla lunghezza media dei documenti {`L_{avg}`}, la lunghezza del documento specifico {`L_d`} e da due parametri di configurazione {`k_1`} e {`b`}: