From df7c73a29127d8f81b70338dde534e6875e669dc Mon Sep 17 00:00:00 2001
From: Stefano Pigozzi
Date: Sun, 11 Jul 2021 18:19:46 +0200
Subject: [PATCH] =?UTF-8?q?=F0=9F=92=A5=20Finish=20updating=20Gestinfo?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
---
src/routes/Gestinfo/index.js | 121 +++++++++++++++++------------------
1 file changed, 58 insertions(+), 63 deletions(-)
diff --git a/src/routes/Gestinfo/index.js b/src/routes/Gestinfo/index.js
index ba48d32..5e533d2 100644
--- a/src/routes/Gestinfo/index.js
+++ b/src/routes/Gestinfo/index.js
@@ -1209,61 +1209,66 @@ export default function Gestinfo() {
Fattore {`x`} }>
- Deriva dalla somma del peso dei termini della query presenti nel documento:
+ Un moltiplicatore basato sull' dei termini della query presenti nel documento:
- {`x = \\sum_{t \\in q} ( idf_{\\log} )`}
+ {r`
+ x = \sum_{t \in q} ( idf_{\log} )
+ `}
Fattore {`y`} }>
- Deriva dal peso , dalla lunghezza media dei documenti {`L_{avg}`} , la lunghezza del documento specifico {`L_d`} e da due parametri di
- configurazione {`k_1`} e {`b`} :
+ Un moltiplicatore basato sulla nel documento dei termini nella query:
- {`y = \\frac{(k_1 + 1) \\cdot tf_{td}}{k_1 \\cdot \\left( 1 - b + \\left( b \\cdot \\frac{L_d}{L_{avg}} \\right) \\right) + tf_{td}}`}
+ {r`
+ y' = \frac{ (k_1 + 1) \cdot tf_{td} }{ k_1 + tf_{td} }
+ `}
- Attribuisce rispettivamente un bonus o una penalità (regolabile
- con {`b`} ) a ogni documento in base a se questo sia più
- corto o più lungo della media .
+ {r`k_1`} regola la priorità data al fattore : se 0 la viene ignorata e il modello diventa binario, se molto elevata invece il fattore {r`b`} monopolizza gli altri.
+
+ Ad esso viene in genere applicata una normalizzazione basata sulla lunghezza del documento :
+
+ {r`
+ y = \frac{(k_1 + 1) \cdot tf_{td}}{k_1 \cdot \left( 1 - b + \left( b \cdot \frac{L_d}{L_{avg}} \right) \right) + tf_{td}}
+ `}
- {r`k_1`} regola la priorità data alla . All'interno del
- fattore o dell'intero RSV?
+ {r`b`} regola quanto viene applicata la normalizzazione : se 0 , essa viene disattivata, mentre se 1 viene applicata completamente.
Fattore {`z`} }>
- Deriva dal peso dei termini della query e da un parametro di
- configurazione {`k_3`} :
+ Un moltiplicatore basato sulla nella query stessa dei termini nella query:
{`z = \\frac{(k_3 + 1) \\cdot tf_{tq}}{k_3 + tf_{tq}}`}
+
+ {r`k_3`} regola la priorità data ai vari token in base alla loro nella query stessa: se 0 , questa funzionalità viene disattivata, mentre se
+
+
+ Ad esso non viene ovviamente applicata alcuna normalizzazione.
+
- Modello per classificare documenti intercollegati in base a come essi sono collegati tra
- loro.
+ Modello per classificare documenti intercollegati in base a come essi sono collegati tra loro.
- Una pagina non è importante in base a quanto dice di esserlo, ma in base a quanto le altre pagine
- dicono che lo è.
+ Una pagina non è importante in base a quanto dice di esserlo, ma in base a quanto le altre pagine dicono che lo è.
- Algoritmo di Link Analysis Ranking query-independent che assegna
- un grado a ogni pagina indicizzata.
+ Algoritmo di Link Analysis Ranking query-independent che assegna un grado a ogni pagina indicizzata.
È il primo algoritmo utilizzato da Google.
- Misura iterativa di quanto una pagina è importante rispetto a tutte le altre
- indicizzate.
+ Misura iterativa di quanto una pagina è importante rispetto a tutte le altre indicizzate.
{r`
R'_i(p) = (1 - \alpha) \cdot \sum_{q:\ parents} \left( \frac{R_{i-1}(q)}{N_q} \right) + \alpha \cdot E(p)
@@ -1272,15 +1277,21 @@ export default function Gestinfo() {
In cui:
- {`q`} è una pagina che referenzia quella in
- questione;
- {`R_{i-1}(q)`} è il rank normalizzato della
- pagina {r`q`} ;
- {`N_q`} è il numero totale di link presenti
- nella pagina q ;
- {`E(p)`} è una sorgente di rank ;
- {`\\alpha`} è un parametro che regola l'emissione
- della sorgente di rank e la dissipazione del rank preesistente.
+
+ {`q`} è una pagina che referenzia quella in questione;
+
+
+ {`R_{i-1}(q)`} è il rank normalizzato della pagina {r`q`} ;
+
+
+ {`N_q`} è il numero totale di link presenti nella pagina q ;
+
+
+ {`E(p)`} è una sorgente di rank ;
+
+
+ {`\\alpha`} è un parametro che regola l'emissione della sorgente di rank e la dissipazione del rank preesistente.
+
Converge molto in fretta: {`O(log\\ n)`} !
@@ -1290,17 +1301,13 @@ export default function Gestinfo() {
Funzione che introduce nuovo rank nel sistema ad ogni iterazione.
- Se non venisse introdotto nuovo rank nel sistema, si formerebbero lentamente
- dei pozzi in presenza di cicli o pagine senza nessun collegamento uscente.
+ Se non venisse introdotto nuovo rank nel sistema, si formerebbero lentamente dei pozzi in presenza di cicli o pagine senza nessun collegamento uscente.
- PageRank normale prevede che questa funzione sia costante; è possibile
- però personalizzarlo rendendo la funzione variabile, facendo in modo che
- vengano assegnati rank più alti a certi tipi di pagine.
+ PageRank normale prevede che questa funzione sia costante; è possibile però personalizzarlo rendendo la funzione variabile, facendo in modo che vengano assegnati rank più alti a certi tipi di pagine.
- Ad esempio, per prioritizzare le homepage rispetto alle sottopagine è possibile fare
- che:
+ Ad esempio, per prioritizzare le homepage rispetto alle sottopagine è possibile fare che:
{r`
E(p) = \begin{cases}
1 \qquad pagina\ principale\\
@@ -1324,8 +1331,7 @@ export default function Gestinfo() {
- Algoritmo di Link Analysis Ranking query-dependent che attribuisce due
- diversi valori ad ogni pagina: autorità e hubness .
+ Algoritmo di Link Analysis Ranking query-dependent che attribuisce due diversi valori ad ogni pagina: autorità e hubness .
Hubness riscalata a valori inclusi tra 0 e 1 .
- La formula è giusta?
- {r`
+ {r`
h_i(p) = \frac{h'_i(p)}{\sum_{d:\ pages} \left( h'_i(d) \right)}
- `}
+ `}
- Purtroppo, è facile da manipolare, quindi non si applica molto bene ad ambienti non-regolati
- come il web.
+ Purtroppo, è facile da manipolare, quindi non si applica molto bene ad ambienti non-regolati come l'intero web.
@@ -1392,8 +1395,7 @@ export default function Gestinfo() {
Misurazioni che vengono effettuate sui sistemi di .
- Solitamente trattano la velocità di indicizzazione , la velocità di ricerca ,
- l'efficacia del query language , l'user interface , il prezzo ...
+ Solitamente trattano la velocità di indicizzazione , la velocità di ricerca , l'efficacia del query language , l'user interface , il prezzo ...
@@ -1401,26 +1403,21 @@ export default function Gestinfo() {
Per vedere quanto funziona bene un sistema di !
- Solitamente, la misura più importante è la soddisfazione dell'utente , che generalmente
- coincide con la rilevanza dei risultati di ricerca .
+ Solitamente, la misura più importante è la soddisfazione dell'utente , che generalmente coincide con la rilevanza dei risultati di ricerca .
- Per ottenere delle misure, solitamente si preparano in anticipo
- delle query dette benchmark delle quali si è già a conoscenza dei documenti
- rilevanti .
+ Per ottenere delle misure, solitamente si preparano in anticipo delle query dette benchmark delle quali si è già a conoscenza dei documenti rilevanti .
- I documenti rilevanti possono essere selezionati a mano, o ricavati dai dati di utilizzo degli
- utenti (link cliccati o ignorati).
+ I documenti rilevanti possono essere selezionati a mano, o ricavati dai dati di utilizzo degli utenti (link cliccati o ignorati).
- Le due misure usate più di frequente per misurare l'utilità dei risultati
- sono recall e precision .
+ Le due misure usate più di frequente per misurare l'utilità dei risultati sono recall e precision .
@@ -1456,8 +1453,7 @@ export default function Gestinfo() {
- Curva che associa percentili di richiamo ai corrispondenti valori
- di R-Precision .
+ Curva che associa percentili di richiamo ai corrispondenti valori di R-Precision .
@@ -1505,8 +1501,7 @@ export default function Gestinfo() {
- Mostra il valore massimo di precisione per valori di richiamo maggiori o
- uguali a quelli del punto.
+ Mostra il valore massimo di precisione per valori di richiamo maggiori o uguali a quelli del punto.