From b5307d4370ba96040d4a31f3501be373e8886cc5 Mon Sep 17 00:00:00 2001
From: Stefano Pigozzi
Date: Sat, 30 Jan 2021 17:29:12 +0100
Subject: [PATCH] =?UTF-8?q?=E2=9C=A8=20Finally=20complete=20modeling?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
---
src/components/TitleSplit.module.css | 2 +-
src/routes/Gestinfo/abbr/RSV.js | 12 ++
src/routes/Gestinfo/index.js | 169 +++++++++++++++++----------
3 files changed, 121 insertions(+), 62 deletions(-)
create mode 100644 src/routes/Gestinfo/abbr/RSV.js
diff --git a/src/components/TitleSplit.module.css b/src/components/TitleSplit.module.css
index d69691e..c4c5368 100644
--- a/src/components/TitleSplit.module.css
+++ b/src/components/TitleSplit.module.css
@@ -1,3 +1,3 @@
.titlesplit {
- margin-top: 80px;
+ margin-top: 32px;
}
diff --git a/src/routes/Gestinfo/abbr/RSV.js b/src/routes/Gestinfo/abbr/RSV.js
new file mode 100644
index 0000000..6ed9f08
--- /dev/null
+++ b/src/routes/Gestinfo/abbr/RSV.js
@@ -0,0 +1,12 @@
+import React from "react";
+import {Help} from "bluelib/lib/components";
+import PropTypes from "prop-types";
+
+
+export default function RSV() {
+ return (
+ RSV
+ )
+}
+
+RSV.propTypes = {}
diff --git a/src/routes/Gestinfo/index.js b/src/routes/Gestinfo/index.js
index 2170d75..aecddde 100644
--- a/src/routes/Gestinfo/index.js
+++ b/src/routes/Gestinfo/index.js
@@ -18,6 +18,7 @@ import Todo from "../../components/Todo";
import IDF from "./abbr/IDF";
import TF from "./abbr/TF";
import TFIDF from "./abbr/TFIDF";
+import RSV from "./abbr/RSV";
export default function Gestinfo() {
@@ -334,34 +335,6 @@ export default function Gestinfo() {
{`sim_{r} (t_1,t_2) = ic \\left( mac_{\\ t_1,t_2} \\right)`}
-
-
- Un modo di misurare la similitudine in cui i token sono rappresentati come dimensioni vettoriali.
-
-
-
- Si basa sulla norma a 2, e corrisponde a cercare l'angolo centrato all'origine tra i due vettori:
-
- {`sim_{\\cos} (t_1, t_2) = \\frac{\\vec{t_1} \\cdot \\vec{t_2}}{\\| \\vec{t_1} \\| \\cdot \\| \\vec{t_2} \\|}`}
-
-
- Forse dovrei scrivere la formula "completa".
-
-
-
-
@@ -617,57 +590,131 @@ export default function Gestinfo() {
Modello classico che rappresenta il vocabolario come uno spazio vettoriale, in cui ogni dimensione rappresenta un token.
- Ogni documento viene rappresentato come un vettore, i cui valori sono pesi assegnati in base a quanto il token è signficativo all'interno del documento.
+ Ogni documento viene rappresentato come un vettore {`d`}, i cui valori sono pesi {`w`} assegnati in base a quanto il token è signficativo all'interno del documento.
-
- Le query vengono anch'esse trasformate in vettori, e le rilevanze vengono ottenute dalla similitudine vettoriale tra i vettore query e i vettori documenti.
-
-
- Peso }>
- Un metodo di assegnamento peso che si basa sul prodotto dei fattori e :
+ Le query vengono anch'esse trasformate in vettori {`q`}, e le rilevanze vengono ottenute dalla similitudine vettoriale tra i vettore query e i vettori documenti.
- Misura quanto un token è raro nella collezione di documenti:
+ Un modo di misurare la similitudine tra insiemi di token rappresentati come dimensioni vettoriali.
+ Deriva dal peso , dalla lunghezza media dei documenti {`L_{avg}`}, la lunghezza del documento specifico {`L_d`} e da due parametri di configurazione {`k_1`} e {`b`}:
+