- TODO
+ Per ora il corso sembra interessante, ma ho seguito ancora troppe poche lezioni per dirlo con certezza.
+
+ La prof. Mandreoli consiglia il film Moneyball, perchè fa vedere quanto è efficace la data science.
+
-
+
Materiale raccolto
- TODO
+ Sto seguendo le lezioni di questo corso, pertanto sto raccogliendo attivamente materiale.
@@ -49,16 +52,6 @@ const Page: NextPage = () => {
-
-
-
- Cose bizzarre
-
-
- La prof. Mandreoli consiglia il film Moneyball, (perchè fa vedere quanto sia utile la data science).
-
-
-
>
}
diff --git a/pages/year4/bigdata/teoria.tsx b/pages/year4/bigdata/teoria.tsx
index 651c098..eb87394 100644
--- a/pages/year4/bigdata/teoria.tsx
+++ b/pages/year4/bigdata/teoria.tsx
@@ -1,4 +1,4 @@
-import {Heading, Chapter, Box, ListUnordered, ListOrdered, Parenthesis, Idiomatic as I, BringAttention as B} from "@steffo/bluelib-react"
+import {Heading, Chapter, Box, ListUnordered, Parenthesis, Idiomatic as I, BringAttention as B} from "@steffo/bluelib-react"
import type { NextPage, NextPageContext } from 'next'
import { Link } from '../../../components/link'
@@ -18,7 +18,7 @@ const Page: NextPage = () => {
-
+
Fasi di elaborazione dei dati
@@ -47,7 +47,7 @@ const Page: NextPage = () => {
I dati raccolti vengono elaborati e puliti, trasformandoli in formati su cui sia possibile effettuare analisi.
- Ad esempio, se i dati provengono da basi di dati diverse, vengono resi uniformi e normalizzati.
+ Ad esempio, se i dati provengono da basi di dati diverse, vanno messi in una unica tabella con valori comparabili tra loro.
@@ -81,6 +81,31 @@ const Page: NextPage = () => {
+
+
+ Raccolta dati
+
+
+
+
+ Elaborazione dati
+
+
+
+
+ Analisi esploratoria
+
+
+
+
+ Sviluppo modelli
+
+
+
+
+ Verifica ipotesi
+
+
>
}
From 1dae575e07f1764c4ff6df9b71303ec31b581a07 Mon Sep 17 00:00:00 2001
From: Stefano Pigozzi
Date: Thu, 29 Sep 2022 03:13:58 +0200
Subject: [PATCH 2/5] IDEA: project files
---
.idea/discord.xml | 7 +++++++
.idea/inspectionProfiles/Project_Default.xml | 1 +
.idea/runConfigurations/dev.xml | 12 ++++++++++++
3 files changed, 20 insertions(+)
diff --git a/.idea/discord.xml b/.idea/discord.xml
index e69de29..d8e9561 100644
--- a/.idea/discord.xml
+++ b/.idea/discord.xml
@@ -0,0 +1,7 @@
+
+
+
+
+
+
+
\ No newline at end of file
diff --git a/.idea/inspectionProfiles/Project_Default.xml b/.idea/inspectionProfiles/Project_Default.xml
index 146ab09..22cdf9b 100644
--- a/.idea/inspectionProfiles/Project_Default.xml
+++ b/.idea/inspectionProfiles/Project_Default.xml
@@ -1,6 +1,7 @@
+
diff --git a/.idea/runConfigurations/dev.xml b/.idea/runConfigurations/dev.xml
index e69de29..46d8ec8 100644
--- a/.idea/runConfigurations/dev.xml
+++ b/.idea/runConfigurations/dev.xml
@@ -0,0 +1,12 @@
+
+
+
+
+
+
+
+
+
+
+
+
\ No newline at end of file
From 8693f06997fac0ce395785e30a31299007a50b8a Mon Sep 17 00:00:00 2001
From: Stefano Pigozzi
Date: Thu, 29 Sep 2022 23:37:20 +0200
Subject: [PATCH 3/5] `machinelearning`: Study
---
pages/year4/machinelearning/index.tsx | 8 +--
pages/year4/machinelearning/teoria.tsx | 88 ++++++++++++++------------
2 files changed, 51 insertions(+), 45 deletions(-)
diff --git a/pages/year4/machinelearning/index.tsx b/pages/year4/machinelearning/index.tsx
index 4dc666f..b0a3b53 100644
--- a/pages/year4/machinelearning/index.tsx
+++ b/pages/year4/machinelearning/index.tsx
@@ -17,22 +17,22 @@ const Page: NextPage = () => {
Machine learning
-
+
Premessa
- TODO
+ Anche questo corso sembra interessante: spero solo di non impantanarmi nella matematica come al solito!
-
+
Materiale raccolto
- TODO
+ Sto seguendo le lezioni di questo corso, pertanto sto raccogliendo attivamente materiale.
- L'obiettivo del machine learning è quello di costruire un modello matematico in grado di mappare tutti i valori di uno spazio di "input" a quelli di un altro spazio di "output" .
+ L'obiettivo del machine learning è quello di costruire un modello matematico in grado di associare tutti i valori di uno spazio di input a quelli di un altro spazio di output .
-
-
-
-
-
- Supervised learning
-
- Quando si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
+ Per costruire il modello, usano insiemi di associazioni tra un vettore di input e un risultato di output:
- In particolare, i problemi risolti in questo caso sono detti:
+
-
-
- Problemi di binary classification se
-
-
- Problemi di multi-class classification se
-
-
- Problemi di regression se
-
-
-
-
-
- Unsupervised learning
-
-
- Quando non si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
-
-
- In particolare, i problemi risolti in questo caso sono detti:
-
-
-
- Problemi di novelty detection se si cerca di capire se qualcosa è simile o nuovo rispetto agli elementi precedenti
-
-
- Problemi di clustering se si cerca di trovare gruppi a cui potrebbero appartenere gli elementi
-
-
+
+
+
+ Supervised learning
+
+
+ Quando si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
+
+
+ In particolare, i problemi risolti in questo caso sono detti:
+
+
+
+ Problemi di binary classification se
+
+
+ Problemi di multi-class classification se
+
+
+ Problemi di regression se
+
+
+
+
+
+ Unsupervised learning
+
+
+ Quando non si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
+
+
+ In particolare, i problemi risolti in questo caso sono detti:
+
+
+
+ Problemi di novelty detection se si cerca di capire se qualcosa è simile o nuovo rispetto agli elementi precedenti
+
+
+ Problemi di clustering se si cerca di trovare gruppi a cui potrebbero appartenere gli elementi
+
+
+
+
From 3c2e1155ec8298731aa99ab72abcbc9721625665 Mon Sep 17 00:00:00 2001
From: Stefano Pigozzi
Date: Fri, 30 Sep 2022 03:17:30 +0200
Subject: [PATCH 4/5] `machinelearning`: Complete lesson 1
---
pages/year4/machinelearning/teoria.tsx | 184 +++++++++++++++++++------
1 file changed, 139 insertions(+), 45 deletions(-)
diff --git a/pages/year4/machinelearning/teoria.tsx b/pages/year4/machinelearning/teoria.tsx
index 1ab0ab4..adde720 100644
--- a/pages/year4/machinelearning/teoria.tsx
+++ b/pages/year4/machinelearning/teoria.tsx
@@ -1,4 +1,4 @@
-import {Heading, Chapter, Box, ListUnordered, BringAttention as B, Idiomatic as I} from "@steffo/bluelib-react"
+import {Heading, Chapter, Box, ListUnordered, BringAttention as B, Idiomatic as I, UAnnotation as U, Parenthesis, Quote} from "@steffo/bluelib-react"
import type { NextPage, NextPageContext } from 'next'
import { Link } from '../../../components/link'
import 'katex/dist/katex.min.css';
@@ -22,8 +22,8 @@ const Page: NextPage = () => {
-
- Concetto base
+
+ Apprendimento
@@ -44,71 +44,165 @@ const Page: NextPage = () => {
- Supervised learning
+ Training set
- Quando si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
+ Insieme di associazioni su cui ci si basa per creare il modello matematico.
-
- In particolare, i problemi risolti in questo caso sono detti:
-
-
-
- Problemi di binary classification se
-
-
- Problemi di multi-class classification se
-
-
- Problemi di regression se
-
-
+
+ Il codice di programmazione del modello!
+
- Unsupervised learning
+ Validation set
- Quando non si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
+ Insieme di associazioni usate per verificare che il modello matematico sia valido.
+
+ La Continuous Integration del modello!
+
+
+
+
+ Testing set
+
- In particolare, i problemi risolti in questo caso sono detti:
+ Insieme di associazioni usate per determinare l'efficacia del modello matematico.
-
-
- Problemi di novelty detection se si cerca di capire se qualcosa è simile o nuovo rispetto agli elementi precedenti
-
-
- Problemi di clustering se si cerca di trovare gruppi a cui potrebbero appartenere gli elementi
-
-
+
+ Il benchmark del modello!
+
-
+
+
+ Supervised learning
+
+
+ Quando si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
+
+
+ In particolare, i problemi risolti in questo caso sono detti:
+
+
+
+ Problemi di binary classification se
+
+
+ Problemi di multi-class classification se
+
+
+ Problemi di regression se
+
+
+
+
+
+ Unsupervised learning
+
+
+ Quando non si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning.
+
+
+ In particolare, i problemi risolti in questo caso sono detti:
+
+
+
+ Problemi di novelty detection se si cerca di capire se qualcosa è simile o nuovo rispetto agli elementi precedenti
+
+
+ Problemi di clustering se si cerca di trovare gruppi a cui potrebbero appartenere gli elementi
+
+
+
+
+
+
+ Ottimizzazione
+
+
Come un problema di ottimizzazione
- Possiamo astrarre il machine learning come il seguente problema di ottimizzazione di minimizzazione dell'errore:
+ Possiamo astrarre il machine learning come il seguente problema di ottimizzazione:
-
+
-
-
-
- Loss function
-
-
-
-
- Complessità della funzione
-
-
-
+
+ Trova la funzione che minimizza gli errori sul training set e la complessità della funzione, dando opzionalmente priorità a uno dei due addendi.
+
+
+
+
+
+
+ Hypothesis space
+
+
+
+
+
+ Spazio delle funzioni adatte a descrivere la relazione tra input e output.
+
+
+
+
+ Loss function
+
+
+
+
+
+ Funzione predeterminata che determina l'errore del modello su un elemento del training set.
+
+
+
+
+ Complessità della funzione
+
+
+
+
+
+ Non ancora spiegato.
+
+
+ È la norma a infinito al quadrato o la norma quadratica?
+
+
+
+
+ Priorità
+
+
+
+
+
+ Parametro moltiplicativo predeterminato che permette di selezionare quanta importanza dare agli errori sul training set rispetto alla complessità del modello.
+
+
+
+ Se minore di 1, prioritizza gli errori.
+
+
+ Se maggiore di 1, prioritizza la semplicità.
+
+
+
+
+ Se troppo basso, il modello commette overfitting.
+