From 3c2e1155ec8298731aa99ab72abcbc9721625665 Mon Sep 17 00:00:00 2001 From: Stefano Pigozzi Date: Fri, 30 Sep 2022 03:17:30 +0200 Subject: [PATCH] `machinelearning`: Complete lesson 1 --- pages/year4/machinelearning/teoria.tsx | 184 +++++++++++++++++++------ 1 file changed, 139 insertions(+), 45 deletions(-) diff --git a/pages/year4/machinelearning/teoria.tsx b/pages/year4/machinelearning/teoria.tsx index 1ab0ab4..adde720 100644 --- a/pages/year4/machinelearning/teoria.tsx +++ b/pages/year4/machinelearning/teoria.tsx @@ -1,4 +1,4 @@ -import {Heading, Chapter, Box, ListUnordered, BringAttention as B, Idiomatic as I} from "@steffo/bluelib-react" +import {Heading, Chapter, Box, ListUnordered, BringAttention as B, Idiomatic as I, UAnnotation as U, Parenthesis, Quote} from "@steffo/bluelib-react" import type { NextPage, NextPageContext } from 'next' import { Link } from '../../../components/link' import 'katex/dist/katex.min.css'; @@ -22,8 +22,8 @@ const Page: NextPage = () => { - - Concetto base + + Apprendimento @@ -44,71 +44,165 @@ const Page: NextPage = () => { - Supervised learning + Training set

- Quando si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning. + Insieme di associazioni su cui ci si basa per creare il modello matematico.

-

- In particolare, i problemi risolti in questo caso sono detti: -

- - - Problemi di binary classification se - - - Problemi di multi-class classification se - - - Problemi di regression se - - + + Il codice di programmazione del modello! +
- Unsupervised learning + Validation set

- Quando non si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning. + Insieme di associazioni usate per verificare che il modello matematico sia valido.

+ + La Continuous Integration del modello! + +
+ + + Testing set +

- In particolare, i problemi risolti in questo caso sono detti: + Insieme di associazioni usate per determinare l'efficacia del modello matematico.

- - - Problemi di novelty detection se si cerca di capire se qualcosa è simile o nuovo rispetto agli elementi precedenti - - - Problemi di clustering se si cerca di trovare gruppi a cui potrebbero appartenere gli elementi - - + + Il benchmark del modello! +
- + + + Supervised learning + +

+ Quando si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning. +

+

+ In particolare, i problemi risolti in questo caso sono detti: +

+ + + Problemi di binary classification se + + + Problemi di multi-class classification se + + + Problemi di regression se + + +
+ + + Unsupervised learning + +

+ Quando non si è a conoscenza del dominio dello spazio di output , il machine learning è detto supervised learning. +

+

+ In particolare, i problemi risolti in questo caso sono detti: +

+ + + Problemi di novelty detection se si cerca di capire se qualcosa è simile o nuovo rispetto agli elementi precedenti + + + Problemi di clustering se si cerca di trovare gruppi a cui potrebbero appartenere gli elementi + + +
+
+ + + Ottimizzazione + + Come un problema di ottimizzazione

- Possiamo astrarre il machine learning come il seguente problema di ottimizzazione di minimizzazione dell'errore: + Possiamo astrarre il machine learning come il seguente problema di ottimizzazione:

- +

- - - - Loss function - - - - - Complessità della funzione - - - + + Trova la funzione che minimizza gli errori sul training set e la complessità della funzione, dando opzionalmente priorità a uno dei due addendi. + +
+
+ + + + Hypothesis space + +

+ +

+

+ Spazio delle funzioni adatte a descrivere la relazione tra input e output. +

+
+ + + Loss function + +

+ +

+

+ Funzione predeterminata che determina l'errore del modello su un elemento del training set. +

+
+ + + Complessità della funzione + +

+ +

+ + Non ancora spiegato. + + + È la norma a infinito al quadrato o la norma quadratica? + +
+ + + Priorità + +

+ +

+

+ Parametro moltiplicativo predeterminato che permette di selezionare quanta importanza dare agli errori sul training set rispetto alla complessità del modello. +

+ +

+ Se minore di 1, prioritizza gli errori.
+

+

+ Se maggiore di 1, prioritizza la semplicità. +

+
+ +

+ Se troppo basso, il modello commette overfitting. +

+

+ Se troppo alto, il modello perde accuratezza. +

+