From 182eaceea025355076ea8fb915620cc97561355c Mon Sep 17 00:00:00 2001 From: Stefano Pigozzi Date: Thu, 3 Feb 2022 02:08:09 +0100 Subject: [PATCH] Complete Architettura dei Calcolatori --- components/warnings.tsx | 11 ++ pages/_base.tsx | 22 +++ pages/index.tsx | 7 +- pages/year1/algebra.tsx | 6 +- pages/year1/analisi.tsx | 4 +- pages/year1/architettura.tsx | 100 +++++++++++ pages/year1/programmazione1.tsx | 4 +- .../year1/architettura/10_meltdown.md | 21 +++ .../year1/architettura/1_principi.md | 47 +++++ .../architettura/2_dentro_il_processore.md | 41 +++++ .../year1/architettura/3_assembly.md | 165 ++++++++++++++++++ .../year1/architettura/4_hello_world.md | 33 ++++ .../year1/architettura/5_primo_programma.md | 37 ++++ .../materials/year1/architettura/6_stack.md | 44 +++++ .../year1/architettura/7_prodotto_scalare.md | 52 ++++++ .../architettura/8_appunti_e_deduzioni.md | 57 ++++++ .../materials/year1/architettura/9_memorie.md | 133 ++++++++++++++ 17 files changed, 775 insertions(+), 9 deletions(-) create mode 100644 components/warnings.tsx create mode 100644 pages/_base.tsx create mode 100644 pages/year1/architettura.tsx create mode 100644 public/materials/year1/architettura/10_meltdown.md create mode 100644 public/materials/year1/architettura/1_principi.md create mode 100644 public/materials/year1/architettura/2_dentro_il_processore.md create mode 100644 public/materials/year1/architettura/3_assembly.md create mode 100644 public/materials/year1/architettura/4_hello_world.md create mode 100644 public/materials/year1/architettura/5_primo_programma.md create mode 100644 public/materials/year1/architettura/6_stack.md create mode 100644 public/materials/year1/architettura/7_prodotto_scalare.md create mode 100644 public/materials/year1/architettura/8_appunti_e_deduzioni.md create mode 100644 public/materials/year1/architettura/9_memorie.md diff --git a/components/warnings.tsx b/components/warnings.tsx new file mode 100644 index 0000000..ee7ccfa --- /dev/null +++ b/components/warnings.tsx @@ -0,0 +1,11 @@ +import { Panel } from "@steffo/bluelib-react" + +export const Warning = (props) => { + return ( + + + Attenzione: questi file non sono stati ricontrollati da quando sono stati scritti, e potrebbero contenere errori!
+ Usali a tuo rischio e pericolo! +
+ ) +} \ No newline at end of file diff --git a/pages/_base.tsx b/pages/_base.tsx new file mode 100644 index 0000000..1d56258 --- /dev/null +++ b/pages/_base.tsx @@ -0,0 +1,22 @@ +import { Heading, Chapter, Box, Idiomatic as I, Anchor as A, ListUnordered, ListOrdered } from '@steffo/bluelib-react' +import type { NextPage } from 'next' + +const Page: NextPage = () => { + return <> + + Titolo + + + + + Introduzione + +

+ Cose +

+
+
+ +} + +export default Page diff --git a/pages/index.tsx b/pages/index.tsx index fd88724..66b03b1 100644 --- a/pages/index.tsx +++ b/pages/index.tsx @@ -45,7 +45,7 @@ const Home: NextPage = () => { - Architettura dei calcolatori + Architettura dei calcolatori @@ -53,6 +53,11 @@ const Home: NextPage = () => { Algoritmi e strutture dati + + + Programmazione 2 + + diff --git a/pages/year1/algebra.tsx b/pages/year1/algebra.tsx index f42f931..85de26a 100644 --- a/pages/year1/algebra.tsx +++ b/pages/year1/algebra.tsx @@ -1,7 +1,7 @@ import { Heading, Chapter, Box, Idiomatic as I, Code, Anchor as A, Dialog, BringAttention as B, ListOrdered, ListUnordered} from '@steffo/bluelib-react' import type { NextPage } from 'next' -const Algebra: NextPage = () => { +const Page: NextPage = () => { return <> Analisi matematica @@ -130,12 +130,10 @@ const Algebra: NextPage = () => { - Attenzione: questi file non sono stati ricontrollati da quando sono stati scritti, e potrebbero contenere errori!
- Usali a tuo rischio e pericolo!
} -export default Algebra +export default Page diff --git a/pages/year1/analisi.tsx b/pages/year1/analisi.tsx index 8478e25..ec32fe0 100644 --- a/pages/year1/analisi.tsx +++ b/pages/year1/analisi.tsx @@ -7,7 +7,7 @@ const MaterialLi = ({children, file}) => { } -const Analisi: NextPage = () => { +const Page: NextPage = () => { return <> Analisi matematica @@ -103,4 +103,4 @@ const Analisi: NextPage = () => { } -export default Analisi +export default Page diff --git a/pages/year1/architettura.tsx b/pages/year1/architettura.tsx new file mode 100644 index 0000000..8ea53a7 --- /dev/null +++ b/pages/year1/architettura.tsx @@ -0,0 +1,100 @@ +import { Heading, Chapter, Box, Idiomatic as I, Anchor as A, UAnnotation as U, ListUnordered, BringAttention as B, ListOrdered, Definition, Code } from '@steffo/bluelib-react' +import type { NextPage } from 'next' +import Head from 'next/head' + + +const MaterialLi = ({children, file}) => { + return + {children} (.md) + +} + + +const Page: NextPage = () => { + return <> + + Architettura dei calcolatori + + + + + Introduzione + +

+ Quando ho dato Architettura dei Calcolatori, a malapena si sentiva parlare di RISC-V, e non aveva tutta la popolarità che ha ora. +

+

+ Penso si trovino risorse molto più utili per studiare il RISC-V adesso rispetto al passato! +

+
+
+ + + + Materiale realizzato + +

+ Ho glissato molto sulla parte teorica, in quanto le dispense forniteci dal prof. erano ottime. +

+ + + Principi dell'architettura dei calcolatori + + + Dentro il processore + + + Assembly + + +

+ Quando ho studiato per questo esame non si trovava quasi nulla di RISC-V su Internet o libri di testo. +

+

+ Questo è quello che ero riuscito a capire dopo vari tentativi e approfondite ricerche. +

+ + + Hello World in RISC-V + + + Primo programma RISC-V + + + Stack in RISC-V + + + Prodotto scalare in RISC-V + + +

+ Infine, un altro po' di appunti e teoria relativi all'ultima parte del corso. +

+ + + Appunti e deduzioni + + + Memorie + + + Meltdown + + +
+ + + Estensione per Visual Studio Code + +

+ Durante il corso ho anche realizzato un'estensione per Visual Studio Code che fa syntax highlighting dell'Assembly RISC-V. +

+

+ È possibile scaricarla sul Visual Studio Marketplace, e il suo codice sorgente è disponibile su GitHub. +

+
+
+ +} + +export default Page diff --git a/pages/year1/programmazione1.tsx b/pages/year1/programmazione1.tsx index 43459b1..ceb1ed6 100644 --- a/pages/year1/programmazione1.tsx +++ b/pages/year1/programmazione1.tsx @@ -14,7 +14,7 @@ import imgFjYpT1n from "../../public/images/year1/programmazione1/FjYpT1n.png" import imgklZQ9So from "../../public/images/year1/programmazione1/klZQ9So.png" import imgF6lBCqS from "../../public/images/year1/programmazione1/F6lBCqS.png" -const Programmazione1: NextPage = () => { +const Page: NextPage = () => { return <> Programmazione 1 @@ -110,4 +110,4 @@ const Programmazione1: NextPage = () => { } -export default Programmazione1 +export default Page diff --git a/public/materials/year1/architettura/10_meltdown.md b/public/materials/year1/architettura/10_meltdown.md new file mode 100644 index 0000000..e625eea --- /dev/null +++ b/public/materials/year1/architettura/10_meltdown.md @@ -0,0 +1,21 @@ +# Meltdown + +Esempio circa comprensibile: + +```c++ +int meltdown() { + bool array[2] = {false, true}; + + if( qualcosa_che_restituisce_false() ) { + //Questo viene predetto + //Durante le predizioni non ci sono segfault! + int protetto = *(indirizzo_bersaglio); + //Se il primo bit di protetto è 1, verrà caricato "true" in cache, altrimenti, verrà caricato "false", ANCHE SE E' SOLO UNA PREDIZIONE! + //Dopo essere stato caricato, NON VIENE RIMOSSO, anche se la predizione è sbagliata. + int caricato = array[protetto & 1]; + } + + if( in_cache(true) ) cout << "Il primo bit del bersaglio è 1.\n"; + else cout << "Il primo bit del bersaglio è 0.\n"; +} +``` \ No newline at end of file diff --git a/public/materials/year1/architettura/1_principi.md b/public/materials/year1/architettura/1_principi.md new file mode 100644 index 0000000..6ab0c93 --- /dev/null +++ b/public/materials/year1/architettura/1_principi.md @@ -0,0 +1,47 @@ +# I principi dell'architettura dei calcolatori + +## Gli otto grandi principi + +- Progetta per la **Legge di Moore** +- **Astrai** per semplificare il design +- Velocizza i **casi più comuni** +- Sfrutta il **parallelismo** + - Instruction level parallelism + - In una sola CPU vengono realizzati più calcoli in parallelo +- Sfrutta le **pipeline** + - Pipelining + - Separare le azioni del processore in fasi + - Il fetch è separato dal decoding, mentre decodifico un'istruzione posso già fetchare quell'altra +- **Prevedi** le istruzioni successive +- **Gerarchizza** le memorie per velocità di accesso + - La CPU cerca sempre di accedere alle memorie più veloci +- Rendi affidabile con la **ridondanza** + +### Parallelismo + +> Chiedo a 100 persone di fare una moltiplicazione ciascuna invece che fare 100 moltiplicazioni io da solo + +### Pipelining + +![Senza](https://upload.wikimedia.org/wikipedia/commons/2/2c/Nopipeline.png) + +![Con](https://upload.wikimedia.org/wikipedia/commons/2/21/Fivestagespipeline.png) + +### Gerarchia delle memorie + +> Hit or miss? I hope they never miss. + +La CPU prova sempre ad accedere alle memorie più in alto di questa lista, effettuando un **hit** se trova i dati che le servono in una data memoria ed effettuando un **miss** se invece non trova i dati necessari e deve accedere a uno strato inferiore. + +- [Cache](https://it.wikipedia.org/wiki/Cache) (piccolissima e velocissima) +- [Random Access Memory](https://it.wikipedia.org/wiki/RAM) (piccola e veloce) +- [Solid State Drive]() (medio e di media velocità) +- [Hard Disk Drive](https://it.wikipedia.org/wiki/Disco_rigido) (grosso, ma lento) +- [Tape storage](https://en.wikipedia.org/wiki/Magnetic_tape_data_storage) (enorme, ma lentissimo) + +I _miss_ rallentano l'esecuzione dei programmi, in quanto causano ritardi nel ritrovamento dei dati, passando da _meno di 1 µs_ per le cache a _più di 1 ms_ per gli hard disk. + +Inoltre, esistono due tipi di cache, anch'essi gerarchizzati: + +- [SRAM](https://it.wikipedia.org/wiki/SRAM) +- [DRAM](https://it.wikipedia.org/wiki/DRAM) diff --git a/public/materials/year1/architettura/2_dentro_il_processore.md b/public/materials/year1/architettura/2_dentro_il_processore.md new file mode 100644 index 0000000..f7a8d96 --- /dev/null +++ b/public/materials/year1/architettura/2_dentro_il_processore.md @@ -0,0 +1,41 @@ +# Dentro il processore + +## Come sono fatti i circuiti integrati? + +Sono composti da un layer di silicio (semiconduttore), più delle maschere di conduttori (µfili metallici), isolanti (plastica e vetro) e transistor. + +### Processo di produzione + +- Lingotto di silicio +- Tagliato in _wafer_ da 2mm +- Creazione dei _patterned wafer_ +- Testing dei _patterned wafer_ +- Taglio i _tested wafers_ +- Creo un package con i _tested dies_ +- Testo i _packaged dies_ +- Spedisco i _tested packaged dies_ ai clienti. + +### Lo yield + +Lo yield è quanti _tested packaged dies_ riesco a produrre da un singolo lingotto di silicio. + +## Come definiamo la performance di un processore? + +Ci sono varie metriche per definirla: + +- **Response time**: tempo impiegato a compiere un'operazione +- **Throughput**: operazioni fatte in un'unità di tempo + +### Il clock + +Il clock della CPU è il timer che scandisce le operazioni della CPU. + +Ha, ovviamente, un periodo e una frequenza costanti. + +### Il CPU time + +Il tempo impiegato da una CPU a compiere una determinata operazione è dato da `numero di cicli di clock richiesti * periodo di clock`, ed è detto **CPU time**. + +### Il Cost per instruction (CPI) + +Alcune istruzioni di una CPU potrebbero richiedere più di un ciclo di clock. diff --git a/public/materials/year1/architettura/3_assembly.md b/public/materials/year1/architettura/3_assembly.md new file mode 100644 index 0000000..6f29544 --- /dev/null +++ b/public/materials/year1/architettura/3_assembly.md @@ -0,0 +1,165 @@ +# Assembly + +Useremo il RISC-V. +Esso è little-endian, ed è indirizzato a gruppi di 8 bit. + +## Registri + +RISC-V ha a disposizione **32** registri da 64 bit, che vanno da `x0` a `x31`. + +Un dato a 32 bit viene chiamato **word**, uno a 64 bit viene chiamato **doubleword**. + +- `x0`: costante +- `x1`: indirizzo risultato +- `x2`: indirizzo della cima dello stack +- `x3`: indirizzo dell'area di memoria con variabili globali +- `x4`: indirizzo dell'area di memoria specifica del thread attivo +- `x5`: registro temporaneo +- `x6`: registro temporaneo +- `x7`: registro temporaneo +- `x8`: frame pointer +- `x9`: registro salvato, può essere copiato in memoria +- `x10`: argomento o risultato delle funzioni +- `x11`: argomento o risultato delle funzioni +- `x12`: argomento delle funzioni +- `x13`: argomento delle funzioni +- `x14`: argomento delle funzioni +- `x15`: argomento delle funzioni +- `x16`: argomento delle funzioni +- `x17`: argomento delle funzioni +- `x18`: registro salvato, può essere copiato in memoria +- `x19`: registro salvato, può essere copiato in memoria +- `x20`: registro salvato, può essere copiato in memoria +- `x21`: registro salvato, può essere copiato in memoria +- `x22`: registro salvato, può essere copiato in memoria +- `x23`: registro salvato, può essere copiato in memoria +- `x24`: registro salvato, può essere copiato in memoria +- `x25`: registro salvato, può essere copiato in memoria +- `x26`: registro salvato, può essere copiato in memoria +- `x27`: registro salvato, può essere copiato in memoria +- `x28`: registro temporaneo +- `x29`: registro temporaneo +- `x30`: registro temporaneo +- `x31`: registro temporaneo + +## Operazioni + +### Operazioni aritmetiche + +Sono sempre formate da tre operandi: registro a cui il risultato verrà assegnato e gli argomenti dell'operazione. + +- `add`: addizione +- `sub`: sottrazione +- `addi`: addizione di costanti + +#### Esempio + +```assembly +add a, b, c +``` + +##### Equivalente Python + +```python +a = b + c +``` + +### Operazioni di trasferimento dati + +Permettono di caricre / scaricare dati dalla memoria. + +### Operazioni logiche + +Consentono di effettuare operazioni di logica. + +- `and` +- `or` +- ... + +### Operazioni di shift + +Consentono di spostare i bit di un registro di alcune posizioni, moltiplicando o dividendo effettivamente per potenze di 2. + +### Operazioni condizionali + +Consentono di saltare ad un'altra serie di istruzioni se certe condizioni si verificano. + +- `blt`: minore di, signed +- `bge`: maggiore di, signed +- `bltu`: minore di, unsigned +- `bgeu`: maggiore di, unsigned + +### Operazioni non-condizionali + +Consentono di saltare ad un'altra serie di istruzioni in qualunque caso. + +#### Chiamare una procedura + +> `jal x1, ProcedureLabel` + +Salva l'indirizzo dell'istruzione successiva in x1, poi salta a ProcedureLabel. + +#### Ritornare da una procedura + +> `jalr x0, 0(x1)` + +Ritorna all'indirizzo puntato da `x1`. + +## Memoria + +Per accedere a una posizione in memoria, si usa `offset(indirizzo)`. + +##### Esempio + +`64(x22)` accede al 64° byte dopo la posizione di memoria archiviata in `x22`. + +## Segni + +E' possibile usare rappresentazione standard o a complemento-a-2. + +Possiamo usare la **sign extension** quando abbiamo un dato che vogliamo portare a un numero di bit maggiore di quello che è. + +##### Esempio + +``` +[0]101 0101 --> 0000 0000 [0]101 0101 +[1]100 0000 --> 1111 1111 [1]100 0000 +``` + +### Operazioni di sincronizzazione + +- `lr`: load reserved +- `sc`: store conditional + +#### Load reserved + +``` +lr rd, (rs1) +``` + +> Non ho la minima idea di come funzioni. + +Controlla se `rs1` è bloccato; se sì, mette un valore != 0 in `rd`...? + +> Forse... crea un lock in `rd`? + +#### Store conditional + +``` +sc rd, rs2, (rs1) +``` + +> Non ho la minima idea di come funzioni. + +Copia il dato da `rs2` a `rs1`, se non è bloccato, e metti `x0` in `rd`...? + +> Carica un dato... se ho ancora il lock, altrimenti, metti `x0` in `rd`. + +#### Unlock + +``` +sd x0, 0(x20) +``` + +## Operazioni floating point + diff --git a/public/materials/year1/architettura/4_hello_world.md b/public/materials/year1/architettura/4_hello_world.md new file mode 100644 index 0000000..8ab80d8 --- /dev/null +++ b/public/materials/year1/architettura/4_hello_world.md @@ -0,0 +1,33 @@ +# Hello world in RISC-V + +```riscv +# Definisci delle costanti +.equ _SYS_EXIT, 93 # Syscall exit +.equ _SYS_WRITE, 64 # Syscall write + +# Inizio del programma +.global _start + +# Variabili statichie inizializzate a 0 +.section .bss + +# Dati modificabili +.section .data + +# Dati in sola lettura +.section .rodata + msg: .string "Hello mondo!\n" + +# Testo del programma +.section .text + _start: + # Chiamata a WRITE(stream, primocarattere, lunghezza) + li a0, 0 # Print to stdout + la a1, msg # Stampa il messaggio in msg + li a2, 13 # Stampa 13 caratteri dopo msg + li a7, _SYS_WRITE # Seleziona la syscall WRITE + ecall + + li a7, _SYS_EXIT + ecall +``` diff --git a/public/materials/year1/architettura/5_primo_programma.md b/public/materials/year1/architettura/5_primo_programma.md new file mode 100644 index 0000000..1802899 --- /dev/null +++ b/public/materials/year1/architettura/5_primo_programma.md @@ -0,0 +1,37 @@ +# Primo programma in RISC-V + +```riscv +# Che bello! Adoro l'assembly! +# Questo programma funziona, è verificato! +.global _start + +# La sezione .data contiene i dati del programma +.section .data + + # Creo una variabile con etichetta "ciao" + ciao: .string "0\n\0" + +# La sezione .rodata contiene i dati del programma in sola lettura +.section .rodata + +# La sezione .text contiene il testo del programma +.section .text + + # Creo una label _start che funzionerà da entrypoint + _start: + li t1, 10 # Voglio ripetere il ciclo 10 volte + li a7, 64 # PRINT(stream, indirizzo, numerobytes) è la syscall 64 + li a0, 0 # stream è il primo argomento: vogliamo scrivere su stdout (0) + la a1, ciao # indirizzo è il secondo argomento: partiamo dall'etichetta ciao + li a2, 2 # numerobytes è il terzo argomento: vogliamo stampare 2 bytes + print: + ecall # PRINT(a0, a1, a2) + lbu t0, 0(a1) # Carica il byte con il 0 + addi t0, t0, 1 # Aggiungici 1 + sb t0, 0(a1) # Ricaricalo in memoria + addi t1, t1, -1 # Togli 1 dal numero di cicli rimasti + bne t1, zero, print # Se rimangono dei cicli, torna indietro e falli! + end: + li a7, 93 # Tutti i programmi terminano chiamando la syscall 93, EXIT() + ecall # EXIT() +``` \ No newline at end of file diff --git a/public/materials/year1/architettura/6_stack.md b/public/materials/year1/architettura/6_stack.md new file mode 100644 index 0000000..6b2943b --- /dev/null +++ b/public/materials/year1/architettura/6_stack.md @@ -0,0 +1,44 @@ +# Stack in RISC-V + +```riscv +# Che bello! Adoro l'assembly! +# Funziona! +.global _start + +# La sezione .data contiene i dati del programma +.section .data + +# La sezione .rodata contiene i dati del programma in sola lettura +.section .rodata + +# La sezione .text contiene il testo del programma +.section .text + + # Creo una label _start che funzionerà da entrypoint + _start: + li s0, 5 # Scrivi il numero 5 + li s3, 3 # COSTANTE: 3 + + # Pushing phase + pushing: + sb s0, 0(sp) # Metti nello stack s0 + addi sp, sp, 1 # Aumenta di 1 lo stack pointer + addi s2, s2, 1 # Aumenta di 1 la dimensione dello stack + addi s0, s0, -1 # Diminuisci di 1 il numero da fattorializzare + bgeu s0, s3, pushing # Continua a pushare finchè non arrivi a 2 + li s1, 2 + + # Popping phase + popping: + addi sp, sp, -1 # Diminuisci di 1 lo stack pointer + # Attenzione: diminuisco lo stack pointer PRIMA di caricare dallo stack, altrimenti caricarei il nulla + lb s0, 0(sp) # Prendi dallo stack il prossimo numero + addi s2, s2, -1 # Diminuisci di 1 la dimensione dello stack + mul s1, s1, s0 # Effettua la moltiplicazione + bne s2, zero, popping # Se ci sono altri valori nello stack, continua a moltiplicare + + # Ending phase + ending: + li a7, 93 + ecall +``` diff --git a/public/materials/year1/architettura/7_prodotto_scalare.md b/public/materials/year1/architettura/7_prodotto_scalare.md new file mode 100644 index 0000000..3cb6930 --- /dev/null +++ b/public/materials/year1/architettura/7_prodotto_scalare.md @@ -0,0 +1,52 @@ +# Prodotto scalare in RISC-V + +```riscv +# Che bello! Adoro l'assembly! +# Ommioddiofunzionawowimawizard +.global _start + +# La sezione .data contiene i dati del programma +.section .data + + primo: .word 1, 2, 3, 4, 5 + secondo: .word 1, 2, 3, 4, 5 + +# La sezione .rodata contiene i dati del programma in sola lettura +.section .rodata + +# La sezione .text contiene il testo del programma +.section .text + + # s0: primo[s0] + # s1: secondo[s0] + # s2: monomio + # s3: indirizzo da cui prendere il valore + # s4: indice + # s5: dimensione array + # a0: somma + + _start: + li s2, 0 + li a0, 0 + li s4, 0 + li s5, 5 + + somma: + la s3, primo + add s3, s3, s4 + lw s0, 0(s3) + + la s3, secondo + add s3, s3, s4 + lw s1, 0(s3) + + mulw s2, s1, s0 + add a0, a0, s2 + addi s4, s4, 4 + addi s5, s5, -1 + bne zero, s5, somma + + _end: + li a7, 93 + ecall +``` diff --git a/public/materials/year1/architettura/8_appunti_e_deduzioni.md b/public/materials/year1/architettura/8_appunti_e_deduzioni.md new file mode 100644 index 0000000..be4d540 --- /dev/null +++ b/public/materials/year1/architettura/8_appunti_e_deduzioni.md @@ -0,0 +1,57 @@ +# Appunti + +## Registri + +I registri sono divisi in tre tipi: di **proprietà del chiamante**, di **proprietà del chiamato** (anche se in realtà è solo una convenzione) e... gli **altri**. + +Tutti i registri sono grandi 64 bit: possono quindi contenere una _doubleword_. + +### Proprietà del chiamante + +Questi registri **non devono essere sovrascritti** quando viene chiamata una funzione, o se vengono sovrascritti, **devono essere ripristinati** prima che la funzione restituisca. + +Essi sono: +- `s1..s11`: **Saved** registers, registri generici che possono essere usati per qualsiasi cosa. +- `sp`: **Stack Pointer**, il primo indirizzo dello stack disponibile per la scrittura. Va _decrementato_ quando si aggiunge qualcosa allo stack. +- `fp`: **Frame Pointer**, punta all'inizio dello stack. + +### Proprietà del chiamato + +Questi registri **possono essere sovrascritti** quando viene chiamata una funzione: bisogna salvarli in memoria prima di chiamarla! + +Essi sono: +- `t0..t6`: **Temporary** registers, registri generici che possono essere usati per qualsiasi cosa. +- `ra`: **Return Address**, l'indirizzo a cui continuare l'esecuzione del programma dopo aver terminato una funzione. _Solitamente si usa solo con `jal` e `jalr`!_ +- `a0..a7`: Function **Arguments**. Se all'interno di una funzione, contengono gli argomenti che sono stati passati. Se all'esterno di una funzione, contengono i valori restituiti dall'ultima funzione chiamata. + +### Altri + +- `zero`: **Zero**, registro che vale sempre 0, anche dopo essere stato sovrascritto da altro. Come `/dev/null` su Linux. +- `gp`: **Global Pointer**, punta a un indirizzo _[(?)](https://groups.google.com/a/groups.riscv.org/forum/#!topic/sw-dev/60IdaZj27dY)_ +- `tp`: **Thread Pointer**, punta al thread-local storage _[(?)](https://groups.google.com/a/groups.riscv.org/d/msg/sw-dev/cov47bNy5gY/zLnlKkw9CQAJ)_ +- `pc`: **Program Counter**, punta all'istruzione che sta venendo eseguita. + +## Comandi preprocessore + +Scrivendo file assembly per RISC-V, è possibile aggiungere direttive per il preprocessore. + +Per ora ho scoperto queste: + +- `.global INDIRIZZO`: definisce l'indirizzo a cui inizia il programma. _(Forse setta il `gp` a quell'indirizzo?)_ +- `.equ NOME, VALORE`: definisce una costante con uno specifico nome. _Il nome delle costanti dovrebbe iniziare sempre con un underscore per convenzione._ +- `.section [.data|.rodata|.bss|.text]`: marca l'inizio di una specifica sezione del programma. Le sezioni sono: + - `.data`: Variabili del programma + - `.rodata`: Variabili sola lettura del programma + - `[.bss](https://en.wikipedia.org/wiki/.bss)`: Variabili statiche non costanti non inizializzate a nessun valore. _A volte, vengono inizializzate a 0. Solo a volte. Dipende dall'OS._ + - `.text`: Il testo del programma, con le istruzioni in assembly. +- `.TIPOVARIABILE`: crea una variabile di quel tipo e la inizializza a qualcosa. + +# Link utili + +- [algo.ing.unimo.it](http://algo.ing.unimo.it/people/andrea/Didattica/Architetture/index.html) +- [wikichip.org](https://en.wikichip.org/wiki/risc-v) +- [en.wikiversity.org](https://en.wikiversity.org/wiki/Computer_architecture) +- [it.wikiversity.org](https://it.wikiversity.org/wiki/Materia:Architetture_degli_elaboratori) +- [stackoverflow.com](https://stackoverflow.com/questions/tagged/riscv) +- [softwareengineering.stackexchange.com](https://softwareengineering.stackexchange.com/questions/tagged/assembly) +- [rv8.io](https://rv8.io/isa.html) diff --git a/public/materials/year1/architettura/9_memorie.md b/public/materials/year1/architettura/9_memorie.md new file mode 100644 index 0000000..215ca12 --- /dev/null +++ b/public/materials/year1/architettura/9_memorie.md @@ -0,0 +1,133 @@ +# Memorie + +La _memoria_ di un calcolatore solitamente è composta da molteplici strati, realizzati per velocizzare gli accessi. + +Ogni strato offre lettura più veloce, ma è più costoso da realizzare e ha consumi più alti. + +In ordine di velocità, sono: + +- Registers +- Cache L1 +- Cache L2 +- Cache L`X` +- Random Access Memory +- Solid State Drive +- Hard Disk Drive + +## Cache + +### Cache L1 + +Piccola, ma miss penalty bassa + +### Cache L2 + +Molto grande, ma miss penalty alta + +### Direct mapping + +Una cache _direct mapped_ associa a ogni indirizzo di RAM un **indice** uguale agli **N bit meno significativi** dell'indirizzo dell'inferiore, e un **tag** uguale agli **N bit più significativi**. + +Se durante un accesso _il tag di un blocco è diverso dal tag dell'indirizzo a cui vogliamo accedere_, si ha un cache miss. + +> Il dato di cui abbiamo bisogno è contenuto nell'indirizzo `0x0ABC` della RAM. +> Il suo indice sarà `0xBC`, e il suo tag sarà `0x0A`. +> Essendo la cache vuota all'inizio, viene immediatamente caricato. +> +> Voglio poi accedere all'indirizzo `0x0BBC` della RAM. +> Controlliamo il blocco con indice `0xBC`: il suo tag è `0x0A`, ma noi stiamo cercando `0x0B`! Si ha quindi un cache miss, e devo andare a prendere dalla memoria il dato che sto cercando e scriverlo sulla RAM. + +Inoltre, in ogni blocco di memoria della cache è presente **un bit di validità**, che rappresenta se il dato in cache è stato inizializzato o no: parte da `0` e viene impostato a `1` quando viene caricato dalla RAM un dato nel relativo blocco. + +> Un esempio potrebbe essere un processore con blocchi di memoria da 32 bit e indirizzi a 64 bit: la cache, contenente 1024 blocchi di memoria, avrà index a 12 bit, e di conseguenza il tag sarà grande 52 bit. + +#### Dimensione blocchi + +Fare blocchi grandi o fare blocchi piccoli ha significative differenze sulla velocità della cache: + +Avere blocchi più grandi significa che ci saranno meno blocchi in tutta la cache, quindi: + +```diff ++ Riduce il miss rate per il principio di località spaziale +- Avendo una quantità minore di blocchi, aumenta la possibilità di conflitto +- La miss penalty è più alta +# La miss penalty è compensabile con tecniche come early restart o critical-word-first +``` + +Con blocchi più piccoli, invece +```diff ++ Miss penalty minore ++ Più blocchi significa meno conflitti +- E' possibile che abbia bisogno di fare più di una richiesta alla cache, rallentandola significativamente +``` + +#### Scrittura tramite cache + +Quando scrivo in memoria un dato presente nella cache, l'informazione presente nella cache diventa errata. + +Si può risolvere questo problema con una politica di riscrittura: +- Write-through +- Write-back + +##### Write-through + +_Quando **viene scritto** su dato in cache_, aggiorna tutte le memorie che lo contengono. + +```diff ++ Non necessita di ulteriore memoria di cache ++ Caricare dati è veloce ++ Se si verifica un write miss non ha per forza bisogno di portare in cache il dato da scrivere +- I write richiedono molto più tempo, soprattutto se ripetuti +``` + + +##### Write-back + +Scrivi la modifica di dato solo nella cache, e _marca il blocco come **dirty**_. + +Quando un blocco dirty viene **sovrascritto**, aggiorna le memorie che lo contengono. + +```diff ++ I write richiedono poco tempo, anche se ripetuti +- Caricare dati dalla RAM è più lento +- Necessita di memoria da dedicare al dirty bit +- Devo fetchare obbligatoriamente i dati da sovrascrivere +``` + +##### Miglioramenti alle policy + +E' possibile utilizzare un **write buffer** invece che fare attendere il tempo di scrittura alla CPU. I dati saranno scritti successivamente, ma prima che questi vengano utilizzati. + +```diff ++ Il processore non ha bisogno di fermarsi per le write +- Il buffer potrebbe riempirsi, neganode i vantaggi +- Il buffer utilizza memoria che forse sarebbe stata più utile come cache +``` + +### Fully associative + +Ogni dato può essere messo in qualunque indirizzo della cache. + +Richiede che l'indirizzo di origine venga salvato assieme al dato, e tanti comparatori. + +### Set associative + +Divido tutti i blocchi di cache in vie. + +Ogni via può contenere `n` dati. + +Un set è l'insieme dei dati che hanno lo stesso index ma sono in vie diverse. + +Ogni dato può essere messo in qualunque indirizzo del set a cui appartiene. + +Identifico il numero di set di appartenenza facendo `indirizzo % numerodiset`. + +Una cache `1`-way Set Associative è una cache Direct Mapped, mentre una cache `numeroentries`-way Set Associative è una cache Fully Associative. + +Quando non c'è spazio in un set, rimpiazzo un dato secondo la politica **Least Recently Used**, rimuovendo il dato usato meno recentemente. Posso usare anche la politica **Random**, se ho un'alta associatività. + +#### Performance + +Più una cache è associativa, più il miss rate sarà ridotto, ma l'associatività richiede un maggior numero di comparatori e potenzialmente più ritardi nella restituzione del dato. + +Inoltre, la percentuale di miss non diminuisce linearmente con il numero di vie: dopo un certo numero di vie, i guadagni sono molto ridotti.