diff --git a/datoderivato.md b/datoderivato.md new file mode 100644 index 0000000..fa1e05f --- /dev/null +++ b/datoderivato.md @@ -0,0 +1,71 @@ +# Caso di studio: aggiunta di un dato derivato + +In `alexandria` non sono presenti molti dati quantitativi: la maggior parte delle proprietà sono infatti qualitative, e come tali descritte da stringhe. Un dato derivato aggiungibile, però, è il numero di libri, film o videogame presenti nella libreria multimediale di un utente. + +![](img/datoderivato.png) + +Per sapere se conviene mantenere questo dato derivato, effettuiamo un'analisi dei costi: + +## Analisi dei costi + +*(Ndr: in seguito verranno calcolati i costi di mantenimento solo di uno dei tre dati derivati, perché il costo e il procedimento sono sempre gli stessi.)* + +Valuteremo il costo di due operazioni: +- Operazione 1: Inserimento di un nuovo libro/film/videogame nella tabella +- Operazione 2: Visualizzazione dei dati di un utente, compreso il numero di libri/film/videogame presenti nella sua libreria multimediale + +Le tabelle dei volumi sono state create in base a statistiche trovate ricercando online: Ogni anno in media una persona legge 12 libri, guarda 60 film e compra 24 videogame, per un totale di 96 elementi per ogni utente, circa. Immaginandoci 100 utenti, avremo quindi 9600 elementi: + +| Concetto | Tipo | Volume | +|----------|:----:|-------:| +| Utente | E | 100 | +| Elemento | E | 9600 | + +La tabella degli accessi non sarà ricavata: i dati verranno analizzati in funzione di quest'ultima come conclusione. + + +### Con dato derivato: +Operazione 1: Inserisco una nuova tupla nella tabella Elemento, e poi aggiorno l'apposito attributo nella tabella Utente, passando per l'associazione Possiede. + +Ogni elemento è posseduto da un unico utente, quindi l'associazione in questo caso è 1 a 1. Ne segue che occorreranno un aggiornamento per Possiede e uno per Utente, quindi due aggiornamenti in tutto. + +1 write + (2 read + 2 write) = 7 per operazione + +Operazione 2: Leggo il dato dalla tabella Utente + +1 read = 1 + +### Senza dato derivato: +*Operazione 1*: Inserisco una nuova tupla nella tabella elemento, senza aggiornare altro + +1 write = 2 per operazione + +Operazione 2: Passando per l'associazione Possiede, calcolo la quantità di elementi del tipo desiderato. Poniamo che, per calcolare la quantità di elementi che soddisfano una condizione, sia necessario e sufficiente leggerli tutti. + +Ogni utente possiede in media N elementi, quindi occorreranno un numero 2*N di operazioni read (N per l'associazione e N per l'entità). N, ossia la cardinalità di passaggio, verrà calcolato in base alla tabella dei volumi fra Utente e Possiede: + +Card(Utente -> Possiede) = Vol(Possiede) / Vol(Utente) + +Vol(Utente) = 100 + +Vol(Possiede) = Vol (Elemento) = 9600 + +Card(Utente -> Possiede) = 9600 / 100 = 96 + +Il costo sarà quindi + +96 read = 96 per operazione + +## Risultato finale + +Abbiamo calcolato i costi singoli di ciascuna operazione, adesso calcoliamo quale rapporto devono avere le due operazioni perché convenga il dato derivato. + +Al momento abbiamo queste due equazioni che rappresentano i costi totali: + +CostoCon: 7 * Op1 + 2 * Op2 + +CostoSenza: 2 * Op1 + 96 * Op2 + +Dove Op1 e Op2 sono rispettivamente la frequenza di esecuzione dell'operazione 1 e dell'operazione 2, e CostoCon e Costosenza sono le equazioni dei costi con e senza il dato derivato. + +Ponendo CostoCon < CostoSenza e facendo tutti i calcoli del caso, risulta che il rapporto fra Op1 e Op2 deve essere strettamente minore di 94/5. Ne consegue che, perché convenga tenere il dato derivato, le operazioni di inserimento di un nuovo dato devono essere al massimo 19 volte di più delle operazioni di visualizzazione. \ No newline at end of file diff --git a/img/datoderivato.png b/img/datoderivato.png new file mode 100644 index 0000000..fbf3265 Binary files /dev/null and b/img/datoderivato.png differ