Struttura del database¶
-
class
Alert
¶ Un alert è un allarme impostato da un utente che si «attiva» quando un numero di tweet che rispetta certe condizioni (poste in and oppure or) supera una certa soglia, indicata dall’utente.
Ogni volta che l’alert si attiva, viene creata una «notifica», ovvero una entry nella tabella Notifications. Questo permette di tenere conto del numero di volte in cui l’alert viene triggerato.
Gli alert sono legati al repository di appartenenza, e quando uno di essi viene allertato viene inviata una mail all’admin e pubblicato un tweet sull’account Twitter usato per le analisi.
La tabella alert contiene le seguenti colonne:
Definizioni
id (INTEGER, PK)
l’identificativo dell’alert
name (VARCHAR, NOT NULL)
il nome dell’alert
limit (INTEGER, NOT NULL)
il numero di tweet che innescano l’alert
window_size (INTEGER, NOT NULL)
numero di ore in cui il limit può venire superato
evaluation_mode (ENUM/SMALLINT, NOT NULL)
può essere posto a all_or oppure all_not
repository_id (INTEGER, FK, NOT NULL)
-
class
Authorization
¶ Una autorizzazione è un’entità che rappresenta il permesso, concesso dal creatore del repository ad un altro utente, di ispezionare il contenuto di un repo e di eseguire analisi su di esso.
La tabella authorization contiene le seguenti colonne:
Definizioni
rid (INTEGER, PK, FK)
id del repository
email (VARCHAR, PK, FK)
email dell’utente
-
class
Composed
¶ Composed è una tabella le cui righe indicano l’appartenenza di un Tweet ad un certo repository.
La tabella Composed contiene le seguenti colonne:
Definizioni
rid (INTEGER, PK, FK)
id del repository
snowflake (VARCHAR, PK, FK)
id del tweet
-
class
Condition
¶ Una condizione è un elemento che viene usato da repository e alert per cercare e classificare i tweet.
Le condizioni possono essere di diversi tipi:
hashtag: valore
0
, richiede che il tweet contenga un dato hashtagtime: valore
2
, richiede che il tweet sia stato pubblicato prima o dopo una certa datacoordinates: valore
3
, richiede che il tweet sia stato pubblicato entro un certo raggio da delle coordinateuser: valore
5
, richiede che il tweet sia stato pubblicato da un dato utente
La tabella condition contiene le seguenti colonne:
Definizioni
id (INTEGER, PK)
id della condition
type (ENUM/SMALLINT, NOT NULL)
tipo del contenuto
content (VARCHAR, NOT NULL)
contenuto della condition
repository_id (INTEGER, FK, NOT NULL)
-
class
Contains
¶ Contains è una tabella le cui righe indicano la presenza di una certa condition rispetto ad un certo tweet.
La tabella contains contiene le seguenti colonne:
Definizioni
cid (INTEGER, PK, FK)
id della condition
snowflake (VARCHAR, PK, FK)
id del tweet
-
class
MadeOf
¶ MadeOf è una tabella le cui righe indicano il legame tra un alert e una certa condition.
La tabella madeof contiene le seguenti colonne:
Definizioni
aid (INTEGER, PK, FK)
id dell’alert
cid (INTEGER, PK, FK)
id della condition
-
class
Notification
¶ Una notification è un’entità che consente di tenere traccia del momento in cui un certo alert si è attivato per l’ultima volta.
La tabella notification contiene le seguenti colonne:
Definizioni
id (INTEGER, PK)
id della notifica
ora (TIMESTAMP, NOT NULL)
timestamp di attivazione
alert_id (INTEGER, FK, NOT NULL)
-
class
Repository
¶ Un repository è un «contenitore» di tweet, a cui sono legati alert, autorizzazioni di lettura e condizioni.
Le condizioni possono essere messe in and oppure or, inoltre un repository può venire archiviato prima divenire eliminato. Quando un repository non è archiviato, questo viene riempito di tweet su base oraria, cosa che non accade se viene archiviato.
La tabella repository contiene le seguenti colonne:
Definizioni
id (INTEGER, PK)
id del repository
name (VARCHAR, NOT NULL)
nome del repository
start (TIMESTAMP)
timestamp di partenza del repository
end (TIMESTAMP)
timestamp di chiusura del repository
is_active (BOOLEAN, NOT NULL)
flag per segnalare se il repo è aperto o meno
evaluation_mode (ENUM/SMALLINT, NOT NULL)
può essere posto a all_or oppure all_not
owner_id (VARCHAR, FK, NOT NULL)
email del proprietario
is_deleted (BOOLEAN, NOT NULL)
flag per segnalare se l’oggetto è eliminato o meno
-
class
Tweet
¶ Un tweet è un’entità che viene raccolta dal componente crawler, e quando viene inserita nella base di dati viene legata ad un repository e alle condition che contiene. Un tweet contiene informazioni relativamente a chi l’ha creato, eventuali immagini, il tempo di creazione, il tempo di inserimento nel db e l’opzionale posizione legata al tweet.
La tabella tweet contiene le seguenti colonne:
Definizioni
snowflake (VARCHAR, PK)
id univoco del tweet
content (VARCHAR)
contenuto del tweet
location (VARCHAR)
stringa contenente informazioni sulla posizione
place (VARCHAR)
riservato per sviluppi futuri
poster (VARCHAR)
informazioni sull’utente che ha creato il tweet
insert_time (TIMESTAMP, NOT NULL)
timestamp dell’inserimento del tweet
image_url (VARCHAR)
link alle immagini, se presenti
post_time (TIMESTAMP)
timestamp relativo all’invio del tweet
-
class
User
¶ Uno user è l’utilizzatore della piattaforma.
E” presente di default un utente admin, il quale può creare nuovi utenti.
La tabella user contiene le seguenti colonne:
Definizioni
email (VARCHAR, PK)
email dell’utente
username (VARCHAR, NOT NULL)
username dell’utente
password (BYTEARRAY, NOT NULL)
sale della password, codificata usando l’algoritmo bcrypt
isAdmin (BOOLEAN, NOT NULL)
true se l’utente è admin