Make more progress

2025-02-18 15:14:00 +00:00 · 2023-02-03 03:24:23 +01:00 · 2023-02-03 03:24:23 +01:00 · f7ef9b5ac2
commit f7ef9b5ac2
parent 32cd81bca6
3 changed files with 76 additions and 9 deletions
--- a/.idea/inspectionProfiles/Project_Default.xml
+++ b/.idea/inspectionProfiles/Project_Default.xml
@ -17,5 +17,10 @@
        </list>
      </option>
    </inspection_tool>
    <inspection_tool class="SpellCheckingInspection" enabled="false" level="TYPO" enabled_by_default="false">
      <option name="processCode" value="true" />
      <option name="processLiterals" value="true" />
      <option name="processComments" value="true" />
    </inspection_tool>
  </profile>
 </component>
--- a/README.md
+++ b/README.md
@ -1,6 +1,6 @@
-[ Stefano Pigozzi | Tema Text Analytics | Big Data Analytics | A.A. 2022/2023 | Unimore ]
+[ Stefano Pigozzi | Traccia #3 | Tema Text Analytics | Big Data Analytics | A.A. 2022/2023 | Unimore ]
-# WIP
+# Confronto tra modelli di sentiment analysis per recensioni Amazon
 > ### Sentiment analysis su recensioni Amazon
 >
@ -25,3 +25,65 @@
 > Per quanto riguarda il codice Python, è possibile (e gradito) produrre e consegnare un notebook jupyter .ipynb
 > (https://jupyter.org/) invece di codice .py e relativi commenti separati su PDF (per comodità di consultazione,
 > consegnare comunque anche una stampa PDF del notebook oltre al notebook stesso).
 ## Premessa
 ### Codice
 Il codice dell'attività è incluso come package Python compatibile con PEP518.
 Per installare il package, è sufficiente eseguire i seguenti comandi dall'interno della directory del progetto:
 ```console
 $ python -m venv .venv
 $ source venv/bin/activate
 $ pip install .
 ```
 #### NLTK
 NLTK richiede dipendenze aggiuntive per funzionare, che possono essere scaricate eseguendo il seguente comando su console:
 ```console
 $ ./scripts/download-nltk.sh
 ```
 ### Dataset
 Il codice dell'attività richiede la connessione a un server MongoDB 6 contenente il dataset di recensioni Amazon fornito a lezione.
 Si forniscono alcuni script nella cartella `./data/scripts` per facilitare la configurazione e l'esecuzione di quest'ultimo.
 Per eseguire il database MongoDB come processo utente, salvando i dati nella cartella `./data/db`:
 ```console
 $ ./data/scripts/run-db.sh
 ```
 Per importare il dataset `./data/raw/reviewsexport.json` fornito a lezione nel database MongoDB:
 ```console
 $ ./data/scripts/import-db.sh
 ```
 Per creare indici MongoDB utili al funzionamento efficiente del codice:
 ```console
 $ mongosh < ./data/scripts/index-db.js
 ```
 ## Introduzione
 <!-- TODO -->
 ## `base`: Costruzione dell'impalcatura necessaria al confronto
 <!-- TODO -->
 ## `vanilla`: Ricostruzione e ottimizzazione del modello basato su `nltk.sentiment` realizzato a lezione
 Per avere un modello baseline con cui effettuare un confronto, si è ricostruito un modello basato su `nltk.sentiment` ispirato a quello realizzato a lezione.
 <!-- TODO -->
 ## TODO
--- a/data/scripts/index-db.mongodb
+++ b/data/scripts/index-db.mongodb