{"version":3,"sources":["webpack:///./routes/GestioneDellInformazione/06_InformationContent.js","webpack:///./routes/GestioneDellInformazione/05_Thesaurus.js","webpack:///./routes/GestioneDellInformazione/08_Indexing.js","webpack:///./components/Example.less","webpack:///./routes/GestioneDellInformazione/index.js","webpack:///./routes/GestioneDellInformazione/04_DocumentProcessing.js","webpack:///./routes/GestioneDellInformazione/02_Similarity.js","webpack:///./components/ToBeContinued.js","webpack:///./routes/GestioneDellInformazione/07_AnalisiLessicale.js","webpack:///./routes/GestioneDellInformazione/01_InformationRetrival.js","webpack:///./components/Example.js","webpack:///./routes/GestioneDellInformazione/09_Modeling.js","webpack:///./routes/GestioneDellInformazione/03_Queries.js","webpack:///./routes/GestioneDellInformazione/00_Intro.js","webpack:///./routes/GestioneDellInformazione/10_Evaluation.js"],"names":["r","String","raw","title","href","module","exports","props","color","BoxColors","YELLOW","children","class","style","example","language"],"mappings":"2JAGA,MAAMA,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,+BACZ,EAAC,IAAD,CAAOA,MAAO,yBACV,6FACmF,EAAC,IAAD,KAASH,EAAT,OAAW,OAD9F,OAC8G,0BAD9G,IACiI,EAAC,IAAD,KAASA,EAAT,OAAW,UAD5I,WACmK,6EADnK,4CAGA,4DACkD,EAAC,IAAD,KAASA,EAAT,OAAW,OAD7D,MAIJ,EAAC,IAAD,CAAOG,MAAO,uBACV,yBACe,6BADf,6BAC8D,EAAC,IAAD,KAASH,EAAT,OAAW,OADzE,QAC0F,wBAD1F,0BAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;yBAGX,4BACkB,uBADlB,MACoC,sCADpC,W,6DCzBpB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASG,MAAO,aACZ,EAAC,IAAD,CAAOA,MAAO,UACV,iBACO,8BADP,iDAGA,EAAC,IAAD,iEAC6D,EAAC,IAAD,CAAMC,KAAM,yCAAZ,aAD7D,KACoI,EAAC,IAAD,CAAMA,KAAM,6CAAZ,UADpI,MAC6M,EAAC,IAAD,CAAMA,KAAM,8CAAZ,kBAD7M,KAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAMA,KAAM,kCAAZ,WADJ,0DACuH,EAAC,IAAD,CAAMA,KAAM,kDAAZ,qBADvH,0D,4ICdpB,MAAMJ,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,kBACZ,EAAC,IAAD,CAAOA,MAAO,kBACV,kBACQ,6BADR,qDAC+E,qBAD/E,MAC+F,2BAD/F,KAGA,eACI,iCADJ,8CAGA,yBACe,0BADf,SACuC,gCADvC,eAC2E,oBAD3E,mCACuH,+CADvH,KACgK,2BADhK,MAGA,oEAC0D,0CAD1D,oCAKR,EAAC,IAAD,CAASA,MAAO,+BACZ,EAAC,IAAD,CAAOA,MAAO,gBACV,sEAC4D,iCAD5D,uBAGA,EAAC,IAAD,KAAOH,EAAP,OAAS;;;;0BAMb,EAAC,IAAD,CAAOG,MAAO,QACV,sEAC4D,4CAD5D,MAGA,YACI,uCAA4B,uCAA5B,KACA,yCAA8B,uBAA9B,qCAA+E,2BAA/E,MAEJ,EAAC,IAAD,KAAOH,EAAP,OAAS;;;;;;;;;;;;;;0BAgBb,EAAC,IAAD,CAAOG,MAAO,WACV,6DACmD,6CADnD,8BACmH,+CADnH,KAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,iEAAZ,kCAEJ,EAAC,IAAD,2BACuB,EAAC,IAAD,CAAUA,KAAM,eAAhB,gBADvB,OAKR,EAAC,IAAD,CAASD,MAAO,wBACZ,EAAC,IAAD,CAAOA,MAAO,SACV,YACI,YAAI,gCAAJ,gBAAyC,8BAAzC,0CACA,YAAI,mCAAJ,QAAoC,yCAApC,qBACA,YAAI,sCAAJ,kGAAiI,8CAErI,iHAGA,EAAC,IAAD,gF,2CCnFpBE,EAAOC,QAAU,CAAC,IAAM,aAAa,OAAS,gBAAgB,OAAS,gBAAgB,KAAO,cAAc,KAAO,cAAc,KAAO,cAAc,QAAU,iBAAiB,QAAU,mB,oCCD3L,2JAae,qBACX,OACI,aACI,0CACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,S,6DC3BZ,kDAOe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASH,MAAO,uBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,kBACQ,wBADR,iDAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,wBACV,qDAC2C,gCAD3C,KACqE,oBADrE,MAGA,+CACqC,kCADrC,QACoE,mBADpE,uBACmG,oBADnG,KAGA,uFAC6E,wCAD7E,OAIJ,EAAC,IAAD,CAAOA,MAAO,mCACV,wBACc,sBADd,kBAC2C,4BAD3C,4BAGA,wCAC8B,uBAD9B,SACmD,2BADnD,MAIJ,EAAC,IAAD,CAAOA,MAAO,yBACV,wBACc,iCADd,+BAGA,yBACe,mCADf,KAC4C,kCAD5C,kBAIJ,EAAC,IAAD,CAAOA,MAAO,iCACV,wBACc,iDADd,iBAGA,uCAC6B,qBAD7B,UACiD,qBADjD,KAGA,eACI,qBADJ,4FAGA,eACI,qBADJ,mEAIJ,EAAC,IAAD,CAAOA,MAAO,uBACV,wBACc,yBADd,8BAC0D,wBAD1D,QAC+E,wBAD/E,KAGA,eACI,wBADJ,+CACgE,0BADhE,eAC8F,8BAD9F,W,sIC3DpB,MAAMH,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,wBACZ,EAAC,IAAD,CAAOA,MAAO,aACV,gCAGA,8BACoB,uBADpB,oBACoD,0CADpD,MAIJ,EAAC,IAAD,CAAOA,MAAO,cACV,kCAGA,8BACoB,qBADpB,+BAC6D,wCAD7D,MAIJ,EAAC,IAAD,CAAOA,MAAO,gBACV,mCAGA,8BACoB,wBADpB,yBAC0D,6CAD1D,cAKR,EAAC,IAAD,CAASA,MAAO,yBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,2FACiF,sCADjF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,4BACV,mDACyC,qCADzC,sBACyF,EAAC,IAAD,KAASH,EAAT,OAAW,SADpG,MACqH,EAAC,IAAD,KAASA,EAAT,OAAW,SADhI,iBAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;0BAIf,EAAC,IAAD,CAAOG,MAAO,wBACV,oDAC0C,sCAD1C,YACiF,oDADjF,IAC8H,EAAC,IAAD,KAASH,EAAT,OAAW,SADzI,KAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;2BAKnB,EAAC,IAAD,CAASG,MAAO,yCACZ,EAAC,IAAD,CAAOA,MAAO,UACV,4FACkF,kCADlF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,sBACV,mDACyC,6DADzC,IAC+F,EAAC,IAAD,KAASH,EAAT,OAAW,SAD1G,uBAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;0FCzE/B,4BAEe,aAAUO,GACrB,OACI,EAAC,IAAD,CAAOJ,MAAO,kBAAmBK,MAAOC,IAAUC,QAC9C,6DAGCH,EAAMI,a,2DCRnB,wCAMe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASR,MAAO,qBACZ,EAAC,IAAD,CAAOA,MAAO,6BACV,4BACkB,6CADlB,wBAGA,qI,2DCdpB,4DAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,8BACZ,EAAC,IAAD,CAAOA,MAAO,UACV,WACI,uBADJ,OACuB,uBADvB,MACyC,oCADzC,2BAC6F,8BAD7F,KAGA,kCACwB,oBADxB,aAC8C,wBAD9C,sBACiF,uBADjF,6BAGA,wDAC8C,gCAD9C,W,2DCnBpB,qCAEe,aAAUI,GACrB,OACI,SAAKK,MAAOC,IAAMC,SACbP,EAAMI,a,gJCDnB,MAAMX,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,gCACZ,EAAC,IAAD,CAAOA,MAAO,cACV,WACI,iCADJ,QACkC,qCADlC,KACiE,sBADjE,+BAGA,6CAGA,YACI,2BAAgB,EAAC,IAAD,KAASH,EAAT,OAAW,QAC3B,wBAAa,EAAC,IAAD,KAASA,EAAT,OAAW,QACxB,+BAAoB,sBAApB,IAAmC,EAAC,IAAD,KAASA,EAAT,OAAW,mCAA9C,oCAIZ,EAAC,IAAD,KACI,EAAC,IAAD,CAAOG,MAAO,oBACV,EAAC,IAAD,mEAGA,WACI,yBADJ,+DACiF,4BADjF,KACuG,0BADvG,MAGA,yBACe,mBADf,0DAGA,wCAC8B,2BAD9B,yCACuF,wCADvF,KAGA,WACI,2BADJ,kFAIJ,EAAC,IAAD,CAAOA,MAAO,oBACV,EAAC,IAAD,KACI,sBADJ,+CAGA,WACI,kCADJ,8CACyE,EAAC,IAAD,KAASH,EAAT,OAAW,OADpF,+CAC4I,EAAC,IAAD,KAASA,EAAT,OAAW,OADvJ,wBAGA,qBACW,kCADX,mDAGA,sBACY,qCADZ,MAIJ,EAAC,IAAD,CAAOG,MAAO,sBACV,EAAC,IAAD,iDAGA,WACI,yBADJ,gBACkC,6BADlC,2CAC+F,oCAD/F,uDAC+K,oBAD/K,qCAGA,WACI,uCADJ,sFAGA,EAAC,IAAD,KAASH,EAAT,OAAW;;yBAGX,sKAC4J,kCAD5J,kBACqM,iBADrM,qBACgO,kBADhO,MAGA,uEAIJ,EAAC,IAAD,CAAOG,MAAO,0BACV,WACI,yBADJ,yCAC2D,0BAD3D,uDAGA,4CACkC,EAAC,IAAD,KAASH,EAAT,OAAW,SAD7C,gFACwI,6CADxI,2HACqS,EAAC,IAAD,KAASA,EAAT,OAAW,OADhT,KAGA,WACI,kFAGR,EAAC,IAAD,CAAOG,MAAO,iBACV,6BACmB,+BADnB,0DACiG,uCADjG,KAGA,oCAC0B,EAAC,IAAD,KAASH,EAAT,OAAW,OADrC,MACoD,EAAC,IAAD,KAASA,EAAT,OAAW,OAD/D,mEAGA,gEAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;;;;;0BAQf,EAAC,IAAD,CAAOG,MAAO,gBACV,WACI,yBADJ,gEACkF,oCADlF,0BACqI,sCADrI,KAGA,kFACwE,0BADxE,oCAGA,WACI,gE,2DClHxB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,+BACV,iBACO,wBADP,4CACgE,qCADhE,MAIJ,EAAC,IAAD,CAAOA,MAAO,SACV,iBACO,yBADP,8BACmD,6CADnD,KAGA,0GACgG,oCADhG,YACqI,uCADrI,SAC0K,oDAD1K,OAKR,EAAC,IAAD,CAASA,MAAO,mBACZ,EAAC,IAAD,CAAOA,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,6EAAZ,aADJ,SACmH,EAAC,IAAD,CAAMA,KAAM,sDAAZ,uBADnH,iCAC6O,4BAD7O,KAGA,wBACc,4BADd,0CAGA,2CACiC,yBADjC,mBACkE,2BADlE,oBACsG,oBADtG,qCACoJ,yBADpJ,sBAGA,2HAGA,EAAC,IAAD,uIAIJ,EAAC,IAAD,CAAOD,MAAO,uBACV,EAAC,IAAD,WACO,EAAC,IAAD,CAAMC,KAAM,yBAAZ,SADP,QAC6D,EAAC,IAAD,CAAMA,KAAM,oDAAZ,QAD7D,2DAGA,wBACc,6BADd,0CAGA,8CACoC,uBADpC,KACqD,uBADrD,KACsE,4BADtE,MAC6F,yBAD7F,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOD,MAAO,iBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,0BAAZ,UADJ,KACyD,EAAC,IAAD,CAAMA,KAAM,2BAAZ,cADzD,KACmH,EAAC,IAAD,CAAMA,KAAM,2BAAZ,UADnH,+DAGA,WACI,wBADJ,yDAC0E,iCAD1E,KACqG,qBADrG,KACuH,oBADvH,MACyI,qBADzI,2BAGA,EAAC,IAAD,qFACiF,EAAC,IAAD,CAAMA,KAAM,yCAAZ,0BADjF,MAIJ,EAAC,IAAD,CAAOD,MAAO,oBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,iDAAZ,gBADJ,4IAGA,qEAC2D,+CAD3D,oBAIJ,EAAC,IAAD,CAAOD,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,qCAAZ,QADJ,kGAGA,uCAC6B,sCAD7B,0C,2DChFpB,oDAOe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASD,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,YACV,YACI,YAAI,EAAC,IAAD,CAAMC,KAAM,wCAAZ,+BAGZ,EAAC,IAAD,CAAOD,MAAO,gBACV,YACI,YAAI,EAAC,IAAD,CAAMC,KAAM,2DAAZ,2BAGZ,EAAC,IAAD,CAAOD,MAAO,yBACV,+EACqE,EAAC,IAAD,CAAMC,KAAM,qCAAZ,SADrE,KAGA,EAAC,IAAD,CAAMW,SAAU,QAAhB,sH,0ICpBpB,MAAMf,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,4BACZ,EAAC,IAAD,CAAOA,MAAO,YACV,iBACO,iEADP,KAGA,EAAC,IAAD,KAASH,EAAT,OAAW;;0BAIf,EAAC,IAAD,CAAOG,MAAO,cACV,iBACO,mEADP,KAGA,EAAC,IAAD,KAASH,EAAT,OAAW;;2BAKnB,EAAC,IAAD,CAASG,MAAO,2BACZ,EAAC,IAAD,CAAOA,MAAO,kBACV,4BACkB,mBADlB,kDAGA,eACI,mBADJ,8EAGA,4HACkH,yCADlH,MAIJ,EAAC,IAAD,CAAOA,MAAO,sCACV,kJACwI,yCADxI,KAGA,uCAC6B,4CAD7B,4FAGA,EAAC,IAAD,8EAC0E,yBAD1E,MAIJ,EAAC,IAAD,CAAOA,MAAO,2BACV,sCAC4B,sCAD5B,4DACmH,iDADnH,gCAGA,sGAC4F,sDAD5F,mBAKR,EAAC,IAAD,U","file":"route-GestioneDellInformazione.chunk.41add.esm.js","sourcesContent":["import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Un supplemento al thesaurus specifico a un certo testo: aggiunge ad ogni token {r`c`} la probabilità {r`P(c)`} che un termine selezionato a caso del testo appartenga al sottoalbero formato dal token e i suoi discendenti.\n

\n

\n La radice del thesaurus ha sempre probabilità {r`1`}.\n

\n
\n \n

\n Una misura probabilistica di quanto un certo token {r`c`} sia specifico in un certo contesto:\n

\n {r`\n IC(c) = - \\log \\left( P(c) \\right)\n `}\n

\n È anche detta sorpresa o informazione di Shannon.\n

\n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Todo} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Un albero di token organizzati in una gerarchia di significato.\n

\n \n Il token \"mela\" avrà come genitore \"frutto\" e come figli \"Renetta\", \"Fuji\" e \"Granny Smith\".\n \n \n WordNet è un thesaurus generale per la lingua inglese, mentre Nuovo soggettario è un thesaurus generale per la lingua italiana.\n \n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Code, BaseLink} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Una struttura dati che permette di velocizzare le ricerche su testi grandi e semi-statici.\n

\n \n

\n Si crea un vocabolario dall'insieme dei token, e ad ogni token del vocabolario si associa una lista di tutte le sue occorrenze (posting list).\n

\n

\n L'efficacia ed efficienza dell'indice dipendono dalle strutture di indicizzazione utilizzate per serializzarlo.\n

\n
\n
\n
\n \n

\n Struttura per rappresentare il vocabolario basata su un array di puntatori alle posting list.\n

\n {r`\n ciao → R1, R15, R123\n steffo → R1, R14\n ciano → R1231\n `}\n
\n \n

\n Struttura per rappresentare il vocabolario basata su un albero dei prefissi dei token,:\n

\n
    \n
  • ogni arco corrisponde a una lettera del prefisso;
  • \n
  • ogni foglia corrisponde a un token e contiene un puntatore alla sua posting list.
  • \n
\n {r`\n - [root]\n - c\n - i\n - a\n - o\n - R1\n - R15\n - R123\n - no\n - R1231\n - steffo\n - R1\n - R14\n `}\n
\n \n

\n Struttura per rappresentare il vocabolario che occupa più spazio di un albero ma permette di effettuare certe operazioni più velocemente.\n

\n \n Visualizzazione di un B+ tree\n \n \n L'abbiamo fatta in Basi di dati!\n \n
\n
\n
\n \n
    \n
  1. Vocabulary search: si cercano individualmente i termini della query nel vocabolario
  2. \n
  3. Occurences retrieval: si raccolgono le posting list dei vari termini
  4. \n
  5. Occurences manipulation: si manipolano i dati delle posting list in modo da risolvere le query, restituendo quindi un sottoinsieme delle occorrenze
  6. \n
\n

\n In base alla struttura utilizzata, potrebbe non essere sempre possibile effettuare il terzo passo.\n

\n \n Non è possibile cercare prefissi se è stato utilizzato l'hashing!\n \n
\n
\n
\n )\n}\n","// extracted by mini-css-extract-plugin\nmodule.exports = {\"red\":\"red__2y1B_\",\"orange\":\"orange__dD2kx\",\"yellow\":\"yellow__OEpwl\",\"lime\":\"lime__CVe41\",\"cyan\":\"cyan__26ZAg\",\"blue\":\"blue__LO7Xm\",\"magenta\":\"magenta__1Akee\",\"example\":\"example__2PzAa\"};","import Intro from \"./00_Intro\";\nimport InformationRetrieval from \"./01_InformationRetrival\";\nimport Similarity from \"./02_Similarity\";\nimport Queries from \"./03_Queries\";\nimport DocumentProcessing from \"./04_DocumentProcessing\";\nimport Thesaurus from \"./05_Thesaurus\";\nimport InformationContent from \"./06_InformationContent\";\nimport AnalisiLessicale from \"./07_AnalisiLessicale\";\nimport Indexing from \"./08_Indexing\";\nimport Modeling from \"./09_Modeling\";\nimport Evaluation from \"./10_Evaluation\";\n\n\nexport default function () {\n return (\n
\n

Gestione dell'informazione

\n \n \n \n \n \n \n \n \n \n \n \n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Una procedura che ottimizza un documento per la ricerca.\n

\n
\n
\n
\n \n

\n Passo che trasforma il documento in un insieme di parole (token).\n

\n

\n Deve decidere come considerare i simboli tipografici, il case delle lettere e le cifre.\n

\n

\n Inoltre, è possibile che disambigui tra i vari significati delle parole (word sense disambiguation).\n

\n
\n \n

\n Passo che elimina dalla lista i token inutili ai fini delle ricerche.\n

\n

\n Esse solitamente sono gli articoli e le preposizioni.\n

\n
\n \n

\n Passo che riduce alla radice tutti i token della lista.\n

\n

\n Converte i plurali in singolari, passati ai presenti, e così via.\n

\n
\n \n

\n Passo che seleziona i termini più importanti della lista.\n

\n

\n Generalmente sfrutta dei parser o dei tagger.\n

\n \n \n
\n \n

\n Passo che classifica il documento in una o più categorie del thesaurus.\n

\n \n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n
\n synonymy\n
\n

\n Due parole sono sinonimi quando hanno lo stesso identico significato.\n

\n
\n \n
\n similarity\n
\n

\n Due parole sono simili rappresentano concetti con caratteristiche in comune.\n

\n
\n \n
\n relatedness\n
\n

\n Due parole sono correlate quando rappresentano concetti vengono usati insieme spesso.\n

\n
\n
\n
\n \n

\n Un modo per misurare la somiglianza tra due parole confrontando solo la loro posizione nel thesaurus.\n

\n
\n
\n
\n \n

\n Calcola la similarità basandosi sull'inverso della distanza tra le due parole {r`c_1`} e {r`c_2`} nell'albero:\n

\n {r`\n sim\\_pd(c_1, c_2) = \\frac{1}{dist(c_1, c_2) + 1}\n `}\n
\n \n

\n Calcola la similarità basandosi sulla profondità dei due nodi e sulla profondità del minimo antenato comune {r`mac`}:\n

\n {r`\n sim\\_wp(c_1, c_2) = \\frac{2 \\cdot depth(mac(c_1, c_2))}{depth(c_1) + depth(c_2)}\n `}\n
\n
\n
\n \n

\n Un modo per misurare la similarità tra due parole attraverso i loro valori di information content.\n

\n
\n
\n
\n \n

\n Calcola la similarità basandosi sull'information content del minimo antenato comune {r`mac`} tra i due termini.\n

\n {r`\n sim\\_rs(c_1, c_2) = - \\log P( mac(c_1, c_2) )\n `}\n
\n
\n
\n )\n}\n","import {BoxColors, Panel} from \"bluelib\";\n\nexport default function (props) {\n return (\n \n

\n Questa sezione è incompleta. Torna più avanti!\n

\n {props.children}\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Procedura che disambigua tra più significati dello stesso token.\n

\n

\n Si può realizzare confrontando la somiglianza di ogni significato con tutti gli altri nomi presenti nella frase.\n

\n
\n
\n
\n )\n}\n","import {Panel, Section} from \"bluelib\";\nimport {Fragment} from \"preact\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function (props) {\n return (\n \n
\n \n

\n Processo di raccolta e recupero approssimato di informazioni spesso non strutturate.\n

\n

\n Riceve in input una query, elabora documenti e restituisce una risposta più rilevante possibile.\n

\n

\n Un'applicazione che effettua IR si chiama motore di ricerca.\n

\n
\n
\n
\n )\n}\n","import style from \"./Example.less\";\n\nexport default function (props) {\n return (\n
\n {props.children}\n
\n );\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, BoxColors} from \"bluelib\";\nimport Example from \"../../components/Example\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Modelli matematici che ordinano per rilevanza (ranking) i risultati di una query.\n

\n

\n Formalmente, sono composti da:\n

\n
    \n
  • I documenti {r`D`}
  • \n
  • La query {r`Q`}
  • \n
  • Una funzione di ranking {r`rank(q_i, d_j) \\to \\mathbb{R}`} che quantifica la similarità
  • \n
\n
\n
\n
\n \n \n I motori di ricerca web usano generalmente questo modello.\n \n

\n Modello IR che rappresenta ogni documento come un insieme ordinato di parole chiave (index terms).\n

\n

\n Associa un peso a ogni token, e ordina l'insieme in base a quel peso.\n

\n

\n Generalmente, i pesi sono indipendenti uno dall'altro, e questo permette di calcolarli parallelamente.\n

\n

\n Bag-of-words: L'ordine delle parole nel documento viene solitamente ignorato dal ranking.\n

\n
\n \n \n grep è a tutti gli effetti un modello booleano.\n \n

\n Modello IR classico che dà un peso booleano a ogni documento: {r`1`} se soddisfa tutti i requisiti della query, {r`0`} se non li soddisfa.\n

\n

\n Ha una precisione perfetta, ma richiede query ben preparate e specifiche.\n

\n

\n È anche facile da implementare.\n

\n
\n \n \n Apache Lucene si basa su questo modello.\n \n

\n Modello IR in cui ogni caratteristica di un documento è rappresentata con un valore floating point e l'intero documento è quindi rappresentato da una n-pla di tutte le sue caratteristiche.\n

\n

\n Similarità cosinusoidale: il ranking si basa sull'angolo tra il \"vettore query\" e il \"vettore documento\":\n

\n {r`\n rank(d_j, q) = \\frac{d_j \\cdot q}{\\| d_j \\| \\times \\| q \\|}\n `}\n

\n Spesso si associa un peso a ogni dimensione in modo da variare l'importanza di una data caratteristica; comunemente, per i testi, si usano come pesi le frequenza dei token normalizzate (df) o logaritmiche (idf).\n

\n

\n Come il modello classico, ignora l'ordine delle parole.\n

\n
\n \n

\n Modello IR che effettua il ranking in base alla probabilità di comparsa dei termini della query nei documenti.\n

\n

\n Si basa sul calcolare un peso {r`c_i`} per ogni termine della query. Quest'ultimo diventa più grande se il termine compare in documenti rilevanti, e più piccolo se compare in documenti irrilevanti. Se il termine compare in ugual modo in entrambi, allora esso varrà {r`0`}.\n

\n

\n Ci sarebbe una dimostrazione complessa che ho omesso per brevità.\n

\n
\n \n

\n Estensione del modello booleano che ammette la possibilità che certe condizioni siano parzialmente soddisfatte.\n

\n

\n Invece che usare solo {r`0`} e {r`1`}, permette ai documenti di avere valori intermedi tra quei due.\n

\n

\n Le operazioni booleane vengono quindi modificate:\n

\n {r`\n \\begin{cases}\n a \\cap b = \\min(a, b)\\\\\n a \\cup b = \\max(a, b)\\\\\n \\not a = 1 - a\n \\end{cases} \n `}\n
\n \n

\n Modello IR simile ai modelli classici che però tiene conto anche della frequenza dei termini nei documenti e della lunghezza dei documenti.\n

\n

\n Permette anche di tenere in considerazione la frequenza dei termini nella query, nel caso essa sia molto lunga.\n

\n

\n Ci sono formule che ho omesso per brevità.\n

\n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n La richiesta di informazioni effettuata da un utente in linguaggio naturale.\n

\n
\n \n

\n La traduzione dell'UIN in un linguaggio specifico al motore di ricerca.\n

\n

\n La complessità di questo linguaggio dipende dall'utilizzatore del motore di ricerca: il suo livello di esperienza, il suo background di conoscenze e il livello di approfondimento desiderato.\n

\n
\n
\n
\n \n \n Wikipedia e la ricerca di Telegram usano un linguaggio di query keyword-based.\n \n

\n Definisce parole chiave da cercare all'interno dei documenti.\n

\n

\n In esse, è possibile cercare molteplici parole chiave, concatenarle per formare una frase oppure cercare parole a una data prossimità l'una dall'altra.\n

\n

\n Spesso processa il linguaggio naturale per trasformarne le parole specifiche in parole chiave più generiche.\n

\n \n Cercando su Telegram un plurale inglese, verranno restituiti anche i messaggi che riportano la stessa parola ma al singolare.\n \n
\n \n \n Le regex e i glob sono due dei pattern-based query languages più comuni.\n \n

\n Definisce parti di testo da cercare all'interno dei documenti.\n

\n

\n Permettono dunque la ricerca di prefissi, suffissi, sottostringhe e intervalli.\n

\n
\n
\n
\n \n \n Google, DuckDuckGo, Ecosia usano tutti un linguaggio di query keyword-based booleano.\n \n

\n Estendono gli altri tipi di query permettendo l'inserimento di operatori booleani (AND, OR e NOT) tra le parole chiave.\n

\n \n Per esempi sulla sintassi per effettuare ricerche booleane su Google, visita Google Advanced Search.\n \n
\n \n \n Google Books permette di sfruttare la struttura fissa delle informazioni sui libri (titolo, autore, editore...) per ottenere risultati più precisi.,\n \n

\n Permettono di effettuare i precedenti tipi di query su specifiche parti della struttura dei documenti.\n

\n
\n \n \n MeSH cataloga i paper di medicina caricati su PubMed organizzandoli in una gerarchia di categorie.\n \n

\n Limitano le keyword a un vocabolario predefinito utilizzato anche dai documenti.\n

\n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, BaseLink, Code} from \"bluelib\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n
    \n
  • Prof. Federica Mandreoli
  • \n
\n
\n \n
    \n
  • Pagina Dolly Unimore
  • \n
\n
\n \n

\n Puoi scaricare le videolezioni di Gestione dell'informazione con bbbdl:\n

\n \n bbbdl sync -r https://raw.githubusercontent.com/Steffo99/unimoreinfo-wiki/main/gestionedellinformazione.json\n \n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n La frazione dei documenti rilevanti totali restituita:\n

\n {r`\n \\frac{R \\cap A}{R}\n `}\n
\n \n

\n La frazione dei documenti restituiti che sono rilevanti:\n

\n {r`\n \\frac{R \\cap A}{A}\n `}\n
\n
\n
\n \n

\n Si effettuano test e si valutano precisione e richiamo ottenuti.\n

\n \n

\n Il modello IR ideale ha valori di richiamo e precisione di 1, ma nella realtà questi valori tendono ad essere inversamente proporzionali.\n

\n
\n \n

\n Si fissano un certo numero di livelli di richiamo desiderati e si misura la precisione che ha il modello in quei punti, creando una curva di richiamo standard.\n

\n

\n È possibile ottenere una curva di richiamo interpolata prendendo per ogni punto il valore di massima precisione tra esso e i punti precedenti.\n

\n \n Interpolata mi sembra un termine orribile... Non sarebbe molto meglio monotonica?\n \n
\n \n

\n È possibile misurare la curva di richiamo media effettuando la media su più query dei vari valori, e la curva di richiamo a valore singolo effettuando una query sola.\n

\n

\n Sono entrambe importanti per effettuare una valutazione, perchè la curva media potrebbe mascherare problemi di specifiche query nei modelli.\n

\n
\n
\n \n
\n )\n}\n"],"sourceRoot":""}