mirror of
https://github.com/Steffo99/unisteffo.git
synced 2024-11-23 00:14:21 +00:00
1 line
No EOL
41 KiB
Text
Generated
1 line
No EOL
41 KiB
Text
Generated
{"version":3,"sources":["webpack:///./routes/GestioneDellInformazione/06_InformationContent.js","webpack:///./routes/GestioneDellInformazione/05_Thesaurus.js","webpack:///./routes/GestioneDellInformazione/08_Indexing.js","webpack:///./components/Example.less","webpack:///./routes/GestioneDellInformazione/index.js","webpack:///./routes/GestioneDellInformazione/04_DocumentProcessing.js","webpack:///./routes/GestioneDellInformazione/02_Similarity.js","webpack:///./components/ToBeContinued.js","webpack:///./routes/GestioneDellInformazione/07_AnalisiLessicale.js","webpack:///./routes/GestioneDellInformazione/01_InformationRetrival.js","webpack:///./components/Example.js","webpack:///./routes/GestioneDellInformazione/09_Modeling.js","webpack:///./routes/GestioneDellInformazione/03_Queries.js","webpack:///./routes/GestioneDellInformazione/00_Intro.js","webpack:///./routes/GestioneDellInformazione/10_Evaluation.js"],"names":["r","String","raw","title","href","module","exports","props","color","BoxColors","YELLOW","children","class","style","example","language"],"mappings":"ipBAGMA,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,+BACZ,EAAC,IAAD,CAAOA,MAAO,yBACV,6FACmF,EAAC,IAAD,KAASH,EAAT,MADnF,OAC8G,0BAD9G,IACiI,EAAC,IAAD,KAASA,EAAT,MADjI,WACmK,6EADnK,4CAGA,4DACkD,EAAC,IAAD,KAASA,EAAT,MADlD,MAIJ,EAAC,IAAD,CAAOG,MAAO,uBACV,yBACe,6BADf,6BAC8D,EAAC,IAAD,KAASH,EAAT,MAD9D,QAC0F,wBAD1F,0BAGA,EAAC,IAAD,KAASA,EAAT,MAGA,4BACkB,uBADlB,MACoC,sCADpC,W,6DCzBpB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASG,MAAO,aACZ,EAAC,IAAD,CAAOA,MAAO,UACV,iBACO,8BADP,iDAGA,EAAC,IAAD,iEAC6D,EAAC,IAAD,CAAMC,KAAM,yCAAZ,aAD7D,KACoI,EAAC,IAAD,CAAMA,KAAM,6CAAZ,UADpI,MAC6M,EAAC,IAAD,CAAMA,KAAM,8CAAZ,kBAD7M,KAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAMA,KAAM,kCAAZ,WADJ,0DACuH,EAAC,IAAD,CAAMA,KAAM,kDAAZ,qBADvH,0D,g7BCddJ,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,kBACZ,EAAC,IAAD,CAAOA,MAAO,kBACV,kBACQ,6BADR,qDAC+E,qBAD/E,MAC+F,2BAD/F,KAGA,eACI,iCADJ,8CAGA,yBACe,0BADf,SACuC,gCADvC,eAC2E,oBAD3E,mCACuH,+CADvH,KACgK,2BADhK,MAGA,oEAC0D,0CAD1D,oCAKR,EAAC,IAAD,CAASA,MAAO,+BACZ,EAAC,IAAD,CAAOA,MAAO,gBACV,sEAC4D,iCAD5D,uBAGA,EAAC,IAAD,KAAOH,EAAP,OAMJ,EAAC,IAAD,CAAOG,MAAO,QACV,sEAC4D,4CAD5D,MAGA,YACI,uCAA4B,uCAA5B,KACA,yCAA8B,uBAA9B,qCAA+E,2BAA/E,MAEJ,EAAC,IAAD,KAAOH,EAAP,OAgBJ,EAAC,IAAD,CAAOG,MAAO,WACV,6DACmD,6CADnD,8BACmH,+CADnH,KAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,iEAAZ,kCAEJ,EAAC,IAAD,2BACuB,EAAC,IAAD,CAAUA,KAAM,eAAhB,gBADvB,OAKR,EAAC,IAAD,CAASD,MAAO,wBACZ,EAAC,IAAD,CAAOA,MAAO,SACV,YACI,YAAI,gCAAJ,gBAAyC,8BAAzC,0CACA,YAAI,mCAAJ,QAAoC,yCAApC,qBACA,YAAI,sCAAJ,kGAAiI,8CAErI,iHAGA,EAAC,IAAD,gF,2CCnFpBE,EAAOC,QAAU,CAAC,IAAM,aAAa,OAAS,gBAAgB,OAAS,gBAAgB,KAAO,cAAc,KAAO,cAAc,KAAO,cAAc,QAAU,iBAAiB,QAAU,mB,oCCD3L,2JAae,qBACX,OACI,aACI,0CACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,S,6DC3BZ,kDAOe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASH,MAAO,uBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,kBACQ,wBADR,iDAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,wBACV,qDAC2C,gCAD3C,KACqE,oBADrE,MAGA,+CACqC,kCADrC,QACoE,mBADpE,uBACmG,oBADnG,KAGA,uFAC6E,wCAD7E,OAIJ,EAAC,IAAD,CAAOA,MAAO,mCACV,wBACc,sBADd,kBAC2C,4BAD3C,4BAGA,wCAC8B,uBAD9B,SACmD,2BADnD,MAIJ,EAAC,IAAD,CAAOA,MAAO,yBACV,wBACc,iCADd,+BAGA,yBACe,mCADf,KAC4C,kCAD5C,kBAIJ,EAAC,IAAD,CAAOA,MAAO,iCACV,wBACc,iDADd,iBAGA,uCAC6B,qBAD7B,UACiD,qBADjD,KAGA,eACI,qBADJ,4FAGA,eACI,qBADJ,mEAIJ,EAAC,IAAD,CAAOA,MAAO,uBACV,wBACc,yBADd,8BAC0D,wBAD1D,QAC+E,wBAD/E,KAGA,eACI,wBADJ,+CACgE,0BADhE,eAC8F,8BAD9F,W,0sCC3DdH,G,UAAIC,OAAOC,KAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,wBACZ,EAAC,IAAD,CAAOA,MAAO,aACV,gCAGA,8BACoB,uBADpB,oBACoD,0CADpD,MAIJ,EAAC,IAAD,CAAOA,MAAO,cACV,kCAGA,8BACoB,qBADpB,+BAC6D,wCAD7D,MAIJ,EAAC,IAAD,CAAOA,MAAO,gBACV,mCAGA,8BACoB,wBADpB,yBAC0D,6CAD1D,cAKR,EAAC,IAAD,CAASA,MAAO,yBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,2FACiF,sCADjF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,4BACV,mDACyC,qCADzC,sBACyF,EAAC,IAAD,KAASH,EAAT,MADzF,MACqH,EAAC,IAAD,KAASA,EAAT,MADrH,iBAGA,EAAC,IAAD,KAASA,EAAT,OAIJ,EAAC,IAAD,CAAOG,MAAO,wBACV,oDAC0C,sCAD1C,YACiF,oDADjF,IAC8H,EAAC,IAAD,KAASH,EAAT,MAD9H,KAGA,EAAC,IAAD,KAASA,EAAT,QAKR,EAAC,IAAD,CAASG,MAAO,yCACZ,EAAC,IAAD,CAAOA,MAAO,UACV,4FACkF,kCADlF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,sBACV,mDACyC,6DADzC,IAC+F,EAAC,IAAD,KAASH,EAAT,MAD/F,uBAGA,EAAC,IAAD,KAASA,EAAT,Y,2DCzEpB,4BAEe,aAAUO,GACrB,OACI,EAAC,IAAD,CAAOJ,MAAO,kBAAmBK,MAAOC,IAAUC,QAC9C,6DAGCH,EAAMI,a,2DCRnB,wCAMe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASR,MAAO,qBACZ,EAAC,IAAD,CAAOA,MAAO,6BACV,4BACkB,6CADlB,wBAGA,qI,2DCdpB,4DAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,8BACZ,EAAC,IAAD,CAAOA,MAAO,UACV,WACI,uBADJ,OACuB,uBADvB,MACyC,oCADzC,2BAC6F,8BAD7F,KAGA,kCACwB,oBADxB,aAC8C,wBAD9C,sBACiF,uBADjF,6BAGA,wDAC8C,gCAD9C,W,2DCnBpB,qCAEe,aAAUI,GACrB,OACI,SAAKK,MAAOC,IAAMC,SACbP,EAAMI,a,qnDCDbX,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,gCACZ,EAAC,IAAD,CAAOA,MAAO,cACV,WACI,iCADJ,QACkC,qCADlC,KACiE,sBADjE,+BAGA,6CAGA,YACI,2BAAgB,EAAC,IAAD,KAASH,EAAT,OAChB,wBAAa,EAAC,IAAD,KAASA,EAAT,OACb,+BAAoB,sBAApB,IAAmC,EAAC,IAAD,KAASA,EAAT,MAAnC,oCAIZ,EAAC,IAAD,KACI,EAAC,IAAD,CAAOG,MAAO,oBACV,EAAC,IAAD,mEAGA,WACI,yBADJ,+DACiF,4BADjF,KACuG,0BADvG,MAGA,yBACe,mBADf,0DAGA,wCAC8B,2BAD9B,yCACuF,wCADvF,KAGA,WACI,2BADJ,kFAIJ,EAAC,IAAD,CAAOA,MAAO,oBACV,EAAC,IAAD,KACI,sBADJ,+CAGA,WACI,kCADJ,8CACyE,EAAC,IAAD,KAASH,EAAT,MADzE,+CAC4I,EAAC,IAAD,KAASA,EAAT,MAD5I,wBAGA,qBACW,kCADX,mDAGA,sBACY,qCADZ,MAIJ,EAAC,IAAD,CAAOG,MAAO,sBACV,EAAC,IAAD,iDAGA,WACI,yBADJ,gBACkC,6BADlC,2CAC+F,oCAD/F,uDAC+K,oBAD/K,qCAGA,WACI,uCADJ,sFAGA,EAAC,IAAD,KAASH,EAAT,MAGA,sKAC4J,kCAD5J,kBACqM,iBADrM,qBACgO,kBADhO,MAGA,uEAIJ,EAAC,IAAD,CAAOG,MAAO,0BACV,WACI,yBADJ,yCAC2D,0BAD3D,uDAGA,4CACkC,EAAC,IAAD,KAASH,EAAT,MADlC,gFACwI,6CADxI,2HACqS,EAAC,IAAD,KAASA,EAAT,MADrS,KAGA,WACI,kFAGR,EAAC,IAAD,CAAOG,MAAO,iBACV,6BACmB,+BADnB,0DACiG,uCADjG,KAGA,oCAC0B,EAAC,IAAD,KAASH,EAAT,MAD1B,MACoD,EAAC,IAAD,KAASA,EAAT,MADpD,mEAGA,gEAGA,EAAC,IAAD,KAASA,EAAT,OAQJ,EAAC,IAAD,CAAOG,MAAO,gBACV,WACI,yBADJ,gEACkF,oCADlF,0BACqI,sCADrI,KAGA,kFACwE,0BADxE,oCAGA,WACI,gE,2DClHxB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,+BACV,iBACO,wBADP,4CACgE,qCADhE,MAIJ,EAAC,IAAD,CAAOA,MAAO,SACV,iBACO,yBADP,8BACmD,6CADnD,KAGA,0GACgG,oCADhG,YACqI,uCADrI,SAC0K,oDAD1K,OAKR,EAAC,IAAD,CAASA,MAAO,mBACZ,EAAC,IAAD,CAAOA,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,6EAAZ,aADJ,SACmH,EAAC,IAAD,CAAMA,KAAM,sDAAZ,uBADnH,iCAC6O,4BAD7O,KAGA,wBACc,4BADd,0CAGA,2CACiC,yBADjC,mBACkE,2BADlE,oBACsG,oBADtG,qCACoJ,yBADpJ,sBAGA,2HAGA,EAAC,IAAD,uIAIJ,EAAC,IAAD,CAAOD,MAAO,uBACV,EAAC,IAAD,WACO,EAAC,IAAD,CAAMC,KAAM,yBAAZ,SADP,QAC6D,EAAC,IAAD,CAAMA,KAAM,oDAAZ,QAD7D,2DAGA,wBACc,6BADd,0CAGA,8CACoC,uBADpC,KACqD,uBADrD,KACsE,4BADtE,MAC6F,yBAD7F,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOD,MAAO,iBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,0BAAZ,UADJ,KACyD,EAAC,IAAD,CAAMA,KAAM,2BAAZ,cADzD,KACmH,EAAC,IAAD,CAAMA,KAAM,2BAAZ,UADnH,+DAGA,WACI,wBADJ,yDAC0E,iCAD1E,KACqG,qBADrG,KACuH,oBADvH,MACyI,qBADzI,2BAGA,EAAC,IAAD,qFACiF,EAAC,IAAD,CAAMA,KAAM,yCAAZ,0BADjF,MAIJ,EAAC,IAAD,CAAOD,MAAO,oBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,iDAAZ,gBADJ,4IAGA,qEAC2D,+CAD3D,oBAIJ,EAAC,IAAD,CAAOD,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAMC,KAAM,qCAAZ,QADJ,kGAGA,uCAC6B,sCAD7B,0C,2DChFpB,oDAOe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASD,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,YACV,YACI,YAAI,EAAC,IAAD,CAAMC,KAAM,wCAAZ,+BAGZ,EAAC,IAAD,CAAOD,MAAO,gBACV,YACI,YAAI,EAAC,IAAD,CAAMC,KAAM,2DAAZ,2BAGZ,EAAC,IAAD,CAAOD,MAAO,yBACV,+EACqE,EAAC,IAAD,CAAMC,KAAM,qCAAZ,SADrE,KAGA,EAAC,IAAD,CAAMW,SAAU,QAAhB,sH,wjBCpBdf,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASC,MAAO,4BACZ,EAAC,IAAD,CAAOA,MAAO,YACV,iBACO,iEADP,KAGA,EAAC,IAAD,KAASH,EAAT,OAIJ,EAAC,IAAD,CAAOG,MAAO,cACV,iBACO,mEADP,KAGA,EAAC,IAAD,KAASH,EAAT,QAKR,EAAC,IAAD,CAASG,MAAO,2BACZ,EAAC,IAAD,CAAOA,MAAO,kBACV,4BACkB,mBADlB,kDAGA,eACI,mBADJ,8EAGA,4HACkH,yCADlH,MAIJ,EAAC,IAAD,CAAOA,MAAO,sCACV,kJACwI,yCADxI,KAGA,uCAC6B,4CAD7B,4FAGA,EAAC,IAAD,8EAC0E,yBAD1E,MAIJ,EAAC,IAAD,CAAOA,MAAO,2BACV,sCAC4B,sCAD5B,4DACmH,iDADnH,gCAGA,sGAC4F,sDAD5F,mBAKR,EAAC,IAAD,U","file":"route-GestioneDellInformazione.chunk.e4bbf.js","sourcesContent":["import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Un approccio probabilistico\"}>\n <Panel title={\"Probabilità dei token\"}>\n <p>\n Un supplemento al thesaurus specifico a un certo testo: aggiunge ad ogni token <ILatex>{r`c`}</ILatex> la <b>probabilità</b> <ILatex>{r`P(c)`}</ILatex> che un <b>termine selezionato a caso del testo appartenga al sottoalbero</b> formato dal token e i suoi discendenti.\n </p>\n <p>\n La radice del thesaurus ha sempre probabilità <ILatex>{r`1`}</ILatex>.\n </p>\n </Panel>\n <Panel title={\"Information content\"}>\n <p>\n Una misura <b>probabilistica</b> di quanto un certo token <ILatex>{r`c`}</ILatex> sia <b>specifico</b> in un certo contesto:\n </p>\n <PLatex>{r`\n IC(c) = - \\log \\left( P(c) \\right)\n `}</PLatex>\n <p>\n È anche detta <i>sorpresa</i> o <i>informazione di Shannon</i>.\n </p>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Todo} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Thesaurus\"}>\n <Panel title={\"Cos'è?\"}>\n <p>\n Un <b>albero di token</b> organizzati in una gerarchia di significato.\n </p>\n <Example>\n Il token \"mela\" avrà come genitore \"frutto\" e come figli <Link href={\"https://it.wikipedia.org/wiki/Renetta\"}>\"Renetta\"</Link>, <Link href={\"https://it.wikipedia.org/wiki/Fuji_(mela)\"}>\"Fuji\"</Link> e <Link href={\"https://it.wikipedia.org/wiki/Granny_Smith\"}>\"Granny Smith\"</Link>.\n </Example>\n <Example>\n <Link href={\"https://wordnet.princeton.edu/\"}>WordNet</Link> è un thesaurus generale per la lingua inglese, mentre <Link href={\"https://thes.bncf.firenze.sbn.it/thes-dati.htm\"}>Nuovo soggettario</Link> è un thesaurus generale per la lingua italiana.\n </Example>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Code, BaseLink} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Indicizzazione\"}>\n <Panel title={\"Inverted index\"}>\n <p>\n Una <b>struttura dati</b> che permette di velocizzare le ricerche su testi <b>grandi</b> e <b>semi-statici</b>.\n </p>\n <aside>\n <u>Testo semi-statico</u>: un testo che viene aggiornato raramente.\n </aside>\n <p>\n Si crea un <i>vocabolario</i> dall'<b>insieme dei token</b>, e ad ogni <b>token</b> del vocabolario si associa una <b>lista di tutte le sue occorrenze</b> (<i>posting list</i>).\n </p>\n <p>\n L'efficacia ed efficienza dell'indice dipendono dalle <i>strutture di indicizzazione</i> utilizzate per serializzarlo.\n </p>\n </Panel>\n </Section>\n <Section title={\"Strutture di indicizzazione\"}>\n <Panel title={\"Sorted array\"}>\n <p>\n Struttura per rappresentare il vocabolario basata su un <b>array di puntatori</b> alle posting list.\n </p>\n <Code>{r`\n ciao → R1, R15, R123\n steffo → R1, R14\n ciano → R1231\n `}</Code>\n </Panel>\n <Panel title={\"Trie\"}>\n <p>\n Struttura per rappresentare il vocabolario basata su un <b>albero dei prefissi dei token</b>,:\n </p>\n <ul>\n <li>ogni arco corrisponde a <b>una lettera del prefisso</b>;</li>\n <li>ogni foglia corrisponde a <b>un token</b> e contiene un puntatore alla sua <b>posting list</b>.</li>\n </ul>\n <Code>{r`\n - [root]\n - c\n - i\n - a\n - o\n - R1\n - R15\n - R123\n - no\n - R1231\n - steffo\n - R1\n - R14\n `}</Code>\n </Panel>\n <Panel title={\"B+ tree\"}>\n <p>\n Struttura per rappresentare il vocabolario che <b>occupa più spazio di un albero</b> ma permette di effettuare <b>certe operazioni più velocemente</b>.\n </p>\n <Example>\n <Link href={\"https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html\"}>Visualizzazione di un B+ tree</Link>\n </Example>\n <Example>\n L'abbiamo fatta in <BaseLink href={\"/basididati\"}>Basi di dati</BaseLink>!\n </Example>\n </Panel>\n </Section>\n <Section title={\"Utilizzo dell'indice\"}>\n <Panel title={\"Passi\"}>\n <ol>\n <li><u>Vocabulary search</u>: si cercano <b>individualmente</b> i termini della query nel vocabolario</li>\n <li><u>Occurences retrieval</u>: si <b>raccolgono le posting list</b> dei vari termini</li>\n <li><u>Occurences manipulation</u>: si manipolano i dati delle posting list in modo da risolvere le query, restituendo quindi un <b>sottoinsieme delle occorrenze</b></li>\n </ol>\n <p>\n In base alla struttura utilizzata, potrebbe non essere sempre possibile effettuare il terzo passo.\n </p>\n <Example>\n Non è possibile cercare prefissi se è stato utilizzato l'hashing!\n </Example>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","// extracted by mini-css-extract-plugin\nmodule.exports = {\"red\":\"red__2y1B_\",\"orange\":\"orange__dD2kx\",\"yellow\":\"yellow__OEpwl\",\"lime\":\"lime__CVe41\",\"cyan\":\"cyan__26ZAg\",\"blue\":\"blue__LO7Xm\",\"magenta\":\"magenta__1Akee\",\"example\":\"example__2PzAa\"};","import Intro from \"./00_Intro\";\nimport InformationRetrieval from \"./01_InformationRetrival\";\nimport Similarity from \"./02_Similarity\";\nimport Queries from \"./03_Queries\";\nimport DocumentProcessing from \"./04_DocumentProcessing\";\nimport Thesaurus from \"./05_Thesaurus\";\nimport InformationContent from \"./06_InformationContent\";\nimport AnalisiLessicale from \"./07_AnalisiLessicale\";\nimport Indexing from \"./08_Indexing\";\nimport Modeling from \"./09_Modeling\";\nimport Evaluation from \"./10_Evaluation\";\n\n\nexport default function () {\n return (\n <div>\n <h1>Gestione dell'informazione</h1>\n <Intro/>\n <InformationRetrieval/>\n <Queries/>\n <DocumentProcessing/>\n <Thesaurus/>\n <InformationContent/>\n <Similarity/>\n <AnalisiLessicale/>\n <Indexing/>\n <Modeling/>\n <Evaluation/>\n </div>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Document processing\"}>\n <Panel title={\"Cos'è?\"}>\n <p>\n Una <b>procedura</b> che ottimizza un documento per la ricerca.\n </p>\n </Panel>\n </Section>\n <Section>\n <Panel title={\"1. Analisi lessicale\"}>\n <p>\n Passo che trasforma il documento in un <b>insieme di parole</b> (<i>token</i>).\n </p>\n <p>\n Deve decidere come considerare i <b>simboli tipografici</b>, il <b>case</b> delle lettere e le <b>cifre</b>.\n </p>\n <p>\n Inoltre, è possibile che disambigui tra i vari significati delle parole (<i>word sense disambiguation</i>).\n </p>\n </Panel>\n <Panel title={\"2. Eliminazione delle stopwords\"}>\n <p>\n Passo che <b>elimina</b> dalla lista i <b>token inutili</b> ai fini delle ricerche.\n </p>\n <p>\n Esse solitamente sono gli <b>articoli</b> e le <b>preposizioni</b>.\n </p>\n </Panel>\n <Panel title={\"3. Stemming dei token\"}>\n <p>\n Passo che <b>riduce alla radice</b> tutti i token della lista.\n </p>\n <p>\n Converte i <b>plurali in singolari</b>, <b>passati ai presenti</b>, e così via.\n </p>\n </Panel>\n <Panel title={\"4. Selezione degli index term\"}>\n <p>\n Passo che <b>seleziona i termini più importanti</b> della lista.\n </p>\n <p>\n Generalmente sfrutta dei <i>parser</i> o dei <i>tagger</i>.\n </p>\n <aside>\n <u>Parser</u>: impreciso ma molto dettagliato, effettua l'analisi grammaticale, logica e del periodo.\n </aside>\n <aside>\n <u>Tagger</u>: preciso ma poco dettagliato, effettua solo l'analisi logica.\n </aside>\n </Panel>\n <Panel title={\"5. Categorizzazione\"}>\n <p>\n Passo che <b>classifica</b> il documento in una o più <b>categorie</b> del <i>thesaurus</i>.\n </p>\n <aside>\n <u>Thesaurus</u>: gerarchia di categorie, può essere creata <b>manualmente</b> o generata <b>automaticamente</b>.\n </aside>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Relazioni tra parole\"}>\n <Panel title={\"Sinonimia\"}>\n <blockquote>\n synonymy\n </blockquote>\n <p>\n Due parole sono <i>sinonimi</i> quando hanno lo <b>stesso identico significato</b>.\n </p>\n </Panel>\n <Panel title={\"Similarità\"}>\n <blockquote>\n similarity\n </blockquote>\n <p>\n Due parole sono <i>simili</i> rappresentano concetti con <b>caratteristiche in comune</b>.\n </p>\n </Panel>\n <Panel title={\"Correlazione\"}>\n <blockquote>\n relatedness\n </blockquote>\n <p>\n Due parole sono <i>correlate</i> quando rappresentano <b>concetti vengono usati insieme</b> spesso.\n </p>\n </Panel>\n </Section>\n <Section title={\"Similarità path-based\"}>\n <Panel title={\"Cos'è?\"}>\n <p>\n Un modo per misurare la somiglianza tra due parole confrontando solo la loro <b>posizione nel thesaurus</b>.\n </p>\n </Panel>\n </Section>\n <Section>\n <Panel title={\"Similarità path-distance\"}>\n <p>\n Calcola la similarità basandosi sull'<b>inverso della distanza</b> tra le due parole <ILatex>{r`c_1`}</ILatex> e <ILatex>{r`c_2`}</ILatex> nell'albero:\n </p>\n <PLatex>{r`\n sim\\_pd(c_1, c_2) = \\frac{1}{dist(c_1, c_2) + 1}\n `}</PLatex>\n </Panel>\n <Panel title={\"Similarità Wu-Palmer\"}>\n <p>\n Calcola la similarità basandosi sulla <b>profondità dei due nodi</b> e sulla <b>profondità del minimo antenato comune</b> <ILatex>{r`mac`}</ILatex>:\n </p>\n <PLatex>{r`\n sim\\_wp(c_1, c_2) = \\frac{2 \\cdot depth(mac(c_1, c_2))}{depth(c_1) + depth(c_2)}\n `}</PLatex>\n </Panel>\n </Section>\n <Section title={\"Somiglianza information-content-based\"}>\n <Panel title={\"Cos'è?\"}>\n <p>\n Un modo per misurare la similarità tra due parole attraverso i loro valori di <b>information content</b>.\n </p>\n </Panel>\n </Section>\n <Section>\n <Panel title={\"Somiglianza Resnik\"}>\n <p>\n Calcola la similarità basandosi sull'<b>information content del minimo antenato comune</b> <ILatex>{r`mac`}</ILatex> tra i due termini.\n </p>\n <PLatex>{r`\n sim\\_rs(c_1, c_2) = - \\log P( mac(c_1, c_2) )\n `}</PLatex>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {BoxColors, Panel} from \"bluelib\";\n\nexport default function (props) {\n return (\n <Panel title={\"To be continued\"} color={BoxColors.YELLOW}>\n <p>\n Questa sezione è incompleta. Torna più avanti!\n </p>\n {props.children}\n </Panel>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Analisi lessicale\"}>\n <Panel title={\"Word sense disambiguation\"}>\n <p>\n Procedura che <b>disambigua tra più significati</b> dello stesso token.\n </p>\n <p>\n Si può realizzare confrontando la somiglianza di ogni significato con tutti gli altri nomi presenti nella frase.\n </p>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {Panel, Section} from \"bluelib\";\nimport {Fragment} from \"preact\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function (props) {\n return (\n <Fragment>\n <Section title={\"Information Retrieval (IR)\"}>\n <Panel title={\"Cos'è?\"}>\n <p>\n <b>Processo</b> di <b>raccolta</b> e <b>recupero approssimato</b> di informazioni spesso <b>non strutturate</b>.\n </p>\n <p>\n Riceve in input una <b>query</b>, elabora <b>documenti</b> e restituisce una <b>risposta</b> più rilevante possibile.\n </p>\n <p>\n Un'applicazione che effettua IR si chiama <b>motore di ricerca</b>.\n </p>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import style from \"./Example.less\";\n\nexport default function (props) {\n return (\n <div class={style.example}>\n {props.children}\n </div>\n );\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, BoxColors} from \"bluelib\";\nimport Example from \"../../components/Example\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Information retrieval models\"}>\n <Panel title={\"Cosa sono?\"}>\n <p>\n <b>Modelli matematici</b> che <b>ordinano per rilevanza</b> (<i>ranking</i>) i risultati di una query.\n </p>\n <p>\n Formalmente, sono composti da:\n </p>\n <ul>\n <li>I documenti <ILatex>{r`D`}</ILatex></li>\n <li>La query <ILatex>{r`Q`}</ILatex></li>\n <li>Una funzione di <i>ranking</i> <ILatex>{r`rank(q_i, d_j) \\to \\mathbb{R}`}</ILatex> che quantifica la similarità</li>\n </ul>\n </Panel>\n </Section>\n <Section>\n <Panel title={\"Modello classico\"}>\n <Example>\n I motori di ricerca web usano generalmente questo modello.\n </Example>\n <p>\n <b>Modello IR</b> che rappresenta ogni documento come un insieme ordinato di <b>parole chiave</b> (<i>index terms</i>).\n </p>\n <p>\n Associa un <b>peso</b> a ogni token, e ordina l'insieme in base a quel peso.\n </p>\n <p>\n Generalmente, i pesi sono <b>indipendenti</b> uno dall'altro, e questo permette di <b>calcolarli parallelamente</b>.\n </p>\n <p>\n <u>Bag-of-words</u>: L'ordine delle parole nel documento viene solitamente ignorato dal ranking.\n </p>\n </Panel>\n <Panel title={\"Modello booleano\"}>\n <Example>\n <code>grep</code> è a tutti gli effetti un modello booleano.\n </Example>\n <p>\n <b>Modello IR classico</b> che dà un peso booleano a ogni documento: <ILatex>{r`1`}</ILatex> se soddisfa tutti i requisiti della query, <ILatex>{r`0`}</ILatex> se non li soddisfa.\n </p>\n <p>\n Ha una <b>precisione perfetta</b>, ma richiede query ben preparate e specifiche.\n </p>\n <p>\n È anche <b>facile da implementare</b>.\n </p>\n </Panel>\n <Panel title={\"Modello vettoriale\"}>\n <Example>\n Apache Lucene si basa su questo modello.\n </Example>\n <p>\n <b>Modello IR</b> in cui ogni <b>caratteristica</b> di un documento è rappresentata con un <b>valore floating point</b> e l'intero documento è quindi rappresentato da una <b>n-pla</b> di tutte le sue caratteristiche.\n </p>\n <p>\n <u>Similarità cosinusoidale</u>: il ranking si basa sull'angolo tra il \"vettore query\" e il \"vettore documento\":\n </p>\n <PLatex>{r`\n rank(d_j, q) = \\frac{d_j \\cdot q}{\\| d_j \\| \\times \\| q \\|}\n `}</PLatex>\n <p>\n Spesso si associa un peso a ogni dimensione in modo da variare l'importanza di una data caratteristica; comunemente, per i testi, si usano come pesi le <b>frequenza dei token</b> normalizzate (<i>df</i>) o logaritmiche (<i>idf</i>).\n </p>\n <p>\n Come il modello classico, ignora l'ordine delle parole.\n </p>\n </Panel>\n <Panel title={\"Modello probabilistico\"}>\n <p>\n <b>Modello IR</b> che effettua il ranking in base alla <b>probabilità</b> di comparsa dei termini della query nei documenti.\n </p>\n <p>\n Si basa sul calcolare un peso <ILatex>{r`c_i`}</ILatex> per ogni termine della query. Quest'ultimo diventa più grande se il termine <b>compare in documenti rilevanti</b>, e più piccolo se compare in documenti irrilevanti. Se il termine compare in ugual modo in entrambi, allora esso varrà <ILatex>{r`0`}</ILatex>.\n </p>\n <p>\n <i>Ci sarebbe una dimostrazione complessa che ho omesso per brevità.</i>\n </p>\n </Panel>\n <Panel title={\"Modello fuzzy\"}>\n <p>\n Estensione del <b>modello booleano</b> che ammette la possibilità che certe condizioni siano <b>parzialmente soddisfatte</b>.\n </p>\n <p>\n Invece che usare solo <ILatex>{r`0`}</ILatex> e <ILatex>{r`1`}</ILatex>, permette ai documenti di avere valori intermedi tra quei due.\n </p>\n <p>\n Le operazioni booleane vengono quindi modificate:\n </p>\n <PLatex>{r`\n \\begin{cases}\n a \\cap b = \\min(a, b)\\\\\n a \\cup b = \\max(a, b)\\\\\n \\not a = 1 - a\n \\end{cases} \n `}</PLatex>\n </Panel>\n <Panel title={\"Modello BM25\"}>\n <p>\n <b>Modello IR</b> simile ai modelli classici che però tiene conto anche della <b>frequenza dei termini</b> nei documenti e della <b>lunghezza dei documenti</b>.\n </p>\n <p>\n Permette anche di tenere in considerazione la frequenza dei termini <b>nella query</b>, nel caso essa sia molto lunga.\n </p>\n <p>\n <i>Ci sono formule che ho omesso per brevità.</i>\n </p>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Query\"}>\n <Panel title={\"User Information Need (UIN)\"}>\n <p>\n La <b>richiesta</b> di informazioni effettuata da un utente <b>in linguaggio naturale</b>.\n </p>\n </Panel>\n <Panel title={\"Query\"}>\n <p>\n La <b>traduzione</b> dell'UIN in un linguaggio <b>specifico al motore di ricerca</b>.\n </p>\n <p>\n La complessità di questo linguaggio dipende dall'utilizzatore del motore di ricerca: il suo <b>livello di esperienza</b>, il suo <b>background di conoscenze</b> e il <b>livello di approfondimento desiderato</b>.\n </p>\n </Panel>\n </Section>\n <Section title={\"Query languages\"}>\n <Panel title={\"Keyword-based query\"}>\n <Example>\n <Link href={\"https://it.wikipedia.org/w/index.php?search=&title=Speciale:Ricerca&go=Go\"}>Wikipedia</Link> e la <Link href={\"https://telegram.org/blog/shared-files#multisearch\"}>ricerca di Telegram</Link> usano un linguaggio di query <i>keyword-based</i>.\n </Example>\n <p>\n Definisce <b>parole chiave</b> da cercare all'interno dei documenti.\n </p>\n <p>\n In esse, è possibile cercare <b>molteplici</b> parole chiave, <b>concatenarle</b> per formare una <b>frase</b> oppure cercare parole a una data <b>prossimità</b> l'una dall'altra.\n </p>\n <p>\n Spesso processa il linguaggio naturale per trasformarne le parole specifiche in parole chiave più generiche.\n </p>\n <Example>\n Cercando su Telegram un plurale inglese, verranno restituiti anche i messaggi che riportano la stessa parola ma al singolare.\n </Example>\n </Panel>\n <Panel title={\"Pattern-based query\"}>\n <Example>\n Le <Link href={\"https://regex101.com/\"}>regex</Link> e i <Link href={\"https://en.wikipedia.org/wiki/Glob_(programming)\"}>glob</Link> sono due dei pattern-based query languages più comuni.\n </Example>\n <p>\n Definisce <b>parti di testo</b> da cercare all'interno dei documenti.\n </p>\n <p>\n Permettono dunque la ricerca di <b>prefissi</b>, <b>suffissi</b>, <b>sottostringhe</b> e <b>intervalli</b>.\n </p>\n </Panel>\n </Section>\n <Section>\n <Panel title={\"Boolean query\"}>\n <Example>\n <Link href={\"https://www.google.it/\"}>Google</Link>, <Link href={\"https://duckduckgo.com/\"}>DuckDuckGo</Link>, <Link href={\"https://www.ecosia.org/\"}>Ecosia</Link> usano tutti un linguaggio di query keyword-based booleano.\n </Example>\n <p>\n <b>Estendono</b> gli altri tipi di query permettendo l'inserimento di <b>operatori booleani</b> (<code>AND</code>, <code>OR</code> e <code>NOT</code>) tra le parole chiave.\n </p>\n <Example>\n Per esempi sulla sintassi per effettuare ricerche booleane su Google, visita <Link href={\"https://www.google.it/advanced_search\"}>Google Advanced Search</Link>.\n </Example>\n </Panel>\n <Panel title={\"Structural query\"}>\n <Example>\n <Link href={\"https://books.google.com/advanced_book_search\"}>Google Books</Link> permette di sfruttare la struttura fissa delle informazioni sui libri (titolo, autore, editore...) per ottenere risultati più precisi.,\n </Example>\n <p>\n Permettono di effettuare i precedenti tipi di query su <b>specifiche parti della struttura</b> dei documenti.\n </p>\n </Panel>\n <Panel title={\"Concept-based query\"}>\n <Example>\n <Link href={\"https://www.ncbi.nlm.nih.gov/mesh\"}>MeSH</Link> cataloga i paper di medicina caricati su PubMed organizzandoli in una gerarchia di categorie.\n </Example>\n <p>\n Limitano le keyword a un <b>vocabolario predefinito</b> utilizzato anche dai documenti.\n </p>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, BaseLink, Code} from \"bluelib\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Esame\"}>\n <Panel title={\"Contatti\"}>\n <ul>\n <li><Link href={\"mailto:federica.mandreoli@unimore.it\"}>Prof. Federica Mandreoli</Link></li>\n </ul>\n </Panel>\n <Panel title={\"Collegamenti\"}>\n <ul>\n <li><Link href={\"https://dolly.fim.unimore.it/2020/course/view.php?id=69\"}>Pagina Dolly Unimore</Link></li>\n </ul>\n </Panel>\n <Panel title={\"Download videolezioni\"}>\n <p>\n Puoi scaricare le videolezioni di Gestione dell'informazione con <Link href={\"https://github.com/Steffo99/bbbdl\"}>bbbdl</Link>:\n </p>\n <Code language={\"bash\"}>\n bbbdl sync -r https://raw.githubusercontent.com/Steffo99/unimoreinfo-wiki/main/gestionedellinformazione.json\n </Code>\n </Panel>\n </Section>\n </Fragment>\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n <Fragment>\n <Section title={\"Parametri di valutazione\"}>\n <Panel title={\"Richiamo\"}>\n <p>\n La <b>frazione dei documenti rilevanti totali restituita</b>:\n </p>\n <PLatex>{r`\n \\frac{R \\cap A}{R}\n `}</PLatex>\n </Panel>\n <Panel title={\"Precisione\"}>\n <p>\n La <b>frazione dei documenti restituiti che sono rilevanti</b>:\n </p>\n <PLatex>{r`\n \\frac{R \\cap A}{A}\n `}</PLatex>\n </Panel>\n </Section>\n <Section title={\"Valutazione dei modelli\"}>\n <Panel title={\"Come funziona?\"}>\n <p>\n Si effettuano <i>test</i> e si valutano precisione e richiamo ottenuti.\n </p>\n <aside>\n <u>Test</u>: verifica di un programma in cui l'output corretto è conosciuto a priori.\n </aside>\n <p>\n Il modello IR ideale ha valori di richiamo e precisione di 1, ma nella realtà questi valori tendono ad essere <b>inversamente proporzionali</b>.\n </p>\n </Panel>\n <Panel title={\"Misura a livelli di richiamo fissi\"}>\n <p>\n Si fissano un certo numero di livelli di richiamo desiderati e si misura la precisione che ha il modello in quei punti, creando una <i>curva di richiamo standard</i>.\n </p>\n <p>\n È possibile ottenere una <i>curva di richiamo interpolata</i> prendendo per ogni punto il valore di massima precisione tra esso e i punti precedenti.\n </p>\n <Example>\n Interpolata mi sembra un termine orribile... Non sarebbe molto meglio <b>monotonica</b>?\n </Example>\n </Panel>\n <Panel title={\"Media o valore singolo?\"}>\n <p>\n È possibile misurare la <i>curva di richiamo media</i> effettuando la media su più query dei vari valori, e la <i>curva di richiamo a valore singolo</i> effettuando una query sola.\n </p>\n <p>\n Sono entrambe importanti per effettuare una valutazione, perchè la curva media potrebbe <b>mascherare problemi di specifiche query</b> nei modelli.\n </p>\n </Panel>\n </Section>\n <ToBeContinued/>\n </Fragment>\n )\n}\n"],"sourceRoot":""} |