{"version":3,"sources":["webpack:///./routes/GestioneDellInformazione/11_Presentation.js","webpack:///./routes/GestioneDellInformazione/06_InformationContent.js","webpack:///./routes/GestioneDellInformazione/05_Thesaurus.js","webpack:///./routes/GestioneDellInformazione/08_Indexing.js","webpack:///./components/Example.less","webpack:///./routes/GestioneDellInformazione/index.js","webpack:///./routes/GestioneDellInformazione/04_DocumentProcessing.js","webpack:///./routes/GestioneDellInformazione/02_Similarity.js","webpack:///./components/ToBeContinued.js","webpack:///./routes/GestioneDellInformazione/07_AnalisiLessicale.js","webpack:///./routes/GestioneDellInformazione/01_InformationRetrival.js","webpack:///./components/Example.js","webpack:///./routes/GestioneDellInformazione/09_Modeling.js","webpack:///./routes/GestioneDellInformazione/03_Queries.js","webpack:///./routes/GestioneDellInformazione/00_Intro.js","webpack:///./routes/GestioneDellInformazione/10_Evaluation.js"],"names":["title","src","href","r","String","raw","module","exports","props","color","BoxColors","YELLOW","children","class","style","example","language"],"mappings":"8FAAA,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,aACZ,EAAC,IAAD,CAAOA,MAAO,cACV,8BACoB,sCADpB,iFAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAOC,IAAK,sCAGpB,EAAC,IAAD,CAAOD,MAAO,oBACV,0CACgC,iCADhC,KAGA,4CACkC,yCADlC,WAC2E,mCAD3E,SAC4G,uBAD5G,0BACkJ,EAAC,IAAD,CAAME,KAAM,mBAAZ,aADlJ,MAGA,EAAC,IAAD,0FAIJ,EAAC,IAAD,CAAOF,MAAO,qBACV,oCAC0B,gCAD1B,KACoD,yCADpD,KAGA,sG,gnBChCdG,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,+BACZ,EAAC,IAAD,CAAOA,MAAO,yBACV,6FACmF,EAAC,IAAD,KAASG,EAAT,MADnF,OAC8G,0BAD9G,IACiI,EAAC,IAAD,KAASA,EAAT,MADjI,WACmK,6EADnK,4CAGA,4DACkD,EAAC,IAAD,KAASA,EAAT,MADlD,MAIJ,EAAC,IAAD,CAAOH,MAAO,uBACV,yBACe,6BADf,6BAC8D,EAAC,IAAD,KAASG,EAAT,MAD9D,QAC0F,wBAD1F,0BAGA,EAAC,IAAD,KAASA,EAAT,MAGA,4BACkB,uBADlB,MACoC,sCADpC,W,6DCzBpB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASH,MAAO,aACZ,EAAC,IAAD,CAAOA,MAAO,UACV,iBACO,8BADP,iDAGA,EAAC,IAAD,iEAC6D,EAAC,IAAD,CAAME,KAAM,yCAAZ,aAD7D,KACoI,EAAC,IAAD,CAAMA,KAAM,6CAAZ,UADpI,MAC6M,EAAC,IAAD,CAAMA,KAAM,8CAAZ,kBAD7M,KAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAMA,KAAM,kCAAZ,WADJ,0DACuH,EAAC,IAAD,CAAMA,KAAM,kDAAZ,qBADvH,0D,moCCddC,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,kBACZ,EAAC,IAAD,CAAOA,MAAO,kBACV,kBACQ,6BADR,qDAC+E,qBAD/E,MAC+F,2BAD/F,KAGA,eACI,iCADJ,8CAGA,yBACe,0BADf,SACuC,gCADvC,eAC2E,oBAD3E,mCACuH,wDADvH,KACyK,2BADzK,MAGA,oEAC0D,0CAD1D,oCAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,eACV,WACI,sBADJ,OACsB,4BADtB,iBAGA,kEAGA,YACI,YACI,6BADJ,oBAC0C,wBAD1C,oBAEI,EAAC,IAAD,KAAOG,EAAP,OAMJ,YACI,0BADJ,KACwB,mBADxB,qBACqD,qCADrD,oBAEI,EAAC,IAAD,KAAOA,EAAP,OAgBJ,YACI,0BADJ,yDAGA,YACI,sBADJ,oBACmC,wCADnC,mBAEI,EAAC,IAAD,KACI,EAAC,IAAD,CAAMD,KAAM,iEAAZ,kCAEJ,EAAC,IAAD,6CACyC,EAAC,IAAD,CAAUA,KAAM,eAAhB,wBADzC,MAIJ,YACI,yBADJ,qBACuC,mBADvC,sBAIJ,6BACmB,kCADnB,4BACsE,6BADtE,+BAIJ,EAAC,IAAD,CAAOF,MAAO,gBACV,WACI,sBADJ,OACsB,kCADtB,6BAGA,gDACsC,6BADtC,KAC6D,0BAD7D,MAGA,6CACmC,EAAC,IAAD,KAASG,EAAT,MADnC,wBACsF,qBADtF,MACsG,2BADtG,mDACyK,sBADzK,iEAGA,wDAC8C,wBAD9C,KAGA,qCAC2B,4BAD3B,2EAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOH,MAAO,wBACV,gGAGA,YACI,kBAAO,sBAAP,0DACA,kBAAO,qBAAP,uCACA,kBAAO,yBAAP,mDACA,kBAAO,0BAAP,+C,2CC5GxBM,EAAOC,QAAU,CAAC,IAAM,aAAa,OAAS,gBAAgB,OAAS,gBAAgB,KAAO,cAAc,KAAO,cAAc,KAAO,cAAc,QAAU,iBAAiB,QAAU,mB,oCCD3L,uKAce,qBACX,OACI,aACI,0CACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,S,6DC7BZ,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASP,MAAO,uBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,kBACQ,wBADR,iDAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,wBACV,qDAC2C,gCAD3C,KACqE,oBADrE,MAGA,+CACqC,kCADrC,QACoE,mBADpE,uBACmG,oBADnG,KAGA,uFAC6E,wCAD7E,OAIJ,EAAC,IAAD,CAAOA,MAAO,mCACV,wBACc,sBADd,kBAC2C,4BAD3C,4BAGA,wCAC8B,uBAD9B,SACmD,2BADnD,KAGA,uEAC6D,wBAD7D,mBAGA,EAAC,IAAD,iEAIJ,EAAC,IAAD,CAAOA,MAAO,yBACV,wBACc,iCADd,+BAGA,yBACe,mCADf,KAC4C,kCAD5C,kBAIJ,EAAC,IAAD,CAAOA,MAAO,gCACV,wBACc,2CADd,yBAGA,4IAIJ,EAAC,IAAD,CAAOA,MAAO,iCACV,wBACc,iDADd,iBAGA,uCAC6B,qBAD7B,UACiD,qBADjD,KAGA,eACI,qBADJ,4FAGA,eACI,qBADJ,mEAIJ,EAAC,IAAD,CAAOA,MAAO,uBACV,wBACc,yBADd,8BAC0D,wBAD1D,QAC+E,wBAD/E,KAGA,eACI,wBADJ,+CACgE,0BADhE,eAC8F,8BAD9F,W,0sCC1EdG,G,UAAIC,OAAOC,KAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,wBACZ,EAAC,IAAD,CAAOA,MAAO,aACV,gCAGA,8BACoB,uBADpB,oBACoD,0CADpD,MAIJ,EAAC,IAAD,CAAOA,MAAO,cACV,kCAGA,8BACoB,qBADpB,+BAC6D,wCAD7D,MAIJ,EAAC,IAAD,CAAOA,MAAO,gBACV,mCAGA,8BACoB,wBADpB,yBAC0D,6CAD1D,cAKR,EAAC,IAAD,CAASA,MAAO,yBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,2FACiF,sCADjF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,4BACV,mDACyC,qCADzC,sBACyF,EAAC,IAAD,KAASG,EAAT,MADzF,MACqH,EAAC,IAAD,KAASA,EAAT,MADrH,iBAGA,EAAC,IAAD,KAASA,EAAT,OAIJ,EAAC,IAAD,CAAOH,MAAO,wBACV,oDAC0C,sCAD1C,YACiF,oDADjF,IAC8H,EAAC,IAAD,KAASG,EAAT,MAD9H,KAGA,EAAC,IAAD,KAASA,EAAT,QAKR,EAAC,IAAD,CAASH,MAAO,yCACZ,EAAC,IAAD,CAAOA,MAAO,UACV,4FACkF,kCADlF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,sBACV,mDACyC,6DADzC,IAC+F,EAAC,IAAD,KAASG,EAAT,MAD/F,uBAGA,EAAC,IAAD,KAASA,EAAT,Y,2DCzEpB,4BAEe,aAAUK,GACrB,OACI,EAAC,IAAD,CAAOR,MAAO,kBAAmBS,MAAOC,IAAUC,QAC9C,6DAGCH,EAAMI,a,2DCRnB,wCAMe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASZ,MAAO,qBACZ,EAAC,IAAD,CAAOA,MAAO,6BACV,4BACkB,6CADlB,wBAGA,qI,2DCdpB,8DAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,8BACZ,EAAC,IAAD,CAAOA,MAAO,UACV,WACI,uBADJ,OACuB,uBADvB,MACyC,oCADzC,2BAC6F,8BAD7F,KAGA,kCACwB,oBADxB,aAC8C,wBAD9C,sBACiF,uBADjF,6BAGA,wDAC8C,gCAD9C,MAIJ,EAAC,IAAD,CAAOA,MAAO,aACV,WACI,6CADJ,sBAC4D,0BAD5D,KAGA,EAAC,IAAD,+H,2DC3BpB,qCAEe,aAAUQ,GACrB,OACI,SAAKK,MAAOC,IAAMC,SACbP,EAAMI,a,ynDCDbT,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,gCACZ,EAAC,IAAD,CAAOA,MAAO,cACV,WACI,iCADJ,QACkC,qCADlC,KACiE,sBADjE,+BAGA,6CAGA,YACI,2BAAgB,EAAC,IAAD,KAASG,EAAT,OAChB,wBAAa,EAAC,IAAD,KAASA,EAAT,OACb,+BAAoB,sBAApB,IAAmC,EAAC,IAAD,KAASA,EAAT,MAAnC,oCAIZ,EAAC,IAAD,KACI,EAAC,IAAD,CAAOH,MAAO,oBACV,EAAC,IAAD,mEAGA,WACI,yBADJ,+DACiF,4BADjF,KACuG,0BADvG,MAGA,yBACe,mBADf,0DAGA,wCAC8B,2BAD9B,yCACuF,wCADvF,KAGA,WACI,2BADJ,kFAIJ,EAAC,IAAD,CAAOA,MAAO,oBACV,EAAC,IAAD,KACI,sBADJ,+CAGA,WACI,kCADJ,8CACyE,EAAC,IAAD,KAASG,EAAT,MADzE,+CAC4I,EAAC,IAAD,KAASA,EAAT,MAD5I,wBAGA,qBACW,kCADX,mDAGA,6DACmD,2BADnD,MAIJ,EAAC,IAAD,CAAOH,MAAO,sBACV,EAAC,IAAD,iDAGA,WACI,yBADJ,gBACkC,6BADlC,2CAC+F,oCAD/F,uDAC+K,oBAD/K,qCAGA,WACI,uCADJ,sFAGA,EAAC,IAAD,KAASG,EAAT,MAGA,sKAC4J,kCAD5J,kBACqM,iBADrM,qBACgO,kBADhO,MAGA,uEAIJ,EAAC,IAAD,CAAOH,MAAO,0BACV,WACI,yBADJ,yCAC2D,0BAD3D,uDAGA,4CACkC,EAAC,IAAD,KAASG,EAAT,MADlC,gFACwI,6CADxI,2HACqS,EAAC,IAAD,KAASA,EAAT,MADrS,KAGA,WACI,kFAGR,EAAC,IAAD,CAAOH,MAAO,iBACV,6BACmB,+BADnB,0DACiG,uCADjG,KAGA,oCAC0B,EAAC,IAAD,KAASG,EAAT,MAD1B,MACoD,EAAC,IAAD,KAASA,EAAT,MADpD,mEAGA,gEAGA,EAAC,IAAD,KAASA,EAAT,OAQJ,EAAC,IAAD,CAAOH,MAAO,gBACV,WACI,yBADJ,gEACkF,oCADlF,0BACqI,sCADrI,KAGA,kFACwE,0BADxE,oCAGA,WACI,gE,2DClHxB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,+BACV,iBACO,wBADP,4CACgE,qCADhE,MAIJ,EAAC,IAAD,CAAOA,MAAO,SACV,iBACO,yBADP,8BACmD,6CADnD,KAGA,0GACgG,oCADhG,YACqI,uCADrI,SAC0K,oDAD1K,OAKR,EAAC,IAAD,CAASA,MAAO,mBACZ,EAAC,IAAD,CAAOA,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,6EAAZ,aADJ,SACmH,EAAC,IAAD,CAAMA,KAAM,sDAAZ,uBADnH,iCAC6O,4BAD7O,KAGA,wBACc,4BADd,0CAGA,2CACiC,yBADjC,mBACkE,2BADlE,oBACsG,oBADtG,qCACoJ,yBADpJ,sBAGA,2HAGA,EAAC,IAAD,uIAIJ,EAAC,IAAD,CAAOF,MAAO,uBACV,EAAC,IAAD,WACO,EAAC,IAAD,CAAME,KAAM,yBAAZ,SADP,QAC6D,EAAC,IAAD,CAAMA,KAAM,oDAAZ,QAD7D,2DAGA,wBACc,6BADd,0CAGA,8CACoC,uBADpC,KACqD,uBADrD,KACsE,4BADtE,MAC6F,yBAD7F,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOF,MAAO,iBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,0BAAZ,UADJ,KACyD,EAAC,IAAD,CAAMA,KAAM,2BAAZ,cADzD,KACmH,EAAC,IAAD,CAAMA,KAAM,2BAAZ,UADnH,+DAGA,WACI,wBADJ,yDAC0E,iCAD1E,KACqG,qBADrG,KACuH,oBADvH,MACyI,qBADzI,2BAGA,EAAC,IAAD,qFACiF,EAAC,IAAD,CAAMA,KAAM,yCAAZ,0BADjF,MAIJ,EAAC,IAAD,CAAOF,MAAO,oBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,iDAAZ,gBADJ,4IAGA,qEAC2D,+CAD3D,oBAIJ,EAAC,IAAD,CAAOF,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,qCAAZ,QADJ,kGAGA,uCAC6B,sCAD7B,0C,2DChFpB,oDAOe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASF,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,YACV,YACI,YAAI,EAAC,IAAD,CAAME,KAAM,wCAAZ,+BAGZ,EAAC,IAAD,CAAOF,MAAO,gBACV,YACI,YAAI,EAAC,IAAD,CAAME,KAAM,2DAAZ,2BAGZ,EAAC,IAAD,CAAOF,MAAO,yBACV,+EACqE,EAAC,IAAD,CAAME,KAAM,qCAAZ,SADrE,KAGA,EAAC,IAAD,CAAMc,SAAU,QAAhB,sH,2sDCpBdb,G,UAAIC,OAAOC,KAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,4BACZ,EAAC,IAAD,CAAOA,MAAO,YACV,iBACO,iEADP,KAGA,EAAC,IAAD,KAASG,EAAT,OAIJ,EAAC,IAAD,CAAOH,MAAO,cACV,iBACO,mEADP,KAGA,EAAC,IAAD,KAASG,EAAT,QAKR,EAAC,IAAD,CAASH,MAAO,yBACZ,EAAC,IAAD,CAAOA,MAAO,8BACV,4BACkB,mBADlB,kDAGA,eACI,mBADJ,8EAGA,4HACkH,yCADlH,KAGA,4EACkE,kCADlE,KAGA,EAAC,IAAD,oGACgG,0BADhG,MAIJ,EAAC,IAAD,CAAOA,MAAO,sCACV,kJACwI,yCADxI,KAGA,uCAC6B,4CAD7B,4FAGA,EAAC,IAAD,8EAC0E,yBAD1E,MAIJ,EAAC,IAAD,CAAOA,MAAO,2BACV,sCAC4B,sCAD5B,4DACmH,iDADnH,gCAGA,sGAC4F,sDAD5F,kBAIJ,EAAC,IAAD,CAAOA,MAAO,gCACV,8DAGA,sEAC4D,sCAD5D,iBAIJ,EAAC,IAAD,CAAOA,MAAO,0BACV,4DACkD,EAAC,IAAD,KAASG,EAAT,MADlD,0BAGA,EAAC,IAAD,qGAKR,EAAC,IAAD,CAASH,MAAO,oBACZ,EAAC,IAAD,CAAOA,MAAO,YACV,4BACkB,6BADlB,KAGA,iBACO,6BADP,yCACkE,EAAC,IAAD,KAASG,EAAT,MADlE,qBAC2G,EAAC,IAAD,KAASA,EAAT,MAD3G,KAGA,EAAC,IAAD,KAASA,EAAT,OAIJ,EAAC,IAAD,CAAOH,MAAO,YACV,4EACkE,4BADlE,IACuF,EAAC,IAAD,KAASG,EAAT,MADvF,kBAC6H,EAAC,IAAD,KAASA,EAAT,MAD7H,mBACwK,EAAC,IAAD,KAASA,EAAT,MADxK,oCAGA,EAAC,IAAD,KAASA,EAAT,QAKR,EAAC,IAAD,CAASH,MAAO,qBACZ,EAAC,IAAD,CAAOA,MAAO,oCACV,kFACwE,2DADxE,KAGA,yBACe,uCADf,SACoD,+BADpD,mBAGA,EAAC,IAAD,mDAEI,UAAMc,MAAO,2CAAb,UAIJ,EAAC,IAAD,kEAC8D,EAAC,IAAD,KAASX,EAAT,MAD9D,oBACwH,EAAC,IAAD,KAASA,EAAT,MADxH,kBACgL,EAAC,IAAD,KAASA,EAAT,MADhL,iBAIJ,EAAC,IAAD,CAAOH,MAAO,wBAAyBS,MAAOC,IAAUC,QACpD,kDACwC,+CADxC,KAGA,sF","file":"route-GestioneDellInformazione.chunk.122eb.js","sourcesContent":["import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Image} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Le summary sono brevi spezzoni di testo che permettono all'utente di capire quali documenti siano rilevanti per lui.\n

\n \n \n \n
\n \n

\n Summary fisse che dipendono solo dal documento.\n

\n

\n Possono essere generate dalle prime parole del documento, dalle frasi più importanti o da metadati del documento stesso (OpenGraph).\n

\n \n Opinione personale: le summary generate da OpenGraph solitamente fanno schifo :(\n \n
\n \n

\n Summary che dipendono sia dal documento, sia dalla query effettuata.\n

\n

\n Generalmente, estraggono le frasi vicino alle occorrenze dei termini della query.\n

\n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Un supplemento al thesaurus specifico a un certo testo: aggiunge ad ogni token {r`c`} la probabilità {r`P(c)`} che un termine selezionato a caso del testo appartenga al sottoalbero formato dal token e i suoi discendenti.\n

\n

\n La radice del thesaurus ha sempre probabilità {r`1`}.\n

\n
\n \n

\n Una misura probabilistica di quanto un certo token {r`c`} sia specifico in un certo contesto:\n

\n {r`\n IC(c) = - \\log \\left( P(c) \\right)\n `}\n

\n È anche detta sorpresa o informazione di Shannon.\n

\n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Todo} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Un albero di token organizzati in una gerarchia di significato.\n

\n \n Il token \"mela\" avrà come genitore \"frutto\" e come figli \"Renetta\", \"Fuji\" e \"Granny Smith\".\n \n \n WordNet è un thesaurus generale per la lingua inglese, mentre Nuovo soggettario è un thesaurus generale per la lingua italiana.\n \n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Code, BaseLink} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Una struttura dati che permette di velocizzare le ricerche su testi grandi e semi-statici.\n

\n \n

\n Si crea un vocabolario dall'insieme dei token, e ad ogni token del vocabolario si associa una lista ordinata di tutte le sue occorrenze (posting list).\n

\n

\n L'efficacia ed efficienza dell'indice dipendono dalle strutture di indicizzazione utilizzate per serializzarlo.\n

\n
\n
\n
\n \n

\n Insieme di tutti i token ricercabili.\n

\n

\n Può essere implementato con diverse strutture dati:\n

\n
    \n
  • \n Array ordinato, utilizzando la bisezione per gli accessi;\n {r`\n ciao → R1, R15, R123\n steffo → R1, R14\n ciano → R1231\n `}\n
  • \n
  • \n Prefix tree (trie), utilizzando le proprietà degli alberi per gli accessi;\n {r`\n - [root]\n - c\n - i\n - a\n - o\n - R1\n - R15\n - R123\n - no\n - R1231\n - steffo\n - R1\n - R14\n `}\n
  • \n
  • \n Suffix tree, come il prefix tree ma partendo dall'ultima lettera\n
  • \n
  • \n B+ tree, utilizzando le proprietà degli alberi B+ per gli accessi\n \n Visualizzazione di un B+ tree\n \n \n È la stessa struttura utilizzata dai database relazionali.\n \n
  • \n
  • \n Dizionario, utilizzando gli hash per gli accessi.\n
  • \n
\n

\n Per permettere pattern-based query, è possibile utilizzare più vocabolari per un singolo documento.\n

\n
\n \n

\n Insieme di tutte le occorrenze di un determinato token.\n

\n

\n Viene implementata attraverso una lista ordinata (sorted list).\n

\n

\n Essendo ordinata, è efficiente {r`O(n + m)`} nelle operazioni di unione e intersezione tra più posting list: si mantiene su ognuna un cursore che avanza quando l'occorrenza a cui punta è stata superata.\n

\n

\n Non è però efficiente nelle operazioni di negazione.\n

\n

\n È possibile aggiungere skip pointers alle posting list, in modo da rendere più efficiente l'intersezione.\n

\n
\n
\n
\n \n

\n Per effettuare una ricerca utilizzando l'indice, sono necessari i seguenti passi:\n

\n
    \n
  1. Si cercano individualmente i termini della query nel vocabolario
  2. \n
  3. Si accede alle posting list dei vari termini
  4. \n
  5. Si effettuano operazioni logiche sui dati delle posting list
  6. \n
  7. Si restituisce il sottoinsieme di token risultante
  8. \n
\n
\n
\n
\n )\n}\n","// extracted by mini-css-extract-plugin\nmodule.exports = {\"red\":\"red__2y1B_\",\"orange\":\"orange__dD2kx\",\"yellow\":\"yellow__OEpwl\",\"lime\":\"lime__CVe41\",\"cyan\":\"cyan__26ZAg\",\"blue\":\"blue__LO7Xm\",\"magenta\":\"magenta__1Akee\",\"example\":\"example__2PzAa\"};","import Intro from \"./00_Intro\";\nimport InformationRetrieval from \"./01_InformationRetrival\";\nimport Similarity from \"./02_Similarity\";\nimport Queries from \"./03_Queries\";\nimport DocumentProcessing from \"./04_DocumentProcessing\";\nimport Thesaurus from \"./05_Thesaurus\";\nimport InformationContent from \"./06_InformationContent\";\nimport AnalisiLessicale from \"./07_AnalisiLessicale\";\nimport Indexing from \"./08_Indexing\";\nimport Modeling from \"./09_Modeling\";\nimport Evaluation from \"./10_Evaluation\";\nimport Presentation from \"./11_Presentation\";\n\n\nexport default function () {\n return (\n
\n

Gestione dell'informazione

\n \n \n \n \n \n \n \n \n \n \n \n \n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\nimport Example from \"../../components/Example\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Una procedura che ottimizza un documento per la ricerca.\n

\n
\n
\n
\n \n

\n Passo che trasforma il documento in un insieme di parole (token).\n

\n

\n Deve decidere come considerare i simboli tipografici, il case delle lettere e le cifre.\n

\n

\n Inoltre, è possibile che disambigui tra i vari significati delle parole (word sense disambiguation).\n

\n
\n \n

\n Passo che elimina dalla lista i token inutili ai fini delle ricerche.\n

\n

\n Esse solitamente sono gli articoli e le preposizioni.\n

\n

\n Con l'avanzare degli anni, le stopwords hanno iniziato a diminuire sempre di più.\n

\n \n I motori di ricerca moderni non usano nessuna stopword.\n \n
\n \n

\n Passo che riduce alla radice tutti i token della lista.\n

\n

\n Converte i plurali in singolari, passati ai presenti, e così via.\n

\n
\n \n

\n Passo che rimuove i caratteri speciali contenuti nei token.\n

\n

\n Duplica le parole separate da trattino nella versione con spazio e senza spazio, rimuove gli accenti non significativi, etc.\n

\n
\n \n

\n Passo che seleziona i termini più importanti della lista.\n

\n

\n Generalmente sfrutta dei parser o dei tagger.\n

\n \n \n
\n \n

\n Passo che classifica il documento in una o più categorie del thesaurus.\n

\n \n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n
\n synonymy\n
\n

\n Due parole sono sinonimi quando hanno lo stesso identico significato.\n

\n
\n \n
\n similarity\n
\n

\n Due parole sono simili rappresentano concetti con caratteristiche in comune.\n

\n
\n \n
\n relatedness\n
\n

\n Due parole sono correlate quando rappresentano concetti vengono usati insieme spesso.\n

\n
\n
\n
\n \n

\n Un modo per misurare la somiglianza tra due parole confrontando solo la loro posizione nel thesaurus.\n

\n
\n
\n
\n \n

\n Calcola la similarità basandosi sull'inverso della distanza tra le due parole {r`c_1`} e {r`c_2`} nell'albero:\n

\n {r`\n sim\\_pd(c_1, c_2) = \\frac{1}{dist(c_1, c_2) + 1}\n `}\n
\n \n

\n Calcola la similarità basandosi sulla profondità dei due nodi e sulla profondità del minimo antenato comune {r`mac`}:\n

\n {r`\n sim\\_wp(c_1, c_2) = \\frac{2 \\cdot depth(mac(c_1, c_2))}{depth(c_1) + depth(c_2)}\n `}\n
\n
\n
\n \n

\n Un modo per misurare la similarità tra due parole attraverso i loro valori di information content.\n

\n
\n
\n
\n \n

\n Calcola la similarità basandosi sull'information content del minimo antenato comune {r`mac`} tra i due termini.\n

\n {r`\n sim\\_rs(c_1, c_2) = - \\log P( mac(c_1, c_2) )\n `}\n
\n
\n
\n )\n}\n","import {BoxColors, Panel} from \"bluelib\";\n\nexport default function (props) {\n return (\n \n

\n Questa sezione è incompleta. Torna più avanti!\n

\n {props.children}\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Procedura che disambigua tra più significati dello stesso token.\n

\n

\n Si può realizzare confrontando la somiglianza di ogni significato con tutti gli altri nomi presenti nella frase.\n

\n
\n
\n
\n )\n}\n","import {Panel, Section} from \"bluelib\";\nimport {Fragment} from \"preact\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function (props) {\n return (\n \n
\n \n

\n Processo di raccolta e recupero approssimato di informazioni spesso non strutturate.\n

\n

\n Riceve in input una query, elabora documenti e restituisce una risposta più rilevante possibile.\n

\n

\n Un'applicazione che effettua IR si chiama motore di ricerca.\n

\n
\n \n

\n Raggruppamenti di informazioni che possono avere varie forme.\n

\n \n Potrebbe essere un documento un file, oppure un gruppo di informazioni contenute in quel file (email, slides)...\n \n
\n
\n
\n )\n}\n","import style from \"./Example.less\";\n\nexport default function (props) {\n return (\n
\n {props.children}\n
\n );\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, BoxColors} from \"bluelib\";\nimport Example from \"../../components/Example\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n Modelli matematici che ordinano per rilevanza (ranking) i risultati di una query.\n

\n

\n Formalmente, sono composti da:\n

\n
    \n
  • I documenti {r`D`}
  • \n
  • La query {r`Q`}
  • \n
  • Una funzione di ranking {r`rank(q_i, d_j) \\to \\mathbb{R}`} che quantifica la similarità
  • \n
\n
\n
\n
\n \n \n I motori di ricerca web usano generalmente questo modello.\n \n

\n Modello IR che rappresenta ogni documento come un insieme ordinato di parole chiave (index terms).\n

\n

\n Associa un peso a ogni token, e ordina l'insieme in base a quel peso.\n

\n

\n Generalmente, i pesi sono indipendenti uno dall'altro, e questo permette di calcolarli parallelamente.\n

\n

\n Bag-of-words: L'ordine delle parole nel documento viene solitamente ignorato dal ranking.\n

\n
\n \n \n grep è a tutti gli effetti un modello booleano.\n \n

\n Modello IR classico che dà un peso booleano a ogni documento: {r`1`} se soddisfa tutti i requisiti della query, {r`0`} se non li soddisfa.\n

\n

\n Ha una precisione perfetta, ma richiede query ben preparate e specifiche.\n

\n

\n È anche facile da implementare utilizzando una posting list.\n

\n
\n \n \n Apache Lucene si basa su questo modello.\n \n

\n Modello IR in cui ogni caratteristica di un documento è rappresentata con un valore floating point e l'intero documento è quindi rappresentato da una n-pla di tutte le sue caratteristiche.\n

\n

\n Similarità cosinusoidale: il ranking si basa sull'angolo tra il \"vettore query\" e il \"vettore documento\":\n

\n {r`\n rank(d_j, q) = \\frac{d_j \\cdot q}{\\| d_j \\| \\times \\| q \\|}\n `}\n

\n Spesso si associa un peso a ogni dimensione in modo da variare l'importanza di una data caratteristica; comunemente, per i testi, si usano come pesi le frequenza dei token normalizzate (df) o logaritmiche (idf).\n

\n

\n Come il modello classico, ignora l'ordine delle parole.\n

\n
\n \n

\n Modello IR che effettua il ranking in base alla probabilità di comparsa dei termini della query nei documenti.\n

\n

\n Si basa sul calcolare un peso {r`c_i`} per ogni termine della query. Quest'ultimo diventa più grande se il termine compare in documenti rilevanti, e più piccolo se compare in documenti irrilevanti. Se il termine compare in ugual modo in entrambi, allora esso varrà {r`0`}.\n

\n

\n Ci sarebbe una dimostrazione complessa che ho omesso per brevità.\n

\n
\n \n

\n Estensione del modello booleano che ammette la possibilità che certe condizioni siano parzialmente soddisfatte.\n

\n

\n Invece che usare solo {r`0`} e {r`1`}, permette ai documenti di avere valori intermedi tra quei due.\n

\n

\n Le operazioni booleane vengono quindi modificate:\n

\n {r`\n \\begin{cases}\n a \\land b = \\min(a, b)\\\\\n a \\lor b = \\max(a, b)\\\\\n \\neg\\ a = 1 - a\n \\end{cases} \n `}\n
\n \n

\n Modello IR simile ai modelli classici che però tiene conto anche della frequenza dei termini nei documenti e della lunghezza dei documenti.\n

\n

\n Permette anche di tenere in considerazione la frequenza dei termini nella query, nel caso essa sia molto lunga.\n

\n

\n Ci sono formule che ho omesso per brevità.\n

\n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n La richiesta di informazioni effettuata da un utente in linguaggio naturale.\n

\n
\n \n

\n La traduzione dell'UIN in un linguaggio specifico al motore di ricerca.\n

\n

\n La complessità di questo linguaggio dipende dall'utilizzatore del motore di ricerca: il suo livello di esperienza, il suo background di conoscenze e il livello di approfondimento desiderato.\n

\n
\n
\n
\n \n \n Wikipedia e la ricerca di Telegram usano un linguaggio di query keyword-based.\n \n

\n Definisce parole chiave da cercare all'interno dei documenti.\n

\n

\n In esse, è possibile cercare molteplici parole chiave, concatenarle per formare una frase oppure cercare parole a una data prossimità l'una dall'altra.\n

\n

\n Spesso processa il linguaggio naturale per trasformarne le parole specifiche in parole chiave più generiche.\n

\n \n Cercando su Telegram un plurale inglese, verranno restituiti anche i messaggi che riportano la stessa parola ma al singolare.\n \n
\n \n \n Le regex e i glob sono due dei pattern-based query languages più comuni.\n \n

\n Definisce parti di testo da cercare all'interno dei documenti.\n

\n

\n Permettono dunque la ricerca di prefissi, suffissi, sottostringhe e intervalli.\n

\n
\n
\n
\n \n \n Google, DuckDuckGo, Ecosia usano tutti un linguaggio di query keyword-based booleano.\n \n

\n Estendono gli altri tipi di query permettendo l'inserimento di operatori booleani (AND, OR e NOT) tra le parole chiave.\n

\n \n Per esempi sulla sintassi per effettuare ricerche booleane su Google, visita Google Advanced Search.\n \n
\n \n \n Google Books permette di sfruttare la struttura fissa delle informazioni sui libri (titolo, autore, editore...) per ottenere risultati più precisi.,\n \n

\n Permettono di effettuare i precedenti tipi di query su specifiche parti della struttura dei documenti.\n

\n
\n \n \n MeSH cataloga i paper di medicina caricati su PubMed organizzandoli in una gerarchia di categorie.\n \n

\n Limitano le keyword a un vocabolario predefinito utilizzato anche dai documenti.\n

\n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, BaseLink, Code} from \"bluelib\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n
    \n
  • Prof. Federica Mandreoli
  • \n
\n
\n \n
    \n
  • Pagina Dolly Unimore
  • \n
\n
\n \n

\n Puoi scaricare le videolezioni di Gestione dell'informazione con bbbdl:\n

\n \n bbbdl sync -r https://raw.githubusercontent.com/Steffo99/unimoreinfo-wiki/main/gestionedellinformazione.json\n \n
\n
\n
\n )\n}\n","import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, BoxColors} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport ToBeContinued from \"../../components/ToBeContinued\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n
\n \n

\n La frazione dei documenti rilevanti totali restituita:\n

\n {r`\n \\frac{R \\cap A}{R}\n `}\n
\n \n

\n La frazione dei documenti restituiti che sono rilevanti:\n

\n {r`\n \\frac{R \\cap A}{A}\n `}\n
\n
\n
\n \n

\n Si effettuano test e si valutano precisione e richiamo ottenuti.\n

\n \n

\n Il modello IR ideale ha valori di richiamo e precisione di 1, ma nella realtà questi valori tendono ad essere inversamente proporzionali.\n

\n

\n Un fattore significativo nel richiamo e nella precisione è la forma del documento.\n

\n \n Libri interi, capitoli, pagine o frasi; possono essere tutti documenti, cambia solo la loro granularità.\n \n
\n \n

\n Si fissano un certo numero di livelli di richiamo desiderati e si misura la precisione che ha il modello in quei punti, creando una curva di richiamo standard.\n

\n

\n È possibile ottenere una curva di richiamo interpolata prendendo per ogni punto il valore di massima precisione tra esso e i punti precedenti.\n

\n \n Interpolata mi sembra un termine orribile... Non sarebbe molto meglio monotonica?\n \n
\n \n

\n È possibile misurare la curva di richiamo media effettuando la media su più query dei vari valori, e la curva di richiamo a valore singolo effettuando una query sola.\n

\n

\n Sono entrambe importanti per effettuare una valutazione, perchè la curva media potrebbe mascherare problemi di specifiche query nei modelli.\n

\n
\n \n

\n La media tra i valori di più curve di richiamo.\n

\n

\n È utile per le valutazioni in cui l'utente sta cercando più documenti rilevanti alla volta.\n

\n
\n \n

\n Valori di recall e precision riguardo i primi {r`R`} documenti restituiti.\n

\n \n La prima pagina di Google (10 documenti) considererà i valori di 10-recall e 10-precision.\n \n
\n
\n
\n \n

\n È anche detta media armonica.\n

\n

\n Un singolo valore che tiene conto sia della precisione {r`p`} sia del richiamo {r`r`}:\n

\n {r`\n F = \\frac{2}{\\frac{1}{p} + \\frac{1}{r}}\n `}\n
\n \n

\n Una versione più configurabile della Misura F che permette di dare priorità {r`b`} a precisione ({r`b > 1`}) o a richiamo ({r`b < 1`}) in base alle proprie esigenze:\n

\n {r`\n E = 1 - \\frac{1 + b^2}{\\frac{b^2}{r} + \\frac{1}{p}}\n `}\n
\n
\n
\n \n

\n Misura per valutare i motori di ricerca online che tiene conto dell'ordine in cui vengono restituiti i documenti.\n

\n

\n Si basa su valutazioni di rilevanza e su pesi posizionali dei risultati.\n

\n \n Valuta quanto è stata utile questa ricerca:\n \n ☆☆☆☆☆\n \n \n \n La valutazione del primo risultato viene moltiplicata per {r`\\frac{1}{\\log_2(1)}`}, la seconda per {r`\\frac{1}{\\log_2(2)}`}, la terza per {r`\\frac{1}{\\log_2(3)}`} e così via.\n \n
\n \n

\n Miglioramento alla DCG che supporta quantità di risultati differenti.\n

\n \n Non dice la formula, e l'esempio non esemplifica un bel niente...\n \n
\n
\n
\n )\n}\n"],"sourceRoot":""}