{"version":3,"sources":["webpack:///./routes/GestioneDellInformazione/11_Presentation.js","webpack:///./routes/GestioneDellInformazione/06_InformationContent.js","webpack:///./routes/GestioneDellInformazione/05_Thesaurus.js","webpack:///./routes/GestioneDellInformazione/08_Indexing.js","webpack:///./components/Example.less","webpack:///./routes/GestioneDellInformazione/index.js","webpack:///./routes/GestioneDellInformazione/04_DocumentProcessing.js","webpack:///./routes/GestioneDellInformazione/02_Similarity.js","webpack:///./components/ToBeContinued.js","webpack:///./routes/GestioneDellInformazione/07_AnalisiLessicale.js","webpack:///./routes/GestioneDellInformazione/01_InformationRetrival.js","webpack:///./components/Example.js","webpack:///./routes/GestioneDellInformazione/09_Modeling.js","webpack:///./routes/GestioneDellInformazione/03_Queries.js","webpack:///./routes/GestioneDellInformazione/00_Intro.js","webpack:///./routes/GestioneDellInformazione/10_Evaluation.js"],"names":["title","src","href","r","String","raw","module","exports","props","color","BoxColors","YELLOW","children","class","style","example","language"],"mappings":"8FAAA,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,aACZ,EAAC,IAAD,CAAOA,MAAO,cACV,8BACoB,sCADpB,iFAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAOC,IAAK,sCAGpB,EAAC,IAAD,CAAOD,MAAO,oBACV,0CACgC,iCADhC,KAGA,4CACkC,yCADlC,WAC2E,mCAD3E,SAC4G,uBAD5G,0BACkJ,EAAC,IAAD,CAAME,KAAM,mBAAZ,aADlJ,MAGA,EAAC,IAAD,0FAIJ,EAAC,IAAD,CAAOF,MAAO,qBACV,oCAC0B,gCAD1B,KACoD,yCADpD,KAGA,sG,0HChCpB,MAAMG,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,+BACZ,EAAC,IAAD,CAAOA,MAAO,yBACV,6FACmF,EAAC,IAAD,KAASG,EAAT,OAAW,OAD9F,OAC8G,0BAD9G,IACiI,EAAC,IAAD,KAASA,EAAT,OAAW,UAD5I,WACmK,6EADnK,4CAGA,4DACkD,EAAC,IAAD,KAASA,EAAT,OAAW,OAD7D,MAIJ,EAAC,IAAD,CAAOH,MAAO,uBACV,yBACe,6BADf,6BAC8D,EAAC,IAAD,KAASG,EAAT,OAAW,OADzE,QAC0F,wBAD1F,0BAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;yBAGX,4BACkB,uBADlB,MACoC,sCADpC,W,6DCzBpB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASH,MAAO,aACZ,EAAC,IAAD,CAAOA,MAAO,UACV,iBACO,8BADP,iDAGA,EAAC,IAAD,iEAC6D,EAAC,IAAD,CAAME,KAAM,yCAAZ,aAD7D,KACoI,EAAC,IAAD,CAAMA,KAAM,6CAAZ,UADpI,MAC6M,EAAC,IAAD,CAAMA,KAAM,8CAAZ,kBAD7M,KAGA,EAAC,IAAD,KACI,EAAC,IAAD,CAAMA,KAAM,kCAAZ,WADJ,0DACuH,EAAC,IAAD,CAAMA,KAAM,kDAAZ,qBADvH,0D,8ICdpB,MAAMC,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,kBACZ,EAAC,IAAD,CAAOA,MAAO,kBACV,kBACQ,6BADR,qDAC+E,qBAD/E,MAC+F,2BAD/F,KAGA,eACI,iCADJ,8CAGA,yBACe,0BADf,SACuC,gCADvC,eAC2E,oBAD3E,mCACuH,wDADvH,KACyK,2BADzK,MAGA,oEAC0D,0CAD1D,oCAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,eACV,WACI,sBADJ,OACsB,4BADtB,iBAGA,kEAGA,YACI,YACI,6BADJ,oBAC0C,wBAD1C,oBAEI,EAAC,IAAD,KAAOG,EAAP,OAAS;;;;kCAMb,YACI,0BADJ,KACwB,mBADxB,qBACqD,qCADrD,oBAEI,EAAC,IAAD,KAAOA,EAAP,OAAS;;;;;;;;;;;;;;kCAgBb,YACI,0BADJ,yDAGA,YACI,sBADJ,oBACmC,wCADnC,mBAEI,EAAC,IAAD,KACI,EAAC,IAAD,CAAMD,KAAM,iEAAZ,kCAEJ,EAAC,IAAD,6CACyC,EAAC,IAAD,CAAUA,KAAM,eAAhB,wBADzC,MAIJ,YACI,yBADJ,qBACuC,mBADvC,sBAIJ,6BACmB,kCADnB,4BACsE,6BADtE,+BAIJ,EAAC,IAAD,CAAOF,MAAO,gBACV,WACI,sBADJ,OACsB,kCADtB,6BAGA,gDACsC,6BADtC,KAC6D,0BAD7D,MAGA,6CACmC,EAAC,IAAD,KAASG,EAAT,OAAW,cAD9C,wBACsF,qBADtF,MACsG,2BADtG,mDACyK,sBADzK,iEAGA,wDAC8C,wBAD9C,KAGA,qCAC2B,4BAD3B,2EAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOH,MAAO,wBACV,gGAGA,YACI,kBAAO,sBAAP,0DACA,kBAAO,qBAAP,uCACA,kBAAO,yBAAP,mDACA,kBAAO,0BAAP,+C,2CC5GxBM,EAAOC,QAAU,CAAC,IAAM,aAAa,OAAS,gBAAgB,OAAS,gBAAgB,KAAO,cAAc,KAAO,cAAc,KAAO,cAAc,QAAU,iBAAiB,QAAU,mB,oCCD3L,uKAce,qBACX,OACI,aACI,0CACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,MACA,EAAC,IAAD,S,6DC7BZ,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASP,MAAO,uBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,kBACQ,wBADR,iDAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,wBACV,qDAC2C,gCAD3C,KACqE,oBADrE,MAGA,+CACqC,kCADrC,QACoE,mBADpE,uBACmG,oBADnG,KAGA,uFAC6E,wCAD7E,OAIJ,EAAC,IAAD,CAAOA,MAAO,mCACV,wBACc,sBADd,kBAC2C,4BAD3C,4BAGA,wCAC8B,uBAD9B,SACmD,2BADnD,KAGA,uEAC6D,wBAD7D,mBAGA,EAAC,IAAD,iEAIJ,EAAC,IAAD,CAAOA,MAAO,yBACV,wBACc,iCADd,+BAGA,yBACe,mCADf,KAC4C,kCAD5C,kBAIJ,EAAC,IAAD,CAAOA,MAAO,gCACV,wBACc,2CADd,yBAGA,4IAIJ,EAAC,IAAD,CAAOA,MAAO,iCACV,wBACc,iDADd,iBAGA,uCAC6B,qBAD7B,UACiD,qBADjD,KAGA,eACI,qBADJ,4FAGA,eACI,qBADJ,mEAIJ,EAAC,IAAD,CAAOA,MAAO,uBACV,wBACc,yBADd,8BAC0D,wBAD1D,QAC+E,wBAD/E,KAGA,eACI,wBADJ,+CACgE,0BADhE,eAC8F,8BAD9F,W,sIC1EpB,MAAMG,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,wBACZ,EAAC,IAAD,CAAOA,MAAO,aACV,gCAGA,8BACoB,uBADpB,oBACoD,0CADpD,MAIJ,EAAC,IAAD,CAAOA,MAAO,cACV,kCAGA,8BACoB,qBADpB,+BAC6D,wCAD7D,MAIJ,EAAC,IAAD,CAAOA,MAAO,gBACV,mCAGA,8BACoB,wBADpB,yBAC0D,6CAD1D,cAKR,EAAC,IAAD,CAASA,MAAO,yBACZ,EAAC,IAAD,CAAOA,MAAO,UACV,2FACiF,sCADjF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,4BACV,mDACyC,qCADzC,sBACyF,EAAC,IAAD,KAASG,EAAT,OAAW,SADpG,MACqH,EAAC,IAAD,KAASA,EAAT,OAAW,SADhI,iBAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;0BAIf,EAAC,IAAD,CAAOH,MAAO,wBACV,oDAC0C,sCAD1C,YACiF,oDADjF,IAC8H,EAAC,IAAD,KAASG,EAAT,OAAW,SADzI,KAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;2BAKnB,EAAC,IAAD,CAASH,MAAO,yCACZ,EAAC,IAAD,CAAOA,MAAO,UACV,4FACkF,kCADlF,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOA,MAAO,sBACV,mDACyC,6DADzC,IAC+F,EAAC,IAAD,KAASG,EAAT,OAAW,SAD1G,uBAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;0FCzE/B,4BAEe,aAAUK,GACrB,OACI,EAAC,IAAD,CAAOR,MAAO,kBAAmBS,MAAOC,IAAUC,QAC9C,6DAGCH,EAAMI,a,2DCRnB,wCAMe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASZ,MAAO,qBACZ,EAAC,IAAD,CAAOA,MAAO,6BACV,4BACkB,6CADlB,wBAGA,qI,2DCdpB,8DAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,8BACZ,EAAC,IAAD,CAAOA,MAAO,UACV,WACI,uBADJ,OACuB,uBADvB,MACyC,oCADzC,2BAC6F,8BAD7F,KAGA,kCACwB,oBADxB,aAC8C,wBAD9C,sBACiF,uBADjF,6BAGA,wDAC8C,gCAD9C,MAIJ,EAAC,IAAD,CAAOA,MAAO,aACV,WACI,6CADJ,sBAC4D,0BAD5D,KAGA,EAAC,IAAD,+H,2DC3BpB,qCAEe,aAAUQ,GACrB,OACI,SAAKK,MAAOC,IAAMC,SACbP,EAAMI,a,gJCDnB,MAAMT,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,gCACZ,EAAC,IAAD,CAAOA,MAAO,cACV,WACI,iCADJ,QACkC,qCADlC,KACiE,sBADjE,+BAGA,6CAGA,YACI,2BAAgB,EAAC,IAAD,KAASG,EAAT,OAAW,QAC3B,wBAAa,EAAC,IAAD,KAASA,EAAT,OAAW,QACxB,+BAAoB,sBAApB,IAAmC,EAAC,IAAD,KAASA,EAAT,OAAW,mCAA9C,oCAIZ,EAAC,IAAD,KACI,EAAC,IAAD,CAAOH,MAAO,oBACV,EAAC,IAAD,mEAGA,WACI,yBADJ,+DACiF,4BADjF,KACuG,0BADvG,MAGA,yBACe,mBADf,0DAGA,wCAC8B,2BAD9B,yCACuF,wCADvF,KAGA,WACI,2BADJ,kFAIJ,EAAC,IAAD,CAAOA,MAAO,oBACV,EAAC,IAAD,KACI,sBADJ,+CAGA,WACI,kCADJ,8CACyE,EAAC,IAAD,KAASG,EAAT,OAAW,OADpF,+CAC4I,EAAC,IAAD,KAASA,EAAT,OAAW,OADvJ,wBAGA,qBACW,kCADX,mDAGA,6DACmD,2BADnD,MAIJ,EAAC,IAAD,CAAOH,MAAO,sBACV,EAAC,IAAD,iDAGA,WACI,yBADJ,gBACkC,6BADlC,2CAC+F,oCAD/F,uDAC+K,oBAD/K,qCAGA,WACI,uCADJ,sFAGA,EAAC,IAAD,KAASG,EAAT,OAAW;;yBAGX,sKAC4J,kCAD5J,kBACqM,iBADrM,qBACgO,kBADhO,MAGA,uEAIJ,EAAC,IAAD,CAAOH,MAAO,0BACV,WACI,yBADJ,yCAC2D,0BAD3D,uDAGA,4CACkC,EAAC,IAAD,KAASG,EAAT,OAAW,SAD7C,gFACwI,6CADxI,2HACqS,EAAC,IAAD,KAASA,EAAT,OAAW,OADhT,KAGA,WACI,kFAGR,EAAC,IAAD,CAAOH,MAAO,iBACV,6BACmB,+BADnB,0DACiG,uCADjG,KAGA,oCAC0B,EAAC,IAAD,KAASG,EAAT,OAAW,OADrC,MACoD,EAAC,IAAD,KAASA,EAAT,OAAW,OAD/D,mEAGA,gEAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;;;;;0BAQf,EAAC,IAAD,CAAOH,MAAO,gBACV,WACI,yBADJ,gEACkF,oCADlF,0BACqI,sCADrI,KAGA,kFACwE,0BADxE,oCAGA,WACI,gE,2DClHxB,gEAQe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASA,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,+BACV,iBACO,wBADP,4CACgE,qCADhE,MAIJ,EAAC,IAAD,CAAOA,MAAO,SACV,iBACO,yBADP,8BACmD,6CADnD,KAGA,0GACgG,oCADhG,YACqI,uCADrI,SAC0K,oDAD1K,OAKR,EAAC,IAAD,CAASA,MAAO,mBACZ,EAAC,IAAD,CAAOA,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,6EAAZ,aADJ,SACmH,EAAC,IAAD,CAAMA,KAAM,sDAAZ,uBADnH,iCAC6O,4BAD7O,KAGA,wBACc,4BADd,0CAGA,2CACiC,yBADjC,mBACkE,2BADlE,oBACsG,oBADtG,qCACoJ,yBADpJ,sBAGA,2HAGA,EAAC,IAAD,uIAIJ,EAAC,IAAD,CAAOF,MAAO,uBACV,EAAC,IAAD,WACO,EAAC,IAAD,CAAME,KAAM,yBAAZ,SADP,QAC6D,EAAC,IAAD,CAAMA,KAAM,oDAAZ,QAD7D,2DAGA,wBACc,6BADd,0CAGA,8CACoC,uBADpC,KACqD,uBADrD,KACsE,4BADtE,MAC6F,yBAD7F,OAKR,EAAC,IAAD,KACI,EAAC,IAAD,CAAOF,MAAO,iBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,0BAAZ,UADJ,KACyD,EAAC,IAAD,CAAMA,KAAM,2BAAZ,cADzD,KACmH,EAAC,IAAD,CAAMA,KAAM,2BAAZ,UADnH,+DAGA,WACI,wBADJ,yDAC0E,iCAD1E,KACqG,qBADrG,KACuH,oBADvH,MACyI,qBADzI,2BAGA,EAAC,IAAD,qFACiF,EAAC,IAAD,CAAMA,KAAM,yCAAZ,0BADjF,MAIJ,EAAC,IAAD,CAAOF,MAAO,oBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,iDAAZ,gBADJ,4IAGA,qEAC2D,+CAD3D,oBAIJ,EAAC,IAAD,CAAOF,MAAO,uBACV,EAAC,IAAD,KACI,EAAC,IAAD,CAAME,KAAM,qCAAZ,QADJ,kGAGA,uCAC6B,sCAD7B,0C,2DChFpB,oDAOe,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASF,MAAO,SACZ,EAAC,IAAD,CAAOA,MAAO,YACV,YACI,YAAI,EAAC,IAAD,CAAME,KAAM,wCAAZ,+BAGZ,EAAC,IAAD,CAAOF,MAAO,gBACV,YACI,YAAI,EAAC,IAAD,CAAME,KAAM,2DAAZ,2BAGZ,EAAC,IAAD,CAAOF,MAAO,yBACV,+EACqE,EAAC,IAAD,CAAME,KAAM,qCAAZ,SADrE,KAGA,EAAC,IAAD,CAAMc,SAAU,QAAhB,sH,8JCpBpB,MAAMb,EAAIC,OAAOC,IAGF,eACX,OACI,EAAC,WAAD,KACI,EAAC,IAAD,CAASL,MAAO,4BACZ,EAAC,IAAD,CAAOA,MAAO,YACV,iBACO,iEADP,KAGA,EAAC,IAAD,KAASG,EAAT,OAAW;;0BAIf,EAAC,IAAD,CAAOH,MAAO,cACV,iBACO,mEADP,KAGA,EAAC,IAAD,KAASG,EAAT,OAAW;;2BAKnB,EAAC,IAAD,CAASH,MAAO,yBACZ,EAAC,IAAD,CAAOA,MAAO,8BACV,4BACkB,mBADlB,kDAGA,eACI,mBADJ,8EAGA,4HACkH,yCADlH,KAGA,4EACkE,kCADlE,KAGA,EAAC,IAAD,oGACgG,0BADhG,MAIJ,EAAC,IAAD,CAAOA,MAAO,sCACV,kJACwI,yCADxI,KAGA,uCAC6B,4CAD7B,4FAGA,EAAC,IAAD,8EAC0E,yBAD1E,MAIJ,EAAC,IAAD,CAAOA,MAAO,2BACV,sCAC4B,sCAD5B,4DACmH,iDADnH,gCAGA,sGAC4F,sDAD5F,kBAIJ,EAAC,IAAD,CAAOA,MAAO,gCACV,8DAGA,sEAC4D,sCAD5D,iBAIJ,EAAC,IAAD,CAAOA,MAAO,0BACV,4DACkD,EAAC,IAAD,KAASG,EAAT,OAAW,OAD7D,0BAGA,EAAC,IAAD,qGAKR,EAAC,IAAD,CAASH,MAAO,oBACZ,EAAC,IAAD,CAAOA,MAAO,YACV,4BACkB,6BADlB,KAGA,iBACO,6BADP,yCACkE,EAAC,IAAD,KAASG,EAAT,OAAW,OAD7E,qBAC2G,EAAC,IAAD,KAASA,EAAT,OAAW,OADtH,KAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;0BAIf,EAAC,IAAD,CAAOH,MAAO,YACV,4EACkE,4BADlE,IACuF,EAAC,IAAD,KAASG,EAAT,OAAW,OADlG,kBAC6H,EAAC,IAAD,KAASA,EAAT,OAAW,WADxI,mBACwK,EAAC,IAAD,KAASA,EAAT,OAAW,WADnL,oCAGA,EAAC,IAAD,KAASA,EAAT,OAAW;;2BAKnB,EAAC,IAAD,CAASH,MAAO,qBACZ,EAAC,IAAD,CAAOA,MAAO,oCACV,kFACwE,2DADxE,KAGA,yBACe,uCADf,SACoD,+BADpD,mBAGA,EAAC,IAAD,mDAEI,UAAMc,MAAO,2CAAb,UAIJ,EAAC,IAAD,kEAC8D,EAAC,IAAD,KAASX,EAAT,OAAW,yBADzE,oBACwH,EAAC,IAAD,KAASA,EAAT,OAAW,yBADnI,kBACgL,EAAC,IAAD,KAASA,EAAT,OAAW,yBAD3L,iBAIJ,EAAC,IAAD,CAAOH,MAAO,wBAAyBS,MAAOC,IAAUC,QACpD,kDACwC,+CADxC,KAGA,sF","file":"route-GestioneDellInformazione.chunk.af84a.esm.js","sourcesContent":["import {Fragment} from \"preact\";\nimport {Section, Panel, ILatex, BLatex, PLatex, Image} from \"bluelib\";\nimport Example from \"../../components/Example\";\nimport Link from \"../../components/Link\";\n\nconst r = String.raw;\n\n\nexport default function () {\n return (\n \n Le summary sono brevi spezzoni di testo che permettono all'utente di capire quali documenti siano rilevanti per lui.\n \n Summary fisse che dipendono solo dal documento.\n \n Possono essere generate dalle prime parole del documento, dalle frasi più importanti o da metadati del documento stesso (OpenGraph).\n \n Summary che dipendono sia dal documento, sia dalla query effettuata.\n \n Generalmente, estraggono le frasi vicino alle occorrenze dei termini della query.\n \n Un supplemento al thesaurus specifico a un certo testo: aggiunge ad ogni token \n La radice del thesaurus ha sempre probabilità \n Una misura probabilistica di quanto un certo token \n È anche detta sorpresa o informazione di Shannon.\n \n Un albero di token organizzati in una gerarchia di significato.\n \n Una struttura dati che permette di velocizzare le ricerche su testi grandi e semi-statici.\n \n Si crea un vocabolario dall'insieme dei token, e ad ogni token del vocabolario si associa una lista ordinata di tutte le sue occorrenze (posting list).\n \n L'efficacia ed efficienza dell'indice dipendono dalle strutture di indicizzazione utilizzate per serializzarlo.\n \n Insieme di tutti i token ricercabili.\n \n Può essere implementato con diverse strutture dati:\n \n Per permettere pattern-based query, è possibile utilizzare più vocabolari per un singolo documento.\n \n Insieme di tutte le occorrenze di un determinato token.\n \n Viene implementata attraverso una lista ordinata (sorted list).\n \n Essendo ordinata, è efficiente \n Non è però efficiente nelle operazioni di negazione.\n \n È possibile aggiungere skip pointers alle posting list, in modo da rendere più efficiente l'intersezione.\n \n Per effettuare una ricerca utilizzando l'indice, sono necessari i seguenti passi:\n \n
\n {r`\n ciao → R1, R15, R123\n steffo → R1, R14\n ciano → R1231\n `}
\n {r`\n - [root]\n - c\n - i\n - a\n - o\n - R1\n - R15\n - R123\n - no\n - R1231\n - steffo\n - R1\n - R14\n `}
\n \n
\n
\n Una procedura che ottimizza un documento per la ricerca.\n
\n\n Passo che trasforma il documento in un insieme di parole (token).\n
\n\n Deve decidere come considerare i simboli tipografici, il case delle lettere e le cifre.\n
\n\n Inoltre, è possibile che disambigui tra i vari significati delle parole (word sense disambiguation).\n
\n\n Passo che elimina dalla lista i token inutili ai fini delle ricerche.\n
\n\n Esse solitamente sono gli articoli e le preposizioni.\n
\n\n Con l'avanzare degli anni, le stopwords hanno iniziato a diminuire sempre di più.\n
\n\n Passo che riduce alla radice tutti i token della lista.\n
\n\n Converte i plurali in singolari, passati ai presenti, e così via.\n
\n\n Passo che rimuove i caratteri speciali contenuti nei token.\n
\n\n Duplica le parole separate da trattino nella versione con spazio e senza spazio, rimuove gli accenti non significativi, etc.\n
\n\n Passo che seleziona i termini più importanti della lista.\n
\n\n Generalmente sfrutta dei parser o dei tagger.\n
\n \n \n\n Passo che classifica il documento in una o più categorie del thesaurus.\n
\n \n\n synonymy\n\n
\n Due parole sono sinonimi quando hanno lo stesso identico significato.\n
\n\n similarity\n\n
\n Due parole sono simili rappresentano concetti con caratteristiche in comune.\n
\n\n relatedness\n\n
\n Due parole sono correlate quando rappresentano concetti vengono usati insieme spesso.\n
\n\n Un modo per misurare la somiglianza tra due parole confrontando solo la loro posizione nel thesaurus.\n
\n\n Calcola la similarità basandosi sull'inverso della distanza tra le due parole
\n Calcola la similarità basandosi sulla profondità dei due nodi e sulla profondità del minimo antenato comune
\n Un modo per misurare la similarità tra due parole attraverso i loro valori di information content.\n
\n\n Calcola la similarità basandosi sull'information content del minimo antenato comune
\n Questa sezione è incompleta. Torna più avanti!\n
\n {props.children}\n\n Procedura che disambigua tra più significati dello stesso token.\n
\n\n Si può realizzare confrontando la somiglianza di ogni significato con tutti gli altri nomi presenti nella frase.\n
\n\n Processo di raccolta e recupero approssimato di informazioni spesso non strutturate.\n
\n\n Riceve in input una query, elabora documenti e restituisce una risposta più rilevante possibile.\n
\n\n Un'applicazione che effettua IR si chiama motore di ricerca.\n
\n\n Raggruppamenti di informazioni che possono avere varie forme.\n
\n\n Modelli matematici che ordinano per rilevanza (ranking) i risultati di una query.\n
\n\n Formalmente, sono composti da:\n
\n\n Modello IR che rappresenta ogni documento come un insieme ordinato di parole chiave (index terms).\n
\n\n Associa un peso a ogni token, e ordina l'insieme in base a quel peso.\n
\n\n Generalmente, i pesi sono indipendenti uno dall'altro, e questo permette di calcolarli parallelamente.\n
\n\n Bag-of-words: L'ordine delle parole nel documento viene solitamente ignorato dal ranking.\n
\ngrep
è a tutti gli effetti un modello booleano.\n \n Modello IR classico che dà un peso booleano a ogni documento:
\n Ha una precisione perfetta, ma richiede query ben preparate e specifiche.\n
\n\n È anche facile da implementare utilizzando una posting list.\n
\n\n Modello IR in cui ogni caratteristica di un documento è rappresentata con un valore floating point e l'intero documento è quindi rappresentato da una n-pla di tutte le sue caratteristiche.\n
\n\n Similarità cosinusoidale: il ranking si basa sull'angolo tra il \"vettore query\" e il \"vettore documento\":\n
\n\n Spesso si associa un peso a ogni dimensione in modo da variare l'importanza di una data caratteristica; comunemente, per i testi, si usano come pesi le frequenza dei token normalizzate (df) o logaritmiche (idf).\n
\n\n Come il modello classico, ignora l'ordine delle parole.\n
\n\n Modello IR che effettua il ranking in base alla probabilità di comparsa dei termini della query nei documenti.\n
\n\n Si basa sul calcolare un peso
\n Ci sarebbe una dimostrazione complessa che ho omesso per brevità.\n
\n\n Estensione del modello booleano che ammette la possibilità che certe condizioni siano parzialmente soddisfatte.\n
\n\n Invece che usare solo
\n Le operazioni booleane vengono quindi modificate:\n
\n\n Modello IR simile ai modelli classici che però tiene conto anche della frequenza dei termini nei documenti e della lunghezza dei documenti.\n
\n\n Permette anche di tenere in considerazione la frequenza dei termini nella query, nel caso essa sia molto lunga.\n
\n\n Ci sono formule che ho omesso per brevità.\n
\n\n La richiesta di informazioni effettuata da un utente in linguaggio naturale.\n
\n\n La traduzione dell'UIN in un linguaggio specifico al motore di ricerca.\n
\n\n La complessità di questo linguaggio dipende dall'utilizzatore del motore di ricerca: il suo livello di esperienza, il suo background di conoscenze e il livello di approfondimento desiderato.\n
\n\n Definisce parole chiave da cercare all'interno dei documenti.\n
\n\n In esse, è possibile cercare molteplici parole chiave, concatenarle per formare una frase oppure cercare parole a una data prossimità l'una dall'altra.\n
\n\n Spesso processa il linguaggio naturale per trasformarne le parole specifiche in parole chiave più generiche.\n
\n\n Definisce parti di testo da cercare all'interno dei documenti.\n
\n\n Permettono dunque la ricerca di prefissi, suffissi, sottostringhe e intervalli.\n
\n\n Estendono gli altri tipi di query permettendo l'inserimento di operatori booleani (AND
, OR
e NOT
) tra le parole chiave.\n
\n Permettono di effettuare i precedenti tipi di query su specifiche parti della struttura dei documenti.\n
\n\n Limitano le keyword a un vocabolario predefinito utilizzato anche dai documenti.\n
\n\n Puoi scaricare le videolezioni di Gestione dell'informazione con bbbdl:\n
\n\n bbbdl sync -r https://raw.githubusercontent.com/Steffo99/unimoreinfo-wiki/main/gestionedellinformazione.json\n
\n \n La frazione dei documenti rilevanti totali restituita:\n
\n\n La frazione dei documenti restituiti che sono rilevanti:\n
\n\n Si effettuano test e si valutano precisione e richiamo ottenuti.\n
\n \n\n Il modello IR ideale ha valori di richiamo e precisione di 1, ma nella realtà questi valori tendono ad essere inversamente proporzionali.\n
\n\n Un fattore significativo nel richiamo e nella precisione è la forma del documento.\n
\n\n Si fissano un certo numero di livelli di richiamo desiderati e si misura la precisione che ha il modello in quei punti, creando una curva di richiamo standard.\n
\n\n È possibile ottenere una curva di richiamo interpolata prendendo per ogni punto il valore di massima precisione tra esso e i punti precedenti.\n
\n\n È possibile misurare la curva di richiamo media effettuando la media su più query dei vari valori, e la curva di richiamo a valore singolo effettuando una query sola.\n
\n\n Sono entrambe importanti per effettuare una valutazione, perchè la curva media potrebbe mascherare problemi di specifiche query nei modelli.\n
\n\n La media tra i valori di più curve di richiamo.\n
\n\n È utile per le valutazioni in cui l'utente sta cercando più documenti rilevanti alla volta.\n
\n\n Valori di recall e precision riguardo i primi
\n È anche detta media armonica.\n
\n\n Un singolo valore che tiene conto sia della precisione
\n Una versione più configurabile della Misura F che permette di dare priorità
\n Misura per valutare i motori di ricerca online che tiene conto dell'ordine in cui vengono restituiti i documenti.\n
\n\n Si basa su valutazioni di rilevanza e su pesi posizionali dei risultati.\n
\n\n Miglioramento alla DCG che supporta quantità di risultati differenti.\n
\n \n Non dice la formula, e l'esempio non esemplifica un bel niente...\n \n