Teknologjitë OLAP. OLAP në sistemet olap të menaxhimit financiar

duke kryer

Kohët e fundit është shkruar shumë për OLAP. Mund të themi se ka një bum rreth këtyre teknologjive. Vërtetë, për ne ky bum është disi i vonuar, por kjo, natyrisht, për shkak të situatës së përgjithshme në vend.

Sistemet e informacionit në shkallë të ndërmarrjes, si rregull, përmbajnë aplikacione të dizajnuara për analiza komplekse shumëdimensionale të të dhënave, dinamikën e saj, tendencat, etj. Një analizë e tillë synon përfundimisht të ndihmojë vendimmarrjen. Shpesh këto sisteme quhen sisteme të mbështetjes së vendimeve.

Sistemet e mbështetjes së vendimit zakonisht kanë mjetet për t'i siguruar përdoruesit të dhëna të përgjithshme për mostra të ndryshme nga grupi fillestar në një formë të përshtatshme për perceptim dhe analizë. Si rregull, të tilla funksionet agregate formojnë një grup të dhënash shumëdimensionale (dhe për rrjedhojë jo-relacionale) (shpesh i quajtur hiperkub ose metakub), boshtet e të cilit përmbajnë parametra, dhe qelizat përmbajnë të dhëna agregate që varen prej tyre - dhe të dhëna të tilla mund të ruhen gjithashtu në tabela relacionale. por në këtë rast bëhet fjalë për organizimin logjik të të dhënave, jo për zbatimin fizik të ruajtjes së tyre). Përgjatë çdo boshti, të dhënat mund të organizohen në një hierarki që përfaqëson nivele të ndryshme detajesh. Me këtë model të dhënash, përdoruesit mund të formulojnë pyetje komplekse, gjeneroni raporte, merrni nëngrupe të dhënash.

Teknologjia e analizës komplekse shumëdimensionale të të dhënave quhet OLAP (On-Line Analytical Processing).

OLAP është një komponent kyç i ruajtjes së të dhënave.

Koncepti i OLAP u përshkrua në 1993 nga Edgar Codd, një studiues i njohur i bazës së të dhënave dhe autor i modelit të të dhënave relacionale.E.F. Codd, S.B. Codd, dhe C.T.Salley, Ofrimi i OLAP (përpunimi analitik on-line) për analistët e përdoruesve: Një mandat IT. raport teknik, 1993).

Në vitin 1995, bazuar në kërkesat e përshkruara nga Codd, u formulua i ashtuquajturi test FASMI (Analiza e shpejtë e informacionit shumëdimensional të përbashkët - analiza e shpejtë e informacionit shumëdimensional të përbashkët), i cili përfshin kërkesat e mëposhtme për aplikacionet për analiza shumëdimensionale:

· sigurimi i përdoruesit me rezultatet e analizës në një kohë të pranueshme (zakonisht jo më shumë se 5 s), edhe me koston e një analize më pak të detajuar;

· aftësia për të kryer çdo analizë logjike dhe statistikore specifike për këtë aplikacion dhe për ta ruajtur atë në një formë të aksesueshme për përdoruesin përfundimtar;

· akses për shumë përdorues në të dhëna me mbështetje për mekanizmat e duhur të kyçjes dhe mjetet e autorizuara të aksesit;

· përfaqësimi konceptual shumëdimensional i të dhënave, duke përfshirë mbështetjen e plotë për hierarkitë dhe hierarkitë e shumëfishta (kjo është një kërkesë kryesore e OLAP);

· aftësia për të hyrë në çdo informacion të nevojshëm, pavarësisht nga vëllimi dhe vendndodhja e tij e ruajtjes.

Duhet të theksohet se funksionaliteti OLAP mund të zbatohet menyra te ndryshme, duke filluar me mjetet më të thjeshta të analizës së të dhënave në aplikacionet e zyrës dhe duke përfunduar me sistemet analitike të shpërndara të bazuara në produktet e serverit. Përdoruesit mund t'i shikojnë lehtësisht të dhënat në një strukturë shumëdimensionale siç zbatohen në detyrat e tyre.

2. Çfarë është OLAP

OLAP - një shkurtim për përpunimin analitik në linjë angleze - nuk është emri i një produkti specifik, por i një teknologjie të tërë. Në Rusisht, është më e përshtatshme të quash përpunim analitik operacional OLAP. Megjithëse në disa botime përpunimi analitik quhet si në internet ashtu edhe interaktiv, mbiemri "online" pasqyron më saktë kuptimin e teknologjisë OLAP.

Zhvillimi i vendimeve të menaxhimit menaxherial bie në kategorinë e fushave më të vështira për t'u automatizuar. Sidoqoftë, sot ekziston një mundësi për të ndihmuar menaxherin në zhvillimin e vendimeve dhe, më e rëndësishmja, për të shpejtuar ndjeshëm procesin e zhvillimit të vendimeve, përzgjedhjen dhe miratimin e tyre. Ju mund të përdorni OLAP për këtë.

Konsideroni se si zakonisht ndodh procesi i zhvillimit të zgjidhjeve.

Historikisht, zgjidhjet për automatizimin e aktiviteteve operacionale janë më të zhvilluarat. Po flasim për sistemet e përpunimit të të dhënave transaksionale (OLTP), të quajtura thjesht sisteme operacionale. Këto sisteme sigurojnë regjistrimin e disa fakteve, ruajtjen dhe ruajtjen afatshkurtër të tyre në arkiva. Baza e sistemeve të tilla sigurohet nga sistemet e menaxhimit të bazës së të dhënave relacionale (RDBMS). Qasja tradicionale është të përpiqeni të përdorni sisteme operacionale të ndërtuara tashmë për mbështetjen e vendimeve. Zakonisht ata përpiqen të ndërtojnë një sistem të zhvilluar pyetjesh për sistemin operativ dhe përdorin raportet e marra pas interpretimit drejtpërdrejt për të mbështetur vendimet. Raportet mund të ndërtohen në bazë të personalizuar, d.m.th. menaxheri kërkon një raport dhe në mënyrë të rregullt, kur raportet ndërtohen me arritjen e ngjarjeve ose kohëve të caktuara. Për shembull, një proces tradicional i mbështetjes së vendimeve mund të duket kështu: menaxheri shkon te specialisti i informacionit dhe ndan pyetjen e tij me të. Pastaj specialisti i informacionit ndërton një kërkesë për sistemin operativ, merr një raport elektronik, e interpreton atë dhe më pas e sjell atë në vëmendjen e personelit drejtues. Natyrisht, një skemë e tillë siguron mbështetje për vendimmarrje në një farë mase, por ka një efikasitet jashtëzakonisht të ulët dhe një numër të madh disavantazhesh. Një sasi e vogël e të dhënave përdoret për të mbështetur vendimet kritike. Ka edhe probleme të tjera. Një proces i tillë është shumë i ngadaltë, pasi procesi i shkrimit të kërkesave dhe i interpretimit të një raporti elektronik është i gjatë. Duhen shumë ditë, në një kohë kur një drejtues mund t'i duhet të marrë një vendim pikërisht tani, menjëherë. Duke marrë parasysh se menaxheri, pas marrjes së raportit, mund të jetë i interesuar për një çështje tjetër (të themi, qartësimi ose kërkimi i shqyrtimit të të dhënave në një kontekst tjetër), atëherë ky cikël i ngadaltë duhet të përsëritet, dhe duke qenë se procesi i analizës së të dhënave sistemet operative do të ndodhë në mënyrë të përsëritur, atëherë shpenzohet edhe më shumë kohë. Një problem tjetër është problemi i fushave të ndryshme të veprimtarisë së një specialisti të teknologjisë së informacionit dhe një menaxheri, të cilët mund të mendojnë në kategori të ndryshme dhe për rrjedhojë nuk e kuptojnë njëri-tjetrin. Pastaj do të kërkohen përsëritje shtesë të përsosjes, dhe kjo është përsëri koha, e cila gjithmonë nuk është e mjaftueshme. Një çështje tjetër e rëndësishme është kompleksiteti i raporteve për t'u kuptuar. Menaxheri nuk ka kohë të zgjedhë numrat e interesit nga raporti, veçanërisht pasi mund të ketë shumë prej tyre (kujtoni raporte të mëdha me shumë faqe që në fakt përdorin disa faqe, dhe pjesa tjetër për çdo rast). Vëmë re gjithashtu se puna e interpretimit bie më shpesh mbi specialistët në departamentet e informacionit. Kjo do të thotë, një specialist kompetent është i hutuar nga puna rutinë dhe joefikase në vizatimin e diagrameve, etj., Të cilat, natyrisht, nuk mund të ndikojnë në mënyrë të favorshme në kualifikimet e tij. Për më tepër, nuk është sekret që ka dashamirës në zinxhirin e interpretimit që janë të interesuar në shtrembërimin e qëllimshëm të informacionit në hyrje.

Mangësitë e mësipërme na bëjnë të mendojmë si për efikasitetin e përgjithshëm të sistemit operativ ashtu edhe për kostot që lidhen me ekzistencën e tij, pasi rezulton se kostot e krijimit të një sistemi operacional nuk kompensohen në masën e duhur nga efikasiteti i funksionimit të tij.

Në fakt, këto probleme nuk janë pasojë e cilësisë së dobët të sistemit operativ apo e ndërtimit të pasuksesshëm të tij. Rrënjët e problemeve qëndrojnë në ndryshimin themelor midis aktiviteteve operacionale që janë të automatizuara nga sistemi operacional dhe aktiviteteve të zhvillimit dhe vendimmarrjes. Ky ndryshim qëndron në faktin se të dhënat e sistemeve operative janë thjesht regjistrime të disa ngjarjeve të ndodhura, fakte, por jo informacione në kuptimin e përgjithshëm të fjalës. Informacioni është diçka që redukton pasigurinë në çdo fushë. Dhe do të ishte shumë mirë nëse informacioni do të zvogëlonte pasigurinë në përgatitjen e vendimeve. Famëkeqja E.F. Codd, njeriu që filloi teknologjinë e menaxhimit të bazës së të dhënave relacionale në vitet 1970: "Megjithëse sistemet e menaxhimit të bazës së të dhënave relacionale janë të disponueshme për përdoruesit, ato kurrë nuk janë konsideruar si një mjet që ofron funksione të fuqishme për sintezë, analizë dhe konsolidim (funksione të quajtura analiza shumëdimensionale e të dhënave)" . Fjala është për sintezën e informacionit, për mënyrën sesi të dhënat e sistemeve operacionale të shndërrohen në informacione madje edhe në vlerësime cilësore. OLAP ju lejon të bëni këtë transformim.

OLAP bazohet në idenë e një modeli shumëdimensional të të dhënave. Mendimi njerëzor është shumëdimensional nga përkufizimi. Kur një person bën pyetje, ai vendos kufizime, duke formuluar pyetje në shumë dimensione, kështu që procesi i analizës në një model shumëdimensional është shumë afër realitetit të të menduarit njerëzor. Sipas dimensioneve në modelin shumëdimensional shtyhen faktorët që ndikojnë në aktivitetet e ndërmarrjes (p.sh.: koha, produktet, departamentet e kompanisë, gjeografia, etj.). Kështu, përftohet një hiperkub (natyrisht, emri nuk është shumë i përshtatshëm, pasi një kub zakonisht kuptohet si një figurë me skaje të barabarta, gjë që në këtë rast nuk është aspak kështu), e cila më pas mbushet me tregues. të veprimtarisë së ndërmarrjes (çmimet, shitjet, plani, fitimet, humbjet etj.) etj.). Kjo mbushje mund të kryhet si me të dhëna reale të sistemeve operative, ashtu edhe të parashikohet në bazë të të dhënave historike. Dimensionet e hiperkubit mund të jenë komplekse, hierarkike dhe mund të vendosen marrëdhënie ndërmjet tyre. Gjatë analizës, përdoruesi mund të ndryshojë këndvështrimin mbi të dhënat (i ashtuquajturi operacioni i ndryshimit të pamjes logjike), duke parë kështu të dhënat në seksione të ndryshme dhe duke zgjidhur probleme specifike. Operacione të ndryshme mund të kryhen në kube, duke përfshirë parashikimin dhe planifikimin e kushtëzuar (çka-nëse analiza). Për më tepër, operacionet kryhen menjëherë në kube, d.m.th. produkti, për shembull, do të rezultojë në një produkt hiperkub, secila qelizë e të cilit është produkt i qelizave të hiperkubeve të shumëzuesit përkatës. Natyrisht, është e mundur të kryhen operacione në hiperkube që kanë një numër të ndryshëm dimensionesh.

3. Historia e krijimit të teknologjisë OLAP

Ideja e përpunimit të të dhënave në grupe shumëdimensionale nuk është e re. Në fakt, ajo shkon prapa në 1962, kur Ken Iverson botoi librin e tij A Programming Language (APL). Zbatimi i parë praktik i APL u bë në fund të viteve gjashtëdhjetë nga IBM. APL është një gjuhë shumë elegante, e përcaktuar matematikisht me variabla shumëdimensionale dhe operacione të trajtuara. Ai synohej të ishte mjeti origjinal i fuqishëm për trajtimin e transformimeve shumëdimensionale në krahasim me gjuhët e tjera praktike të programimit.

Sidoqoftë, ideja nuk mori aplikim masiv për një kohë të gjatë, pasi nuk kishte ardhur ende koha për ndërfaqe grafike, pajisje printimi me cilësi të lartë dhe shfaqja e karaktereve greke kërkonte ekrane të veçanta, tastierë dhe pajisje printimi. Më vonë, fjalët angleze u përdorën ndonjëherë për të zëvendësuar operatorët grekë, por luftëtarët e pastërtisë së APL penguan përpjekjet për të popullarizuar gjuhën e tyre të preferuar. APL gjithashtu konsumoi burime makinerish. Në ato ditë, përdorimi i tij ishte i kushtueshëm. Programet ishin shumë të ngadalta në ekzekutim dhe, për më tepër, ishin shumë të shtrenjta për t'u ekzekutuar. Kërkohej shumë memorie, në atë kohë vetëm vëllime tronditëse (rreth 6 MB).

Megjithatë, bezdisja e këtyre gabimeve fillestare nuk e vrau idenë. Është përdorur në shumë aplikacione biznesi në vitet '70 dhe '80. Shumë prej këtyre aplikacioneve kishin veçori sistemet moderne përpunimi analitik. Kështu që IBM zhvilloi një sistem operativ për APL të quajtur VSPC, dhe disa njerëz e konsideruan atë mjedisin ideal për përdorim personal derisa tabelat u bënë të kudogjendura.

Por APL ishte shumë e vështirë për t'u përdorur, veçanërisht pasi çdo herë kishte mospërputhje midis vetë gjuhës dhe harduerit mbi të cilin u përpoq të zbatohej.

Në vitet 1980, APL u bë e disponueshme në makinat personale, por nuk gjeti përdorim në treg. Alternativa ishte programimi i aplikacioneve shumëdimensionale duke përdorur vargje në gjuhë të tjera. Kjo ishte një detyrë shumë e vështirë edhe për programuesit profesionistë, gjë që i detyroi ata të prisnin gjeneratën e ardhshme të produkteve softuerike shumëdimensionale.

Në vitin 1972, disa aplikacione softuerike shumëdimensionale të përdorura më parë për qëllime arsimore gjetën përdorim komercial: Express. Mbetet në një formë plotësisht të rishkruar edhe tani, megjithatë, konceptet origjinale të viteve '70 kanë pushuar së qeni relevante. Sot, në vitet '90, Express është një nga teknologjitë më të njohura OLAP dhe Oracle(r) do të vazhdojë ta shtyjë atë dhe të shtojë veçori të reja.

Më shumë produkte shumëdimensionale u shfaqën në vitet '80. Në fillim të dekadës, një produkt i quajtur Stratagem, më vonë i quajtur Acumate (tani në pronësi të Kenan Technologies), i cili ende u promovua deri në fillim të viteve '90, por sot, ndryshe nga Express, praktikisht nuk përdoret.

Comshare System W ishte një produkt shumëdimensional i një stili të ndryshëm. I prezantuar në vitin 1981, ishte i pari që u fokusua më shumë në përdoruesin përfundimtar dhe zhvillimin e aplikacioneve financiare. Ai prezantoi shumë koncepte që nuk ishin përshtatur mirë, të tilla si rregullat plotësisht jo-procedurale, shikimi dhe redaktimi në ekran të plotë i të dhënave shumëdimensionale, rillogaritja automatike dhe integrimi i grupit me të dhënat relacionale. Sidoqoftë, Comshare System W ishte mjaft i rëndë për harduerin e kohës në krahasim me produktet e tjera dhe u përdor më pak në të ardhmen, u shit më pak dhe nuk u bënë përmirësime në produkt. Edhe pse është ende i disponueshëm sot në UNIX, ai nuk është klient-server, gjë që nuk ndihmon në rritjen e ofertës së tij në treg për produkte analitike. Në fund të viteve 80, Comshare lëshoi ​​​​një produkt për DOS dhe më vonë për Windows. Këto produkte quheshin Commander Prism dhe përdorën të njëjtat koncepte si System W.

Një tjetër produkt krijues i fundit të viteve '80 u quajt Metafora. Ishte menduar për tregtarët profesionistë. Ai propozoi gjithashtu shumë koncepte të reja që vetëm tani kanë filluar të përdoren gjerësisht: llogaritja klient-server, përdorimi i një modeli shumëdimensional mbi të dhënat relacionale, zhvillimi i aplikacioneve të orientuara drejt objekteve. Sidoqoftë, pajisja standarde e PC e asaj kohe nuk ishte në gjendje të ekzekutonte Metaphor dhe shitësit u detyruan të zhvillonin standardet e tyre për PC dhe rrjete. Gradualisht, Metaphor filloi të punojë me sukses në makinat personale serike, por produkti u krijua ekskluzivisht për OS / 2 dhe kishte ndërfaqen e tij grafike të përdoruesit.

Më pas Metafora hyri në një aleancë marketingu me IBM, e cila më pas u absorbua. Në mesin e vitit 1994, IBM vendosi të integrojë teknologjinë Metaforë (e riemërtuar DIS) me teknologjitë e saj të ardhshme dhe në këtë mënyrë të ndalojë financimin e një drejtimi të veçantë, por klientët shprehën pakënaqësinë e tyre dhe kërkuan mbështetje të vazhdueshme për produktin. Mbështetja vazhdoi për klientët e mbetur dhe IBM e ri-lëshoi ​​produktin me emrin e ri DIS, i cili, megjithatë, nuk e bëri atë të njohur. Por konceptet krijuese, novatore të Metaforës nuk janë harruar dhe janë të dukshme në shumë produkte sot.

Në mesin e viteve 80 lindi termi EIS (Sistemi i Informacionit Ekzekutiv). Produkti i parë që demonstroi qartë këtë drejtim ishte Qendra e Komandës së Pilotit. Ishte një produkt që lejonte llogaritjen bashkëpunuese, atë që ne sot e quajmë informatikë klient-server. Meqenëse fuqia e kompjuterëve personalë në vitet '80 ishte e kufizuar, produkti ishte shumë "server-centric", por ky parim është ende shumë i popullarizuar sot. Pilot nuk e shiti Qendrën e Komandës për një kohë të gjatë, por ofroi shumë nga konceptet që janë të njohura në produktet e sotme OLAP, duke përfshirë mbështetjen automatike të kohës, llogaritjen shumëdimensionale klient-server dhe kontrollin e thjeshtuar të procesit të analizës (miu, ekranet e ndjeshme, etj. ). Disa nga këto koncepte u riaplikuan më vonë në Serverin e Analizës Pilot.

Në fund të viteve 1980, spreadsheets dominonin tregun për mjetet e analizës për përdoruesit fundorë. Tabela e parë shumëdimensionale u prezantua nga produkti Compete. Ai u tregtua si një produkt shumë i shtrenjtë për profesionistët, por shitësit nuk arritën të siguroheshin që produkti mund të kapte tregun dhe Computer Associates fitoi të drejtat për të së bashku me produkte të tjera, duke përfshirë Supercalc dhe 20/20. Efekti kryesor i blerjes së CA Compete ishte një ulje e mprehtë e çmimit të saj dhe heqja e mbrojtjes nga kopjimi, gjë që natyrisht kontribuoi në shpërndarjen e saj. Megjithatë, ai nuk pati sukses. Compete është në zemër të Supercalc 5, por aspekti shumëdimensional i tij nuk promovohet. Compete-ja e vjetër ende përdoret ndonjëherë për faktin se në një kohë u investuan shumë para në të.

Lotus u përpoq të hynte në tregun shumëdimensional të fletëllogaritjes me produktin Improv, i cili funksionon në makinën NeXT. Kjo siguroi, së paku, që shitjet e 1-2-3 të mos bien, por kur u lëshua përfundimisht për Windows, Excel tashmë kishte një pjesë të madhe të tregut, gjë që e pengoi Lotus të bënte ndonjë ndryshim në shpërndarjen e tregut. Lotus, ashtu si CA me Compete, e zhvendosi Improvin në fund të tregut, por kjo nuk u bë kusht për promovim të suksesshëm në treg dhe zhvillimet e reja në këtë fushë nuk vazhduan. Doli që përdoruesit e kompjuterëve personalë preferonin fletëllogaritëse 1-2-3 dhe nuk ishin të interesuar për veçoritë e reja shumëdimensionale, përveç nëse ato ishin plotësisht të pajtueshme me fletëllogaritësit e tyre të vjetër. Po kështu, konceptet e fletëllogaritjeve të vogla, desktop që ofrohen si aplikacione personale, nuk janë vërtetuar vërtet të përshtatshme dhe nuk janë kapur në botën reale të biznesit. Microsoft(r) ka ndjekur këtë rrugë duke shtuar PivotTables në Excel. Edhe pse pak përdorues të Excel kanë përfituar nga përdorimi i kësaj veçorie, ky është ndoshta i vetmi fakt që aftësitë e analizës shumëdimensionale përdoren gjerësisht në botë, thjesht sepse ka kaq shumë përdorues të Excel në botë.

4. OLAP, ROLAP, MOLAP…

Dihet mirë se kur Codd publikoi rregullat e tij për ndërtimin e DBMS relacionale në 1985, ato shkaktuan një reagim të fortë dhe më pas patën një ndikim të fortë në industrinë e DBMS në përgjithësi. Megjithatë, pak njerëz e dinë se në vitin 1993 Codd botoi një vepër të quajtur "OLAP për përdoruesit e analistëve: Çfarë duhet të jetë". Në të, ai përshkroi konceptet bazë të përpunimit analitik në internet dhe identifikoi 12 rregulla që produktet duhet të plotësojnë në mënyrë që të ofrojnë përpunim analitik në internet.

Këtu janë rregullat (teksti origjinal ruhet aty ku është e mundur):

1. Paraqitja konceptuale shumëdimensionale. Përdoruesi analist e sheh botën e ndërmarrjes si natyrë shumëdimensionale. Prandaj, modeli OLAP duhet të jetë shumëdimensional në bazën e tij. Një diagram konceptual shumëdimensional ose një paraqitje me porosi lehtëson modelimin dhe analizën, si dhe llogaritjet.

2. Transparenca. Pavarësisht nëse produkti OLAP është pjesë e veglave të përdoruesit apo jo, ky fakt duhet të jetë transparent për përdoruesin. Nëse OLAP ofrohet nga kompjuteri klient-server, atëherë ky fakt duhet gjithashtu, nëse është e mundur, të jetë i padukshëm për përdoruesin. OLAP duhet të dorëzohet në kontekstin e një arkitekture vërtet të hapur, duke i lejuar përdoruesit, kudo që të jenë, të komunikojnë me serverin duke përdorur një mjet analitik. Përveç kësaj, transparenca duhet të arrihet edhe kur mjeti analitik ndërvepron me mjedise homogjene dhe heterogjene të bazës së të dhënave.

3. Disponueshmëria. Një përdorues analist OLAP duhet të jetë në gjendje të kryejë analiza bazuar në një skemë të përbashkët konceptuale që përmban të dhëna për mbarë ndërmarrjen në një bazë të dhënash relacionale, si dhe të dhëna nga bazat e të dhënave të trashëgimisë, në metodat e zakonshme të aksesit dhe në një model të përbashkët analitik. Kjo do të thotë që OLAP duhet të sigurojë logjikën e vet për akses në një mjedis heterogjen të bazës së të dhënave dhe të kryejë transformimet e duhura për t'i paraqitur të dhënat përdoruesit. Për më tepër, është e nevojshme të kujdeset paraprakisht se ku dhe si dhe cilat lloje të organizimit të të dhënave fizike do të përdoren në të vërtetë. Një sistem OLAP duhet të aksesojë vetëm të dhënat që kërkohen në të vërtetë dhe të mos zbatojë parimin e përgjithshëm të "gypit të kuzhinës" që përfshin të dhëna të panevojshme.

4. Produktivitet i qëndrueshëm në zhvillimin e raportit. Nëse numri i dimensioneve ose madhësia e bazës së të dhënave rritet, përdoruesi analist nuk duhet të pësojë ndonjë degradim domethënës në performancë. Performanca e qëndrueshme është kritike për ruajtjen e lehtësisë së përdorimit të përdoruesit përfundimtar dhe kufizimin e kompleksitetit të OLAP. Nëse përdoruesi analist përjeton dallime të rëndësishme në performancë sipas numrit të dimensioneve, atëherë analisti do të priret t'i kompensojë këto dallime me një strategji zhvillimi, e cila do të bëjë që të dhënat të paraqiten në mënyra të ndryshme nga mënyra se si të dhënat në të vërtetë duhet të të paraqitet. Humbja e kohës duke anashkaluar sistemin për të kompensuar papërshtatshmërinë e tij nuk është ajo për të cilën janë krijuar produktet analitike.

5. Arkitektura klient-server. Shumica e të dhënave të kërkuara për analitikën në internet sot qëndrojnë në kompjuterët kryesorë të aksesuar përmes kompjuterëve. Kjo do të thotë, pra, që produktet OLAP duhet të jenë në gjendje të punojnë në një mjedis klient-server. Nga ky këndvështrim, është thelbësore që komponenti i serverit të mjetit analitik të jetë thelbësisht "i zgjuar" në mënyrë që klientë të ndryshëm të mund t'i bashkohen serverit me telashe minimale dhe programim integrues. Serveri "inteligjent" duhet të jetë në gjendje të hartojë dhe konsolidojë midis skemave të papërshtatshme logjike dhe fizike të bazës së të dhënave. Kjo do të sigurojë transparencë dhe ndërtimin e një skeme të përbashkët konceptuale, logjike dhe fizike.

6. Shumëdimensionale e përgjithshme. Çdo dimension duhet të zbatohet pavarësisht nga struktura dhe aftësitë e tij operacionale. Përmasat e zgjedhura mund t'i jepen aftësi shtesë operacionale dhe meqenëse dimensionet janë simetrike, çdo dimension mund t'i jepet një funksion i vetëm. Strukturat themelore të të dhënave, formulat dhe formatet e raportimit nuk duhet të jenë të njëanshme ndaj asnjë dimensioni.

7. Kontroll dinamik i matricave të rralla. Dizajni fizik i një mjeti OLAP duhet të jetë plotësisht i adaptueshëm me modelin specifik analitik në mënyrë që të menaxhojë në mënyrë optimale matricat e rralla. Për çdo matricë të caktuar të rrallë, ekziston një dhe vetëm një skemë fizike optimale. Kjo skemë siguron efikasitetin maksimal të memories dhe funksionimin e matricës, përveç nëse, sigurisht, i gjithë grupi i të dhënave përshtatet në memorie. Të dhënat fizike themelore të një vegle OLAP duhet të konfigurohen në çdo nëngrup dimensionesh, në çdo mënyrë, për operacione praktike me modele të mëdha analitike. Metodat e aksesit fizik duhet gjithashtu të ndryshojnë në mënyrë dinamike dhe të përmbajnë lloje të ndryshme mekanizmash, si: llogaritjet direkte, pemët B dhe derivatet, hashimi, aftësia për të kombinuar këto mekanizma nëse është e nevojshme. Spariteti (i matur si përqindja e qelizave boshe ndaj të gjitha atyre të mundshme) është një nga karakteristikat e përhapjes së të dhënave. Pamundësia për të kontrolluar pakësimin mund ta bëjë të paarritshëm efikasitetin e operacioneve. Nëse një mjet OLAP nuk mund të kontrollojë dhe rregullojë shpërndarjen e vlerave të të dhënave të analizuara, një model që pretendon të jetë praktik, i bazuar në shumë shtigje dhe dimensione konsolidimi, në fakt mund të jetë i panevojshëm dhe i pashpresë.

8. Mbështetje me shumë përdorues. Shpesh, shumë përdorues analistë do të duhet të punojnë së bashku në të njëjtin model analitik ose të krijojnë modele të ndryshme nga të njëjtat të dhëna. Prandaj, një mjet OLAP duhet të sigurojë ndarje (kërkim dhe shtoj), integritet dhe aftësi sigurie.

9. Operacione kryq të pakufizuar. Nivelet e ndryshme të grumbullimit dhe shtigjet e konsolidimit, për shkak të natyrës së tyre hierarkike, përfaqësojnë marrëdhënie të varura në një model ose aplikacion OLAP. Prandaj, vetë mjeti duhet të nënkuptojë llogaritjet e duhura dhe të mos kërkojë nga përdoruesi analist që të ripërcaktojë ato llogaritje dhe operacione. Llogaritjet që nuk rrjedhin nga këto marrëdhënie të trashëguara duhet të përcaktohen me formula të ndryshme sipas disa gjuhëve të zbatueshme. Një gjuhë e tillë mund të lejojë llogaritjet dhe manipulimet me të dhëna të çdo dimensioni dhe nuk kufizon marrëdhëniet midis qelizave të të dhënave, nuk i kushton vëmendje numrit të atributeve të zakonshme të të dhënave të qelizave specifike.

10. Manipulim intuitiv i të dhënave. Riorientimi i shtigjeve të konsolidimit, detajimi, zmadhimi dhe manipulime të tjera të rregulluara nga shtigjet e konsolidimit duhet të zbatohen përmes një veprimi të veçantë në qelizat e modelit analitik dhe nuk duhet të kërkojnë përdorimin e një sistemi menuje ose veprime të tjera të shumta me ndërfaqja e përdoruesit. Pamja e përdoruesit analist për dimensionet e përcaktuara në modelin analitik duhet të përmbajë të gjithë informacionin e nevojshëm për të kryer veprimet e mësipërme.

11. Opsionet fleksibël të raportimit. Analiza dhe paraqitja e të dhënave është e thjeshtë kur rreshtat, kolonat dhe qelizat e të dhënave që do të krahasohen vizualisht me njëra-tjetrën do të jenë afër njëra-tjetrës ose sipas ndonjë funksioni logjik që zhvillohet në ndërmarrje. Mjetet e raportimit duhet të përfaqësojnë të dhëna të sintetizuara ose informacione që rezultojnë nga modeli i të dhënave në çdo orientim të mundshëm. Kjo do të thotë që rreshtat, kolonat ose faqet duhet të tregojnë dimensione nga 0 në N njëkohësisht, ku N është numri i dimensioneve të të gjithë modelit analitik. Për më tepër, çdo dimension i përmbajtjes i paraqitur në një rekord, kolonë ose faqe të vetme duhet gjithashtu të jetë në gjendje të shfaqë çdo nëngrup të elementeve (vlerave) të përmbajtura në dimension, në çdo renditje.

12. Dimensioni dhe numri i pakufizuar i niveleve të grumbullimit. Një studim mbi numrin e mundshëm të matjeve të nevojshme të kërkuara në një model analitik ka treguar se deri në 19 matje mund të përdoren njëkohësisht. Prandaj rekomandohet fuqimisht që mjeti analitik të jetë në gjendje të ofrojë të paktën 15 dimensione njëkohësisht dhe mundësisht 20. Për më tepër, secili nga dimensionet e zakonshme nuk duhet të kufizohet nga numri i niveleve të grumbullimit dhe shtigjeve të konsolidimit të përcaktuara nga përdoruesi analist.

Në fakt, zhvilluesit e produkteve OLAP sot ndjekin këto rregulla, ose të paktën përpiqen t'i ndjekin ato. Këto rregulla mund të konsiderohen si baza teorike e përpunimit analitik operacional, është e vështirë të debatosh me to. Më pas, nga 12 rregullat dolën shumë pasoja, të cilat, megjithatë, nuk do t'i japim për të mos e ndërlikuar në mënyrë të panevojshme historinë.

Le të hedhim një vështrim më të afërt se si ndryshojnë produktet OLAP në zbatimin e tyre fizik.

Siç u përmend më lart, OLAP bazohet në idenë e përpunimit të të dhënave në struktura shumëdimensionale. Kur themi OLAP, nënkuptojmë që logjikisht struktura e të dhënave të një produkti analitik është shumëdimensionale. Se si zbatohet është çështje tjetër. Ekzistojnë dy lloje kryesore të përpunimit analitik, të cilat përfshijnë produkte të caktuara.

MOLAP . Në fakt OLAP shumëdimensionale (shumëdimensionale). Produkti bazohet në një strukturë të dhënash jo-relacionale që siguron ruajtje, përpunim dhe paraqitje shumëdimensionale të të dhënave. Prandaj, bazat e të dhënave quhen gjithashtu shumëdimensionale. Produktet në këtë klasë zakonisht kanë një server shumëdimensional të bazës së të dhënave. Të dhënat në procesin e analizës zgjidhen ekskluzivisht nga një strukturë shumëdimensionale. Një strukturë e tillë është shumë produktive.

ROLAP . OLAP relacionale. Siç nënkupton edhe emri, struktura shumëdimensionale në mjete të tilla zbatohet nga tabela relacionale. Dhe të dhënat në procesin e analizës, përkatësisht, përzgjidhen nga baza e të dhënave relacionale nga mjeti analitik.

Disavantazhet dhe avantazhet e secilës qasje janë, në përgjithësi, të dukshme. OLAP shumëdimensionale ofron performancë më të mirë, por strukturat nuk mund të përdoren për të përpunuar sasi të mëdha të dhënash, pasi një dimension i madh do të kërkojë burime të mëdha harduerike, dhe në të njëjtën kohë, rrallësia e hiperkubeve mund të jetë shumë e lartë dhe, për rrjedhojë, përdorimi i kapacitetit të harduerit nuk do të jetë i justifikuar. Përkundrazi, OLAP relacional siguron përpunim në grupe të mëdha të të dhënave të ruajtura, pasi është e mundur të sigurohet ruajtje më ekonomike, por, në të njëjtën kohë, humbet ndjeshëm në shpejtësinë e OLAP shumëdimensionale. Një arsyetim i tillë çoi në zgjedhjen e një klase të re mjetesh analitike - HOLAP. Ky është një përpunim analitik operacional hibrid (hibrid). Mjetet e kësaj klase ju lejojnë të kombinoni të dy qasjet - relacionale dhe shumëdimensionale. Qasja mund të kryhet si në të dhënat e bazave të të dhënave shumëdimensionale ashtu edhe në të dhëna relacionale.

Ekziston një lloj tjetër mjaft ekzotik i përpunimit analitik në internet - DOLAP. Ky është një OLAP "desktop". Fjala është për një përpunim të tillë analitik, ku hiperkubat janë të vegjël, dimensionet e tyre janë të vogla, nevojat janë modeste dhe për një përpunim të tillë analitik mjafton një kompjuter personal në desktop.

Përpunimi analitik operacional mund të thjeshtojë dhe shpejtojë ndjeshëm procesin e përgatitjes dhe marrjes së vendimeve nga personeli drejtues. Përpunimi analitik online shërben për qëllimin e kthimit të të dhënave në informacion. Ai është thelbësisht i ndryshëm nga procesi tradicional i mbështetjes së vendimeve, i cili bazohet, më shpesh, në shqyrtimin e raporteve të strukturuara. Për analogji, ndryshimi midis raporteve të strukturuara dhe OLAP-it është i njëjtë si midis vozitjes nëpër qytet me tramvaj dhe me makinë. Kur hipni në një tramvaj, ai lëviz përgjatë binarëve, gjë që e bën të vështirë shikimin e ndërtesave të largëta, aq më pak afrimin me to. Përkundrazi, drejtimi i një makine private jep liri të plotë lëvizjeje (natyrisht, duhet të respektohen rregullat e trafikut). Mund të shkoni me makinë deri në çdo ndërtesë dhe të arrini në vendet ku nuk qarkullojnë tramvajet.

Raportet e strukturuara janë shinat që pengojnë lirinë për të marrë vendime. OLAP është një makinë për lëvizje efikase në autostradat e informacionit.

Përpunimi analitik në internet, ose OLAP, është një teknologji efikase e përpunimit të të dhënave që rezulton në informacion përmbledhës të bazuar në grupe të mëdha të të gjitha llojeve të të dhënave. Është një produkt i fuqishëm që ju ndihmon të aksesoni, nxirrni dhe shikoni informacionin në një PC, duke e analizuar atë nga këndvështrime të ndryshme.

OLAP është një mjet që ofron një pozicion strategjik për planifikimin afatgjatë dhe merr në konsideratë informacionin themelor të të dhënave operacionale për një periudhë prej 5, 10 ose më shumë vitesh. Të dhënat ruhen në bazën e të dhënave me një dimension, i cili është atributi i tyre. Përdoruesit mund të shikojnë të njëjtin grup të dhënash me atribute të ndryshme, në varësi të qëllimit të analizës.

Historia e OLAP

OLAP nuk është një koncept i ri dhe ka qenë në përdorim për dekada. Në fakt, origjina e teknologjisë është gjurmuar që në vitin 1962. Por termi u krijua vetëm në 1993 nga autori i bazës së të dhënave Ted Codd, i cili gjithashtu vendosi 12 rregulla për produktin. Ashtu si me shumë aplikacione të tjera, koncepti ka kaluar nëpër disa faza të evolucionit.

Historia e vetë teknologjisë OLAP daton në vitin 1970, kur u lëshuan burimet e informacionit Express dhe serveri i parë Olap. Ato u blenë nga Oracle në vitin 1995 dhe më pas u bënë baza e përpunimit analitik në internet të një motori kompjuterik shumëdimensional që një markë e njohur kompjuterash ofroi në bazën e të dhënave të saj. Në vitin 1992, një tjetër produkt i famshëm i përpunimit analitik në internet, Essbase, u lëshua nga Arbor Software (i blerë nga Oracle në 2007).

Në 1998, Microsoft lëshoi ​​MS Analysis Services, një server në internet për përpunimin e të dhënave analitike. Kjo kontribuoi në popullaritetin e teknologjisë dhe nxiti zhvillimin e produkteve të tjera. Sot, ka disa shitës me famë botërore që ofrojnë aplikacione Olap, duke përfshirë IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.

Përpunimi analitik në internet

OLAP është një mjet që ju lejon të merrni vendime për ngjarjet e planifikuara. Një llogaritje atipike Olap mund të jetë më komplekse sesa thjesht grumbullimi i të dhënave. Pyetjet analitike për minutë (AQM) përdoren si një standard standard për krahasimin e performancës së instrumenteve të ndryshëm. Këto sisteme duhet t'i fshehin përdoruesit sa më shumë që të jetë e mundur nga sintaksa komplekse e pyetjeve dhe të ofrojnë kohë përgjigjeje të qëndrueshme për të gjithë (pa marrë parasysh sa komplekse janë).

Ekzistojnë karakteristikat kryesore të mëposhtme të OLAP:

  1. Paraqitje shumëdimensionale të të dhënave.
  2. Mbështetje për llogaritjet komplekse.
  3. Inteligjenca e përkohshme.

Pamja shumëdimensionale ofron bazën për përpunim analitik përmes aksesit fleksibël në të dhënat e korporatës. Ai i lejon përdoruesit të analizojnë të dhënat në çdo dimension dhe në çdo nivel grumbullimi.

Mbështetja për llogaritjet komplekse është shtylla kurrizore e softuerit OLAP.

Inteligjenca e kohës përdoret për të vlerësuar efektivitetin e ndonjë aplikim analitik gjatë një periudhe të caktuar kohore. Për shembull, këtë muaj në krahasim me muajin e kaluar, këtë muaj në krahasim me të njëjtin muaj të vitit të kaluar.

Struktura shumëdimensionale e të dhënave

Një nga karakteristikat kryesore të përpunimit analitik në internet është një strukturë shumëdimensionale e të dhënave. Një kub mund të ketë dimensione të shumëfishta. Falë këtij modeli, i gjithë procesi i analizës inteligjente OLAP është i thjeshtë për menaxherët dhe drejtuesit, pasi objektet e përfaqësuara në qeliza janë objekte biznesi të botës reale. Përveç kësaj, ky model i të dhënave i lejon përdoruesit të përpunojnë jo vetëm grupe të strukturuara, por edhe të pastrukturuara dhe gjysmë të strukturuara. E gjithë kjo i bën ato veçanërisht të njohura për analizën e të dhënave dhe aplikacionet e BI.

Karakteristikat kryesore të sistemeve OLAP:

  1. Përdorni metoda shumëdimensionale të analizës së të dhënave.
  2. Siguroni mbështetje të zgjeruar të bazës së të dhënave.
  3. Krijoni ndërfaqe të përdoruesve fundorë të lehtë për t'u përdorur.
  4. Mbështet arkitekturën e klientit/serverit.

Një nga komponentët kryesorë të koncepteve OLAP është serveri në anën e klientit. Përveç grumbullimit dhe para-trajtimi të dhëna nga një bazë të dhënash relacionale, ajo ofron opsione të avancuara të llogaritjes dhe regjistrimit, funksione shtesë, aftësi themelore të avancuara të kërkimit dhe funksione të tjera.

Në varësi të modelit të aplikacionit të përzgjedhur nga përdoruesi, disponohen modele dhe mjete të ndryshme të të dhënave, duke përfshirë sinjalizimin në kohë reale, skenarët çfarë ndodh, optimizimin dhe raportet e sofistikuara OLAP.

formë kubike

Koncepti bazohet në një formë kubike. Paraqitja e të dhënave në të tregon se si OLAP i përmbahet parimit të analizës shumëdimensionale, duke rezultuar në një strukturë të dhënash të krijuar për analiza të shpejta dhe efikase.

Një kub OLAP quhet gjithashtu "hiperkub". Ai përshkruhet si i përbërë nga fakte (masa) numerike të klasifikuara në aspekte (dimensione). Dimensionet i referohen atributeve që përcaktojnë një problem biznesi. E thënë thjesht, një dimension është një etiketë që përshkruan një masë. Për shembull, në raportet e shitjeve, masa do të ishte vëllimi i shitjeve dhe dimensionet do të përfshinin periudhën e shitjeve, shitësit, produktin ose shërbimin dhe rajonin e shitjeve. Në raportimin e operacioneve prodhuese, matja mund të jetë kostot totale të prodhimit dhe njësitë e prodhimit. Dimensionet do të jenë data ose ora e prodhimit, faza e prodhimit ose faza, madje edhe punëtorët e përfshirë në procesin e prodhimit.

Kubi i të dhënave OLAP është gurthemeli i sistemit. Të dhënat në kub organizohen duke përdorur një skemë ose një yll ose një fjollë dëbore. Në qendër ka një tabelë faktesh që përmban agregate (masa). Ai është i lidhur me një seri tabelash dimensionesh që përmbajnë informacion rreth masave. Dimensionet përshkruajnë se si mund të analizohen këto masa. Nëse një kub përmban më shumë se tre dimensione, ai shpesh quhet hiperkub.

Një nga karakteristikat kryesore që i përket një kubi është natyra e tij statike, që do të thotë se kubi nuk mund të ndryshohet pasi të jetë projektuar. Prandaj, procesi i ndërtimit të një kubi dhe vendosja e një modeli të dhënash është një hap kritik drejt përpunimit të duhur të të dhënave në një arkitekturë OLAP.

Grumbullimi i të dhënave

Përdorimi i grumbullimeve është arsyeja kryesore pse pyetjet përpunohen shumë më shpejt në mjetet OLAP (krahasuar me OLTP). Grumbullimet janë përmbledhje të të dhënave që janë llogaritur paraprakisht në kohën kur janë përpunuar. Të gjithë anëtarët e ruajtur në tabelat e dimensioneve OLAP përcaktojnë pyetjet që mund të marrë një kub.

Në një kub, akumulimet e informacionit ruhen në qeliza, koordinatat e të cilave specifikohen sipas madhësive specifike. Numri i grumbullimeve që mund të përmbajë një kub varet nga të gjitha kombinimet e mundshme të anëtarëve të dimensionit. Prandaj, një kub tipik në një aplikacion mund të përmbajë një numër jashtëzakonisht të madh grumbullimesh. Parallogaritja do të kryhet vetëm për agregatët kryesorë që shpërndahen në të gjithë kubin analitik të analitikës në internet. Kjo do të zvogëlojë shumë kohën që duhet për të përcaktuar ndonjë grumbullim kur ekzekutohet një pyetje në modelin e të dhënave.

Ekzistojnë gjithashtu dy opsione të lidhura me grumbullimin që mund t'i përdorni për të përmirësuar performancën e kubit të përfunduar: krijoni një grumbullim të cache-ve të aftësive dhe përdorni një grumbullim të bazuar në analizën e pyetjeve të përdoruesit.

Parimi i funksionimit

Në mënyrë tipike, analiza e informacionit operacional që rrjedh nga transaksionet mund të kryhet duke përdorur një spreadsheet të thjeshtë (vlerat e të dhënave paraqiten në rreshta dhe kolona). Kjo është e mirë duke pasur parasysh natyrën dydimensionale të të dhënave. Në rastin e OLAP, ka dallime që lidhen me një grup të dhënash shumëdimensionale. Meqenëse ato shpesh merren nga burime të ndryshme, tabela nuk mund t'i përpunojë gjithmonë në mënyrë efikase.

Një kub e zgjidh këtë problem dhe gjithashtu e mban depon e të dhënave OLAP të funksionojë në një mënyrë logjike dhe të rregullt. Biznesi mbledh të dhëna nga burime të shumta dhe paraqitet në formate të ndryshme si p.sh skedarët e tekstit, skedarë multimedial, spreadsheets Excel, bazat e të dhënave Qasja në të dhëna dhe madje edhe bazat e të dhënave OLTP.

Të gjitha të dhënat mblidhen në një ruajtje të mbushur direkt nga burimet. Në të, informacioni i papërpunuar i marrë nga OLTP dhe burime të tjera do të pastrohet nga çdo transaksion i gabuar, i paplotë dhe jokonsistent.

Pas pastrimit dhe transformimit, informacioni do të ruhet në një bazë të dhënash relacionale. Më pas do të ngarkohet në një server shumëdimensional OLAP (ose kubik Olap) për analizë. Përdoruesit përfundimtarë përgjegjës për aplikacionet e biznesit, nxjerrjen e të dhënave dhe operacionet e tjera të biznesit do të kenë akses në informacionin që u nevojitet nga kubi Olap.

Përfitimet e modelit të vargjeve

OLAP është një mjet që ofron performancë të shpejtë të pyetjeve, e cila arrihet përmes ruajtjes së optimizuar, indeksimit shumëdimensional dhe caching, të cilat janë ndër avantazhet e rëndësishme të sistemit. Përveç kësaj, përfitimet janë:

  1. Madhësia më e vogël e të dhënave në disk.
  2. Llogaritja e automatizuar e agregateve të një niveli më të lartë të dhënash.
  3. Modelet e grupeve ofrojnë indeksim natyror.
  4. Nxjerrja efikase e të dhënave arrihet përmes strukturimit paraprak.
  5. Kompaktësia për grupet e të dhënave me dimensione të ulëta.

Disavantazhet e OLAP përfshijnë faktin se disa vendime (hapi i përpunimit) mund të jenë mjaft të gjata, veçanërisht me sasi të mëdha informacioni. Kjo zakonisht korrigjohet duke kryer vetëm përpunim në rritje (duke ekzaminuar të dhënat që kanë ndryshuar).

Operacionet bazë analitike

Përthyerje(roll-up/drill-up) njihet edhe si "konsolidim". Palosja përfshin mbledhjen e të gjitha të dhënave që mund të merren dhe llogaritjen e të gjithave në një ose më shumë dimensione. Më shpesh, kjo mund të kërkojë aplikimin e një formule matematikore. Si një shembull OLAP, merrni parasysh një zinxhir të shitjes me pakicë me pika në qytete të ndryshme. Për të identifikuar modelet dhe për të parashikuar tendencat e ardhshme të shitjeve, ato grumbullohen nga të gjitha vendndodhjet në departamentin kryesor të shitjeve të kompanisë për konsolidim dhe llogaritje.

Zbulimi(stërvitje). Kjo është e kundërta e palosjes. Procesi fillon me një grup të madh të dhënash dhe më pas e ndan atë në pjesë më të vogla, duke i lejuar përdoruesit të shikojnë detajet. Në shembullin e zinxhirit të shitjes me pakicë, një analist do të analizonte të dhënat e shitjeve dhe do të shikonte markat ose produktet individuale që konsiderohen si më të shiturit në secilën prej pikave në qytete të ndryshme.

seksion kryq(Fetë dhe zare). Ky është një proces ku operacionet analitike përfshijnë dy veprime: nxjerrjen e një grupi specifik të dhënash nga një kub OLAP (aspekti i "prerjes" së analizës) dhe shikimi i tij nga këndvështrime ose këndvështrime të ndryshme. Kjo mund të ndodhë kur të gjitha të dhënat e daljes janë marrë dhe futur në hiperkub. Analisti shkurton një grup të dhënash në lidhje me shitjet nga Kubi OLAP. Ai do të rishikohet më vonë kur analizohen shitjet e njësive individuale në çdo rajon. Në këtë kohë, përdoruesit e tjerë mund të fokusohen në vlerësimin e efektivitetit të kostos së shitjeve ose në vlerësimin e efektivitetit të një fushate marketingu dhe reklamimi.

Kthehuni(Trumbulli). Ai rrotullon boshtet e të dhënave për të siguruar një paraqitje zëvendësuese të informacionit.

Varietetet e bazës së të dhënave

Në thelb, ky është një kub tipik OLAP që zbaton analitikë shumëdimensionale të të dhënave me OLAP Cube ose ndonjë kub të dhënash, në mënyrë që procesi analitik të mund të shtojë dimensione sipas nevojës. Çdo informacion i ngarkuar në bazën e të dhënave shumëdimensionale do të ruhet ose arkivohet dhe mund të thirret kur të jetë e nevojshme.

Kuptimi

OLAP relacionale (ROLAP)

ROLAP është një DBMS i avancuar së bashku me hartën e të dhënave shumëdimensionale për të kryer një operacion standard relacional

OLAP shumëdimensionale (MOLAP)

MOLAP - zbaton punën në të dhëna shumëdimensionale

Përpunimi analitik në linjë hibrid (HOLAP)

Në qasjen HOLAP, totalet e grumbulluara ruhen në një bazë të dhënash shumëdimensionale, ndërsa informacioni i detajuar ruhet në një bazë të dhënash relacionale. Kjo siguron efikasitetin e modelit ROLAP dhe performancën e modelit MOLAP.

Desktop OLAP (DOLAP)

Në Desktop OLAP, përdoruesi shkarkon një pjesë të të dhënave nga një bazë të dhënash në nivel lokal ose në desktopin e tij dhe e analizon atë. DOLAP është relativisht më i lirë për t'u vendosur sepse ofron shumë pak funksionalitetin krahasuar me sistemet e tjera OLAP

Web OLAP (WOLAP)

Web OLAP është një sistem OLAP i aksesueshëm përmes një shfletuesi ueb. WOLAP është një arkitekturë me tre shtresa. Ai përbëhet nga tre komponentë: klient, i ndërmjetëm software dhe serveri i bazës së të dhënave

OLAP celular

Mobile OLAP i ndihmon përdoruesit të aksesojnë dhe analizojnë të dhënat OLAP duke përdorur të dhënat e tyre pajisje celulare

OLAP hapësinore

SOLAP është krijuar për të lehtësuar menaxhimin e të dhënave hapësinore dhe jo hapësinore në një sistem informacioni gjeografik (GIS)

Ka sisteme ose teknologji më pak të njohura OLAP, por këto janë ato kryesore që përdoren aktualisht nga korporatat e mëdha, bizneset dhe madje edhe qeveria.

Mjetet OLAP

Mjetet e përpunimit analitik në internet janë shumë mirë të përfaqësuara në internet si në versionet me pagesë ashtu edhe në ato falas.

Më të njohurit prej tyre:

  1. Dundas BI nga Dundas Data Visualization është një platformë e inteligjencës së biznesit dhe vizualizimit të të dhënave të bazuar në shfletues që përfshin panele të integruara, mjete raportimi OLAP dhe analitikë të të dhënave.
  2. Yellowfin është një platformë e inteligjencës së biznesit që është një zgjidhje e vetme e integruar e krijuar për kompani të industrive dhe madhësive të ndryshme. Ky sistem është i personalizueshëm për bizneset në fushën e kontabilitetit, reklamave, bujqësisë.
  3. ClicData është një zgjidhje e inteligjencës së biznesit (BI) e krijuar për t'u përdorur kryesisht nga bizneset e vogla dhe të mesme. Mjeti i lejon përdoruesit fundorë të krijojnë raporte dhe tabela. Bordi u krijua për të kombinuar inteligjencën e biznesit, menaxhimin e performancës së ndërmarrjes dhe është një sistem me karakteristika të plota që shërben për madhësi të mesme dhe niveli i korporatës.
  4. Domo është një paketë e menaxhimit të biznesit të bazuar në renë kompjuterike që integrohet me burime të shumta të të dhënave duke përfshirë spreadsheets, bazat e të dhënave, rrjete sociale dhe çdo re ekzistuese ose lokale zgjidhje softuerike.
  5. InetSoft Style Intelligence është një platformë softuerësh për analistë biznesi që i lejon përdoruesit të krijojnë panele kontrolli, teknologji të analizës vizuale OLAP dhe raporte duke përdorur një motor mashup.
  6. Birst nga Infor Company është një zgjidhje e bazuar në ueb për inteligjencën dhe analizën e biznesit që lidh njohuritë ndërmjet ekipeve për t'ju ndihmuar të merrni vendime të informuara. Mjeti i lejon përdoruesit e decentralizuar të zgjerojnë modelin e ekipit të ndërmarrjes.
  7. Halo është një sistem gjithëpërfshirës i menaxhimit të zinxhirit të furnizimit dhe inteligjencës së biznesit që ndihmon në planifikimin e biznesit dhe parashikimin e inventarit për menaxhimin e zinxhirit të furnizimit. Sistemi përdor të dhëna nga të gjitha burimet - të mëdha, të vogla dhe të ndërmjetme.
  8. Chartio është një zgjidhje analisti biznesi i bazuar në renë kompjuterike që u ofron themeluesve, ekipeve të biznesit, analistëve të të dhënave dhe ekipeve të produkteve mjetet për të organizuar punën e tyre të përditshme.
  9. Exago BI është një zgjidhje në internet e krijuar për t'u ngulitur në aplikacione ueb. Zbatimi i Exago BI lejon kompanitë e të gjitha madhësive t'u ofrojnë klientëve të tyre raportim ad hoc, në kohë reale dhe interaktiv.

Ndikimi i biznesit

Përdoruesi do të gjejë OLAP në shumicën e aplikacioneve të biznesit nëpër industri. Analiza përdoret jo vetëm nga biznesi, por edhe nga palë të tjera të interesuara.

Disa nga aplikimet e tij më të zakonshme përfshijnë:

  1. Analiza e të dhënave OLAP e marketingut.
  2. Raportimi financiar që mbulon shitjet dhe shpenzimet, buxhetimin dhe planifikimin financiar.
  3. Procesi i Menaxhimit të Biznesit.
  4. Analiza e shitjeve.
  5. Marketingu i bazës së të dhënave.

Industritë vazhdojnë të rriten, që do të thotë se përdoruesit së shpejti do të shohin më shumë aplikacione OLAP. Përpunimi i përshtatur me shumë variacione ofron analiza më dinamike. Është për këtë arsye që këto sisteme dhe teknologji OLAP përdoren për të vlerësuar skenarët "çka-nëse" dhe ato alternative të biznesit.

Koncepti Teknologjitë OLAP u formulua nga Edgar Codd në 1993.

Kjo teknologji bazohet në ndërtimin e grupeve të të dhënave shumëdimensionale - të ashtuquajturat kube OLAP (jo domosdoshmërisht tre-dimensionale, siç mund të konkludohet nga përkufizimi). Qëllimi i përdorimit të teknologjive OLAP është të analizojë të dhënat dhe ta paraqesë këtë analizë në një formë të përshtatshme për perceptimin nga personeli drejtues dhe marrjen e vendimeve bazuar në to.

Kërkesat themelore për aplikacionet për analizë shumëvariate:

  • - sigurimin e përdoruesit me rezultatet e analizës në një kohë të arsyeshme (jo më shumë se 5 s.);
  • - qasja me shumë përdorues në të dhëna;
  • - paraqitje shumëdimensionale e të dhënave;
  • - aftësia për të hyrë në çdo informacion, pavarësisht nga vendndodhja dhe vëllimi i tij i ruajtjes.

Mjetet e sistemit OLAP ofrojnë mundësinë për të renditur dhe përzgjedhur të dhënat sipas kushtet e dhëna. Mund të vendosen kushte të ndryshme cilësore dhe sasiore.

Modeli kryesor i të dhënave që përdoret në mjete të shumta për krijimin dhe mirëmbajtjen e bazave të të dhënave - DBMS, është modeli relacional. Të dhënat në të paraqiten në formën e një grupi tabelash dydimensionale-marrëdhënie të lidhura me fusha kyçe. Për të eliminuar dyfishimin, mospërputhjen dhe për të reduktuar kostot e punës për mirëmbajtjen e bazave të të dhënave, përdoret një aparat formal për normalizimin e tabelave të entiteteve. Sidoqoftë, përdorimi i tij shoqërohet me kohën shtesë të shpenzuar për gjenerimin e përgjigjeve ndaj pyetjeve në bazat e të dhënave, megjithëse burimet e memories ruhen.

Një model shumëdimensional i të dhënave përfaqëson objektin në studim në formën e një kubi shumëdimensional, më shpesh përdoret një model tredimensional. Përgjatë boshteve ose faqeve të kubit, matjet ose atributet e atributeve vizatohen. Detajet e bazës janë mbushja e qelizave të kubit. Një kub shumëdimensional mund të përfaqësohet nga një kombinim i kubeve tredimensionale në mënyrë që të lehtësojë perceptimin dhe prezantimin kur gjeneron raportime dhe dokumente analitike dhe prezantime multimediale bazuar në materialet e punës analitike në një sistem të mbështetjes së vendimeve.

Në kuadrin e teknologjive OLAP, bazuar në faktin se një paraqitje shumëdimensionale e të dhënave mund të organizohet si me anë të DBMS-ve relacionale ashtu edhe me mjete të specializuara shumëdimensionale, ekzistojnë tre lloje të sistemeve shumëdimensionale OLAP:

  • - shumëdimensionale (Multidimensionale) OLAP-MOLAP;
  • - relacionale (Relation) OLAP-ROLAP;
  • - i përzier ose hibrid (Hybrid) OLAP-HOLAP.

Në DBMS shumëdimensionale, të dhënat organizohen jo në formën e tabelave relacionale, por në formën e vargjeve shumëdimensionale të renditura në formën e hiperkubeve, kur të gjitha të dhënat e ruajtura duhet të kenë të njëjtin dimension, që nënkupton nevojën për të formuar bazën më të plotë të matjet. Të dhënat mund të organizohen në formën e polikubeve, në këtë opsion ruhen vlerat e secilit tregues me grupin e tyre të matjeve, përpunimi i të dhënave kryhet nga mjeti i vetë sistemit. Struktura e ruajtjes në këtë rast është thjeshtuar, sepse nuk ka nevojë për një zonë të ruajtjes së të dhënave në një formë shumëdimensionale ose të orientuar nga objekti. Kostot e mëdha të punës për krijimin e modeleve dhe sistemeve për konvertimin e të dhënave nga një model relacional në një model reduktohen.

Përparësitë e MOLAP janë:

  • - përgjigje më e shpejtë ndaj kërkesave sesa me ROLAP - koha e shpenzuar është një ose dy rend të madhësisë më pak;
  • - për shkak të kufizimeve të SQL, zbatimi i shumë funksioneve të integruara është i vështirë.

Kufizimet e MOLAP përfshijnë:

  • - madhësi relativisht e vogël e bazave të të dhënave;
  • - për shkak të denormalizimit dhe grumbullimit paraprak, grupet shumëdimensionale përdorin 2,5-100 herë më shumë memorie sesa të dhënat origjinale (konsumi i memories rritet në mënyrë eksponenciale me një rritje të numrit të dimensioneve);
  • - nuk ka standarde për ndërfaqen dhe mjetet e manipulimit të të dhënave;
  • - Ka kufizime gjatë ngarkimit të të dhënave.

Përpjekja e nevojshme për të krijuar të dhëna shumëdimensionale rritet në mënyrë dramatike si në këtë situatë, praktikisht nuk ka mjete të specializuara për objektivizimin e modelit relacional të të dhënave që përmban magazina e informacionit. Koha e përgjigjes ndaj pyetjeve shpesh nuk mund të plotësojë kërkesat për sistemet OLAP.

Përparësitë e sistemeve ROLAP janë:

  • - aftësia për të analizuar shpejt të dhënat e përfshira drejtpërdrejt në ruajtje, sepse shumicë bazat burimore të dhëna - lloji relacional;
  • - me një dimension të ndryshueshëm të problemit, RO-LAP fiton, sepse nuk kërkohet riorganizim fizik i bazës së të dhënave;
  • - Sistemet ROLAP mund të përdorin stacione dhe serverë më pak të fuqishëm klientësh, dhe serverët mbajnë barrën kryesore të përpunimit të pyetjeve komplekse SQL;
  • - Niveli i mbrojtjes së informacionit dhe i diferencimit të të drejtave të aksesit në DBMS relacionale është pakrahasueshëm më i lartë se në ato shumëdimensionale.

Disavantazhi i sistemeve ROLAP është performanca më e ulët, nevoja për studim të kujdesshëm të skemave të bazës së të dhënave, akordimi i veçantë i indeksit, analiza e statistikave të pyetjeve dhe marrja parasysh e përfundimeve të analizës kur modifikohen skemat e bazës së të dhënave, gjë që çon në kosto të konsiderueshme shtesë të punës.

Plotësimi i këtyre kushteve lejon që gjatë përdorimit të sistemeve ROLAP të arrihen tregues të ngjashëm me sistemet MOLAP për sa i përket kohës së aksesit, si dhe të tejkalohen në kursimet e memories.

Sistemet hibride OLAP janë një kombinim i mjeteve që zbatojnë një model të dhënash relacionale dhe shumëdimensionale. Kjo ju lejon të ulni në mënyrë drastike koston e burimeve për krijimin dhe mirëmbajtjen e një modeli të tillë, kohën e përgjigjes ndaj kërkesave.

Kjo qasje përdor avantazhet e dy qasjeve të para dhe kompenson të metat e tyre. Në më të zhvilluarat produkte softuerike për një qëllim të tillë realizohet ky parim.

Përdorimi i një arkitekture hibride në sistemet OLAP është mënyra më e përshtatshme për të zgjidhur problemet që lidhen me përdorimin e mjeteve softuerike në analizat shumëdimensionale.

Mënyra e zbulimit të modelit bazohet në përpunimin inteligjent të të dhënave. Detyra kryesore këtu është identifikimi i modeleve në proceset në studim, marrëdhëniet dhe ndikimi i ndërsjellë i faktorëve të ndryshëm, kërkimi i devijimeve të mëdha "të pazakonta" dhe parashikimi i rrjedhës së proceseve të ndryshme domethënëse. Kjo zonë i përket minierave të të dhënave.

OLAP (OnLine Analytical Processing) nuk është emri i një produkti specifik, por i një teknologjie të tërë të përpunimit analitik në internet që përfshin analizën dhe raportimin e të dhënave. Përdoruesi pajiset me një tabelë shumëdimensionale që përmbledh automatikisht të dhënat në seksione të ndryshme dhe ju lejon të menaxhoni shpejt llogaritjet dhe formën e raportit.

Edhe pse në disa botime përpunimi analitik quhet si online ashtu edhe interaktiv, mbiemri "online" pasqyron më saktë kuptimin e teknologjisë OLAP. Zhvillimi i vendimeve të menaxhimit menaxherial bie në kategorinë e fushave më të rrejshme ndaj automatizimit. Sidoqoftë, sot ekziston një mundësi për të ndihmuar menaxherin në zhvillimin e vendimeve dhe, më e rëndësishmja, për të shpejtuar ndjeshëm procesin e zhvillimit të vendimeve, përzgjedhjen dhe miratimin e tyre.

Sistemet e mbështetjes së vendimit zakonisht kanë mjetet për t'i siguruar përdoruesit të dhëna të përgjithshme për mostra të ndryshme nga grupi fillestar në një formë të përshtatshme për perceptim dhe analizë. Si rregull, funksione të tilla agregate formojnë një grup të dhënash shumëdimensionale, të quajtur shpesh hiperkub ose metakub, boshtet e të cilit përmbajnë parametra, dhe qelizat përmbajnë të dhëna agregate që varen prej tyre - dhe të dhëna të tilla gjithashtu mund të ruhen në tabela relacionale, por në këtë Në rast se bëhet fjalë për të dhëna logjike të organizimit, dhe jo për zbatimin fizik të ruajtjes së tyre.

Përgjatë çdo boshti, të dhënat mund të organizohen në një hierarki që përfaqëson nivele të ndryshme detajesh.

Sipas dimensioneve në modelin shumëdimensional, lihen mënjanë faktorët që ndikojnë në aktivitetet e ndërmarrjes (p.sh.: koha, produktet, degët e kompanisë etj.). Kubi OLAP që rezulton më pas mbushet me tregues të aktivitetit të ndërmarrjes (çmimet, shitjet, plani, fitimet, fluksi i parasë, etj.). Duhet të theksohet se, ndryshe nga një kub gjeometrik, faqet e një kubi OLAP nuk duhet të kenë të njëjtën madhësi. Kjo mbushje mund të kryhet si me të dhëna reale të sistemeve operative, ashtu edhe të parashikohet në bazë të të dhënave historike. Dimensionet e hiperkubit mund të jenë komplekse, hierarkike dhe mund të vendosen marrëdhënie ndërmjet tyre. Gjatë analizës, përdoruesi mund të ndryshojë këndvështrimin mbi të dhënat (i ashtuquajturi operacioni i ndryshimit të pamjes logjike), duke parë kështu të dhënat në seksione të ndryshme dhe duke zgjidhur probleme specifike. Operacione të ndryshme mund të kryhen në kube, duke përfshirë parashikimin dhe planifikimin e kushtëzuar (çka-nëse analiza).

Falë këtij modeli të dhënash, përdoruesit mund të formulojnë pyetje komplekse, të gjenerojnë raporte dhe të marrin nëngrupe të dhënash. Përpunimi analitik operacional mund të thjeshtojë dhe shpejtojë ndjeshëm procesin e përgatitjes dhe marrjes së vendimeve nga personeli drejtues. Përpunimi analitik online shërben për qëllimin e kthimit të të dhënave në informacion. Ai është thelbësisht i ndryshëm nga procesi tradicional i mbështetjes së vendimeve, i cili bazohet, më shpesh, në shqyrtimin e raporteve të strukturuara.


Teknologjia OLAP i referohet llojit të analizës intelektuale dhe përfshin 12 parime:

1. Paraqitja konceptuale shumëdimensionale. Përdoruesi-analist e sheh botën e ndërmarrjes si një natyrë shumëdimensionale, respektivisht, dhe modeli OLAP duhet të jetë shumëdimensional në thelbin e tij.

2. Transparenca. Arkitektura e sistemit OLAP duhet të jetë e hapur, duke i lejuar përdoruesit, kudo që të jetë, të komunikojë duke përdorur një mjet analitik - klientin - me serverin.

3. Disponueshmëria. Një përdorues analist OLAP duhet të jetë në gjendje të kryejë analiza bazuar në një skemë të përbashkët konceptuale që përmban të dhëna për mbarë ndërmarrjen në një bazë të dhënash relacionale, si dhe të dhëna nga bazat e të dhënave të trashëgimisë, në metodat e zakonshme të aksesit dhe në një model të përbashkët analitik. Një sistem OLAP duhet të ketë akses vetëm në të dhënat që nevojiten vërtet dhe të mos zbatojë parimin e përgjithshëm të "gypit të kuzhinës" që kërkon të dhëna të panevojshme.

4. Performancë konsistente në zhvillimin e raportit. Me një rritje të numrit të dimensioneve ose madhësisë së bazës së të dhënave, përdoruesi analist nuk duhet të pësojë një rënie të ndjeshme të performancës.

5. Arkitektura klient-server. Shumica e të dhënave të kërkuara për analitikën në internet sot qëndrojnë në korniza kryesore me akses në stacionet e punës të përdoruesve përmes një LAN. Kjo do të thotë që produktet OLAP duhet të jenë në gjendje të punojnë në një mjedis klient-server.

6. Shumëdimensionale e përgjithshme. Çdo dimension duhet të zbatohet pavarësisht nga struktura dhe aftësitë e tij operacionale. Strukturat themelore të të dhënave, formulat dhe formatet e raportimit nuk duhet të jenë të njëanshme ndaj ndonjë dimensioni të vetëm.

7. Menaxhimi dinamik i matricave të rralla. Dizajni fizik i një mjeti OLAP duhet të jetë plotësisht i adaptueshëm me modelin specifik analitik në mënyrë që të menaxhojë në mënyrë optimale matricat e rralla. Spariteti (i matur si përqindja e qelizave boshe ndaj të gjitha atyre të mundshme) është një nga karakteristikat e përhapjes së të dhënave.

8. Mbështetje me shumë përdorues. Një mjet OLAP duhet të ofrojë aftësinë për të ndarë pyetjen dhe për të shtuar përdorues të shumtë analistë duke ruajtur integritetin dhe sigurinë.

9. Operacione kryq të pakufizuar. Operacione të ndryshme, për shkak të natyrës së tyre hierarkike, mund të përfaqësojnë marrëdhënie të varura në modelin OLAP, domethënë janë ndërfunksionale. Ekzekutimi i tyre nuk duhet të kërkojë që përdoruesi analist të ripërcaktojë këto llogaritje dhe operacione.

10. Manipulim intuitiv i të dhënave. Pamja e përdoruesit analist për dimensionet e përcaktuara në modelin analitik duhet të përmbajë të gjithë informacionin e nevojshëm për të kryer veprime në modelin OLAP, d.m.th. ato nuk duhet të kërkojnë përdorimin e një sistemi menuje ose operacione të tjera të ndërfaqes së përdoruesit.

11. Opsione fleksibël të raportimit. Mjetet e raportimit duhet të jenë të dhëna të sintetizuara ose informacione që rezultojnë nga modeli i të dhënave në çdo orientim të mundshëm. Kjo do të thotë se rreshtat, kolonat ose faqet e një raporti duhet të shfaqin dimensione të shumëfishta të një modeli OLAP në të njëjtën kohë, me aftësinë për të shfaqur çdo nëngrup të elementeve (vlerave) të përmbajtura në dimension dhe në çdo renditje.

12. Dimensioni dhe numri i pakufizuar i niveleve të grumbullimit. Një studim mbi numrin e mundshëm të matjeve të nevojshme të kërkuara në një model analitik tregoi se deri në 19 matje mund të përdoren njëkohësisht nga një përdorues analist. Kjo çon në një rekomandim për numrin e dimensioneve të mbështetura nga sistemi OLAP. Për më tepër, secili nga dimensionet e përbashkëta nuk duhet të kufizohet nga numri i niveleve të grumbullimit të përcaktuar nga analisti përdorues.

Si sisteme të specializuara OLAP që ofrohen aktualisht në treg, mund të specifikoni CalliGraph, Business Intelligence.

Për të zgjidhur detyra të thjeshta të analizës së të dhënave, është e mundur të përdorni një zgjidhje buxhetore - aplikacionet e zyrës Excel dhe Access Microsoft, të cilat përmbajnë mjete elementare të teknologjisë OLAP që ju lejojnë të krijoni tabela kryesore dhe të ndërtoni raporte të ndryshme bazuar në to.

OLAP(nga anglishtja OnLine Analytical Processing - përpunimi i të dhënave analitike operacionale, gjithashtu: përpunimi i të dhënave analitike në kohë reale, përpunimi interaktiv analitik i të dhënave) - një qasje për përpunimin analitik të të dhënave bazuar në paraqitjen e tyre hierarkike shumëdimensionale, e cila është pjesë e një zone më të gjerë teknologjitë e informacionit- inteligjenca e biznesit ().

Shihni katalogun e zgjidhjeve dhe projekteve OLAP në seksionin OLAP në TAdviser.

Nga këndvështrimi i përdoruesit, OLAP- sistemet paraqesin mjete të shikimit fleksibël të informacionit në seksione të ndryshme, marrje automatike të dhëna të grumbulluara, kryerja e operacioneve analitike të konvolucionit, detajimi, krahasimi me kalimin e kohës. E gjithë kjo i bën sistemet OLAP një zgjidhje me avantazhe të dukshme në fushën e përgatitjes së të dhënave për të gjitha llojet e raportimit të biznesit, duke përfshirë prezantimin e të dhënave në seksione të ndryshme dhe nivele të ndryshme hierarkie - për shembull, raportet e shitjeve, forma të ndryshme buxheti, etj. në. Përparësitë e një prezantimi të tillë janë të dukshme edhe në format e tjera të analizës së të dhënave, duke përfshirë parashikimin.

Kërkesat për sistemet OLAP. FASMI

Kërkesa kryesore për sistemet OLAP është shpejtësia, e cila i lejon ato të përdoren në procesin e punës ndërvepruese të një analisti me informacion. Në këtë kuptim, sistemet OLAP i kundërvihen, së pari, RDBMS tradicionale, zgjedhjet nga të cilat me pyetje tipike për analistët që përdorin grupimin dhe grumbullimin e të dhënave zakonisht janë të shtrenjta për sa i përket kohës së pritjes dhe ngarkimit të RDBMS, prandaj, puna ndërvepruese me ta me ndonjë vëllim të rëndësishëm. të dhënat janë komplekse. Së dyti, sistemet OLAP kundërshtojnë gjithashtu paraqitjen e zakonshme të të dhënave me skedarë të sheshtë, për shembull, në formën e fletëllogarive tradicionale të përdorura zakonisht, prezantimin e të dhënave shumëdimensionale në të cilat është e vështirë dhe jo intuitive, dhe operacionet për të ndryshuar pjesën - pika shikimi mbi të dhënat - gjithashtu kërkojnë kohë dhe përpjekje.ndërlikojnë punën ndërvepruese me të dhënat.

Në të njëjtën kohë, nga njëra anë, kërkesat e të dhënave specifike për sistemet OLAP zakonisht nënkuptojnë ruajtjen e të dhënave në struktura të veçanta të optimizuara për detyra tipike OLAP, nga ana tjetër, nxjerrja e drejtpërdrejtë e të dhënave nga sistemet ekzistuese gjatë procesit të analizës do të çonte në një rënie të konsiderueshme. në performancën e tyre.

Prandaj, një kërkesë e rëndësishme është të sigurohet lidhja më fleksibël e import-eksportit midis sistemeve ekzistuese që veprojnë si burim të dhënash dhe sistemit OLAP, si dhe sistemit OLAP dhe aplikacioneve të analizës dhe raportimit të të dhënave të jashtme.

Në të njëjtën kohë, një lidhje e tillë duhet të plotësojë kërkesat e dukshme për mbështetjen e import-eksportit nga disa burime të dhënash, zbatimin e procedurave për pastrimin dhe transformimin e të dhënave dhe unifikimin e klasifikuesve dhe drejtorive të përdorura. Përveç kësaj, këto kërkesa plotësohen nga nevoja për të marrë parasysh ciklet e ndryshme të përditësimit të të dhënave ekzistuese sistemet e informacionit dhe unifikimin e nivelit të kërkuar të detajeve të të dhënave. Kompleksiteti dhe shkathtësia e këtij problemi ka çuar në shfaqjen e konceptit të depove të të dhënave dhe, në një kuptim të ngushtë, në shpërndarjen e një klase të veçantë të shërbimeve të konvertimit dhe transformimit të të dhënave - ETL (Ngarkesa e Transformimit të Ekstraktit).

Modelet aktive të ruajtjes së të dhënave

Më lart, ne treguam se OLAP supozon një paraqitje hierarkike shumëdimensionale të të dhënave dhe, në një farë kuptimi, është kundër sistemeve të bazuara në RDBMS.

Megjithatë, kjo nuk do të thotë që të gjitha sistemet OLAP përdorin një model shumëdimensional për të ruajtur të dhënat aktive të sistemit "punues". Meqenëse modeli aktiv i ruajtjes së të dhënave ndikon në të gjitha kërkesat e diktuara nga testi FASMI, rëndësia e tij theksohet nga fakti se mbi këtë bazë dallohen tradicionalisht nëntipet OLAP - shumëdimensionale (MOLAP), relacionale (ROLAP) dhe hibride (HOLAP).

Megjithatë, disa ekspertë, të udhëhequr nga të lartpërmendurit Nigel Pends, tregojnë se klasifikimi i bazuar në një kriter nuk është mjaftueshëm i plotë. Për më tepër, shumica dërrmuese e sistemeve ekzistuese OLAP do të jenë të një lloji hibrid. Prandaj, ne do të ndalemi në modelet aktive të ruajtjes së të dhënave, duke përmendur se cilat prej tyre korrespondojnë me cilin nga nëntipet tradicionale OLAP.

Ruajtja e të dhënave aktive në një bazë të dhënash shumëdimensionale

Në këtë rast, të dhënat OLAP ruhen në DBMS shumëdimensionale që përdorin konstruksione të optimizuara për këtë lloj të dhënash. Në mënyrë tipike, DBMS shumëdimensionale gjithashtu mbështet të gjitha operacionet tipike OLAP, duke përfshirë grumbullimin sipas niveleve të kërkuara të hierarkisë, e kështu me radhë.

Ky lloj i ruajtjes së të dhënave në njëfarë kuptimi mund të quhet klasik për OLAP. Për të, megjithatë, të gjitha hapat për përgatitjen paraprake të të dhënave janë plotësisht të nevojshme. Në mënyrë tipike, të dhënat shumëdimensionale DBMS ruhen në disk, megjithatë, në disa raste, për të shpejtuar përpunimin e të dhënave, sisteme të tilla ju lejojnë të ruani të dhëna në RAM. Për të njëjtat qëllime, ndonjëherë përdoret ruajtja në bazën e të dhënave të vlerave agregate të parallogaritura dhe vlerave të tjera të llogaritura.

DBMS-të shumëdimensionale që mbështesin plotësisht aksesin e shumë përdoruesve me transaksione të njëkohshme leximi dhe shkrimi janë mjaft të rralla, mënyrë normale për DBMS të tilla është një përdorues me akses shkrimi ndërsa vetëm për lexim me shumë përdorues, ose vetëm për lexim me shumë përdorues.

Ndër mangësitë e kushtëzuara karakteristike të disa zbatimeve të sistemeve shumëdimensionale DBMS dhe OLAP të bazuara në to, mund të vërehet ndjeshmëria e tyre ndaj një rritje të sasisë së hapësirës së zënë nga baza e të dhënave, e cila është e paparashikueshme nga këndvështrimi i përdoruesit. Ky efekt shkaktohet nga dëshira për të minimizuar kohën e përgjigjes së sistemit, duke diktuar ruajtjen e vlerave të parallogaritura të treguesve agregat dhe sasive të tjera në bazën e të dhënave, gjë që shkakton një rritje jolineare të sasisë së informacionit të ruajtur në bazën e të dhënave me shtimi i vlerave ose matjeve të reja të të dhënave në të.

Shkalla e manifestimit të këtij problemi, si dhe problemet e lidhura me ruajtjen efikase të kubeve të pakta të të dhënave, përcaktohet nga cilësia e qasjeve dhe algoritmeve të aplikuara për implementime specifike të sistemeve OLAP.

Ruajtja e të dhënave aktive në një bazë të dhënash relacionale

Të dhënat OLAP gjithashtu mund të ruhen në një RDBMS tradicionale. Në shumicën e rasteve, kjo qasje përdoret kur përpiqeni të integroni "pa dhimbje" OLAP me sistemet ekzistuese të kontabilitetit ose magazinat e të dhënave të bazuara në RDBMS. Në të njëjtën kohë, kjo qasje kërkon disa veçori shtesë nga RDBMS për të siguruar përmbushjen efektive të kërkesave të testit FASMI (në veçanti, duke siguruar kohën minimale të përgjigjes së sistemit). Në mënyrë tipike, të dhënat OLAP ruhen në një formë të denormalizuar, dhe disa nga agregatët dhe vlerat e parallogaritura ruhen në tabela të veçanta. Kur ruhet në një formë të normalizuar, efektiviteti i RDBMS si një metodë për ruajtjen e të dhënave aktive zvogëlohet.

Problemi i zgjedhjes së qasjeve dhe algoritmeve efikase për ruajtjen e të dhënave të parallogaritura është gjithashtu i rëndësishëm për sistemet OLAP të bazuara në RDBMS, kështu që prodhuesit e sistemeve të tilla zakonisht fokusohen në meritat e qasjeve të përdorura.

Në përgjithësi, besohet se sistemet OLAP të bazuara në RDBMS janë më të ngadalta se sistemet e bazuara në DBMS shumëdimensionale, duke përfshirë për shkak të strukturave të ruajtjes së të dhënave që janë më pak efikase për detyrat OLAP, por në praktikë kjo varet nga karakteristikat e një sistemi të caktuar.

Ndër avantazhet e ruajtjes së të dhënave në RDBMS zakonisht quhet shkallëzueshmëria më e madhe e sistemeve të tilla.

Ruajtja e të dhënave aktive në skedarë "të sheshtë".

Kjo qasje përfshin ruajtjen e pjesëve të të dhënave në skedarë të rregullt. Zakonisht përdoret si një shtesë e njërës prej dy qasjeve kryesore për të përshpejtuar punën duke ruajtur të dhënat e përditësuara në disk ose në kujtesë e gjallë PC klienti.

Qasja hibride e ruajtjes

Shumica e prodhuesve të sistemeve OLAP që promovojnë zgjidhjet e tyre të integruara, shpesh duke përfshirë, përveç vetë sistemit OLAP, një DBMS, ETL (Ngarkesa e Transformimit të Ekstraktimit) dhe mjete raportimi, aktualisht po përdorin një qasje hibride për organizimin e ruajtjes së të dhënave aktive të sistemit. shpërndarja e tyre në një mënyrë ose në një tjetër midis RDBMS dhe ruajtjes së specializuar, si dhe midis strukturave të diskut dhe caching në memorie.

Meqenëse efektiviteti i një zgjidhjeje të tillë varet nga qasjet dhe algoritmet specifike të përdorura nga prodhuesi për të përcaktuar nëse cilat të dhëna dhe ku të ruhen, pastaj nxirrni me ngut përfundime për efikasitetin fillimisht më të madh të zgjidhjeve të tilla si një klasë pa vlerësuar veçoritë specifike të sistemit në shqyrtim.

OLAP(anglisht përpunimi analitik on-line) - një grup metodash për përpunimin dinamik të pyetjeve shumëdimensionale në bazat e të dhënave analitike. Burime të tilla të të dhënave janë zakonisht mjaft të mëdha, dhe në mjetet e përdorura për përpunimin e tyre, një nga kërkesat më të rëndësishme është shpejtësia e lartë. Në bazat e të dhënave relacionale, informacioni ruhet në tabela të veçanta që janë normalizuar mirë. Por pyetjet komplekse me shumë tabela janë mjaft të ngadalta në to. Performanca dukshëm më e mirë për sa i përket shpejtësisë së përpunimit në sistemet OLAP arrihet për shkak të veçorive të strukturës së ruajtjes së të dhënave. I gjithë informacioni është i organizuar qartë dhe përdoren dy lloje të ruajtjes së të dhënave: matjet(përmbajnë drejtori të ndara në kategori, si pikat e shitjes, klientët, punonjësit, shërbimet etj.) dhe fakte(karakterizon ndërveprimin e elementeve matje të ndryshme, për shembull, më 3 mars 2010, shitësi A i ofroi një shërbim klientit B në dyqanin C për shumën e njësive monetare G). Masat përdoren për të llogaritur rezultatet në një kub analitik. Masat janë koleksione faktesh të grumbulluara sipas dimensioneve përkatëse të përzgjedhura dhe anëtarëve të tyre. Për shkak të këtyre veçorive, pyetjet komplekse me të dhëna shumëdimensionale kërkojnë shumë më pak kohë sesa burimet relacionale.

Një nga shitësit kryesorë të sistemeve OLAP është Microsoft Corporation. Le të shqyrtojmë zbatimin e parimeve OLAP duke përdorur shembuj praktikë të krijimit të një kubi analitik në aplikacionet Microsoft SQL Server Business Intelligence Development Studio (BIDS) dhe Microsoft Office PerformancePoint Server Planning Business Modeler (PPS) dhe të njihemi me mundësitë e paraqitjes vizuale të të dhënave shumëdimensionale. në formën e grafikëve, grafikëve dhe tabelave.

Për shembull, në BIDS, ju duhet të krijoni një kub OLAP bazuar në të dhënat për një kompani sigurimesh, punonjësit e saj, partnerët (klientët) dhe pikat e shitjes. Le të supozojmë se kompania ofron një lloj shërbimi, kështu që matja e shërbimeve nuk është e nevojshme.

Le të përcaktojmë së pari dimensionet. Subjektet e mëposhtme (kategoritë e të dhënave) janë të lidhura me aktivitetet e kompanisë:

  • Pikat e shitjes
    - Punonjësit
    - Partnerët
Krijon gjithashtu dimensionet Koha dhe Skenari, të cilat janë të detyrueshme për çdo kub.
Më pas, ju nevojitet një tabelë për të ruajtur faktet (tabela e fakteve).
Informacioni në tabela mund të futet manualisht, por mënyra më e zakonshme është ngarkimi i të dhënave duke përdorur magjistarin e importit nga burime të ndryshme.
Figura e mëposhtme tregon rrjedhën e procesit për krijimin dhe plotësimin manual të tabelave të dimensioneve dhe fakteve:

Fig.1. Tabelat e matjeve dhe faktet në një bazë të dhënash analitike. Sekuenca e krijimit
Pas krijimit të një burimi shumëdimensional të të dhënave në BIDS, mund të shikoni paraqitjen e tij (Pamje e burimit të të dhënave). Në shembullin tonë, marrim qarkun e treguar në figurën më poshtë.


Fig.2. Pamja e burimit të të dhënave në Studion e Zhvillimit të Inteligjencave të Biznesit (BIDS)

Siç mund ta shihni, tabela e fakteve lidhet me tabelat e dimensioneve përmes një korrespondence një-për-një të fushave identifikuese (PartnerID, EmployeeID, etj.).

Le të shohim rezultatin. Në skedën e shfletuesit kubik, duke tërhequr masat dhe dimensionet në fushat e totaleve, rreshtave, kolonave dhe filtrave, mund të marrim një pamje të të dhënave me interes (për shembull, kontratat e sigurimit të lidhura nga një punonjës i caktuar në 2005).



Artikuj të ngjashëm: