Hyrje në OLAP. Kurse: Teknologjia OLAP 11 Karakteristikat e teknologjisë OLAP në Menaxhimin Financiar

drejtues

Kohët e fundit, është shkruar shumë për OLAP. Mund të themi se ka pasur një lulëzim rreth këtyre teknologjive. Vërtetë, për ne ky bum ishte disi vonë, por kjo, natyrisht, lidhet me situatën e përgjithshme në vend.

Sistemet e informacionit të shkallës së ndërmarrjes, si rregull, përmbajnë aplikacione të dizajnuara për analiza komplekse me shumë ndryshime të të dhënave, dinamikën e tyre, tendencat, etj. Kjo analizë ka për qëllim përfundimisht të lehtësojë vendimmarrjen. Shpesh këto sisteme quhen sisteme mbështetëse të vendimeve.

Sistemet mbështetëse të vendimeve zakonisht kanë mjete për t'i siguruar përdoruesit të dhëna të përgjithshme për mostra të ndryshme nga grupi fillestar në një formë që është e përshtatshme për perceptim dhe analizë. Në mënyrë tipike, funksione të tilla agregate formojnë një grup të dhënash shumëdimensionale (dhe, prandaj, jo -relacionale) (shpesh të quajtur një hypercube ose metacube), akset e të cilave përmbajnë parametra, dhe qelizat - të dhënat e përgjithshme që varen prej tyre - dhe të dhëna të tilla të ruhen në tabela relacionale, por në këtë rast, ne po flasim për organizimin logjik të të dhënave, dhe jo për zbatimin fizik të ruajtjes së tyre). Përgjatë secilit aks, të dhënat mund të organizohen në një hierarki që përfaqëson nivele të ndryshme detajesh. Me këtë model të dhënash, përdoruesit mund të formulojnë pyetje komplekse, gjeneroni raporte, merrni nënbashkësi të dhënash.

Teknologjia e analizës komplekse të të dhënave me shumë ndryshime quhet OLAP (Përpunimi Analitik On-Line).

OLAP është një komponent kryesor i organizatës së ruajtjes së të dhënave.

Koncepti OLAP u përshkrua për herë të parë në 1993 nga Edgar Codd, një studiues i njohur i bazës së të dhënave dhe autor i modelit të të dhënave relacionale.E.F. Codd, S.B. Codd, dhe C.T. Salley, Sigurimi i OLAP (përpunimi analitik on-line) për analistët e përdoruesve: Një mandat IT. Raport teknik, 1993).

Në 1995, bazuar në kërkesat e përcaktuara nga Codd, u formulua i ashtuquajturi test i Analizës së Shpejtë të Informacionit Shumëdimensional të Përbashkët (FASMI), i cili përfshin kërkesat e mëposhtme për aplikimet për analiza me shumë ndryshore:

· sigurimi i përdoruesit me rezultatet e analizës në një kohë të arsyeshme (zakonisht jo më shumë se 5 sekonda), edhe me koston e një analize më pak të detajuar;

· aftësia për të kryer ndonjë analizë logjike dhe statistikore karakteristike të të këtij aplikacioni, dhe ruajtjen e tij në një formë të arritshme për përdoruesit përfundimtar;

· qasje të shumë përdoruesve në të dhëna me mbështetjen e mekanizmave të përshtatshëm të kyçjes dhe mjeteve të autorizuara të hyrjes;

· përfaqësimi konceptual shumëdimensional i të dhënave, përfshirë mbështetjen e plotë për hierarkitë dhe hierarkitë e shumta (kjo është një kërkesë kryesore e OLAP);

· aftësia për të hyrë në çdo informacion të nevojshëm, pavarësisht nga vëllimi dhe vendndodhja e tij e ruajtjes.

Duhet të theksohet se funksionaliteti OLAP mund të zbatohet menyra te ndryshme duke filluar nga mjetet më të thjeshta të analizës së të dhënave në aplikacionet e zyrës deri tek sistemet analitike të shpërndara të bazuara në produktet e serverit. Përdoruesit mund t'i shikojnë me lehtësi të dhënat në një strukturë shumëdimensionale siç zbatohen për nevojat e tyre.

2. Çfarë është OLAP

OLAP - një shkurtim për Përpunimin Analitik On -Line - nuk është një emër për një produkt specifik, por për një teknologji të tërë. Në rusisht, është më e përshtatshme të telefononi përpunimin analitik në internet OLAP. Megjithëse disa botime i referohen përpunimit analitik si online ashtu edhe interaktiv, mbiemri "online" sa më saktë që të jetë e mundur pasqyron kuptimin e teknologjisë OLAP.

Zhvillimi i zgjidhjeve të menaxhimit nga një menaxher bie në kategorinë e zonave më të vështira për tu automatizuar. Sidoqoftë, sot ekziston një mundësi për të ndihmuar një menaxher në zhvillimin e vendimeve dhe, më e rëndësishmja, për të përshpejtuar ndjeshëm procesin e zhvillimit të vendimeve, përzgjedhjen dhe miratimin e tyre. Ju mund të përdorni OLAP për këtë.

Le të hedhim një vështrim se si funksionon zakonisht procesi i zhvillimit të zgjidhjes.

Historikisht, zgjidhjet për automatizimin e aktiviteteve operacionale janë më të zhvilluarat. Ne po flasim për sistemet e përpunimit të të dhënave transaksionale (OLTP), të quajtura më thjesht sisteme operacionale. Këto sisteme sigurojnë regjistrimin e disa fakteve, ruajtjen e tyre të shkurtër dhe ruajtjen në arkiva. Baza e sistemeve të tilla sigurohet nga sistemet e menaxhimit të bazës së të dhënave relacionale (RDBMS). Qasja tradicionale është të përpiqeni të përdorni sisteme operative të ndërtuara tashmë për të mbështetur vendimmarrjen. Zakonisht ata përpiqen të ndërtojnë një sistem të zhvilluar kërkesash për sistemin operativ dhe përdorin raportet e marra pas interpretimit direkt për mbështetjen e vendimeve. Raportet mund të ndërtohen në bazë të personalizuar, d.m.th. mbikëqyrësi kërkon një raport, dhe në baza të rregullta, kur raportet ndërtohen me arritjen e një ngjarjeje ose kohe. Për shembull, një proces tradicional i mbështetjes së vendimeve mund të duket kështu: një menaxher shkon te një specialist i departamentit të informacionit dhe ndan pyetjen e tij me të. Specialisti CIO pastaj krijon një kërkesë për sistemin operativ, merr një raport elektronik, e interpreton atë dhe më pas ia komunikon stafit drejtues. Sigurisht, një skemë e tillë siguron në një farë mase mbështetjen e vendimit, por ka efikasitet jashtëzakonisht të ulët dhe një numër të madh disavantazhesh. Pak të dhëna përdoren për të mbështetur vendimet kritike të misionit. Ka edhe probleme të tjera. Ky proces është shumë i ngadalshëm, pasi vetë procesi i shkrimit të kërkesave dhe interpretimit të një raporti elektronik është i gjatë. Duhen shumë ditë, në një kohë kur udhëheqësi mund të ketë nevojë të marrë një vendim tani, menjëherë. Nëse marrim parasysh se menaxheri, pas marrjes së raportit, mund të jetë i interesuar për një çështje tjetër (të themi, sqarimin ose marrjen parasysh të të dhënave në një kontekst të ndryshëm), atëherë ky cikël i ngadalshëm duhet të përsëritet, dhe meqenëse procesi i të dhënave analiza sistemet operative do të ndodhë në mënyrë të përsëritur, atëherë shpenzohet edhe më shumë kohë. Një problem tjetër është problemi i fushave të ndryshme të veprimtarisë së një specialisti në teknologjia e informacionit dhe një udhëheqës që mund të mendojë në kategori të ndryshme dhe, si rezultat, nuk e kuptojnë njëri -tjetrin. Atëherë do të kërkohen përsëritje shtesë të rafinimit, dhe kjo është përsëri koha, e cila gjithmonë nuk është e mjaftueshme. Një çështje tjetër e rëndësishme është kompleksiteti i raporteve për tu kuptuar. Menaxheri nuk ka kohë të zgjedhë shifrat me interes nga raporti, veçanërisht pasi mund të ketë shumë prej tyre (mbani mend raportet e mëdha me shumë faqe në të cilat në të vërtetë përdoren disa faqe, dhe pjesën tjetër - për çdo rast). Ne gjithashtu vërejmë se puna e interpretimit më së shpeshti bie mbi specialistët e departamenteve të informacionit. Kjo do të thotë, një specialist kompetent shpërqendrohet nga puna rutinë dhe joefektive e vizatimit të diagrameve, etj., Të cilat, natyrisht, nuk mund të kenë një efekt të favorshëm në kualifikimet e tij. Për më tepër, nuk është sekret që ka dashamirës në zinxhirin e interpretimit të cilët janë të interesuar të shtrembërojnë me qëllim informacionin e ardhur.

Mangësitë e lartpërmendura të bëjnë të mendosh si për efikasitetin e përgjithshëm të sistemit operativ ashtu edhe për kostot që lidhen me ekzistencën e tij, pasi rezulton se kostot e krijimit të një sistemi operacional nuk kompensohen në mënyrë adekuate nga efikasiteti i punës së tij.

Në realitet, këto probleme nuk janë pasojë e cilësisë së dobët të sistemit operativ ose ndërtimit të tij të dobët. Rrënjët e problemeve qëndrojnë në ndryshimin themelor midis aktiviteteve operacionale që automatizohen nga sistemi operativ dhe aktiviteteve të zhvillimit dhe vendimmarrjes. Ky ndryshim qëndron në faktin se të dhënat e sistemeve operacionale janë thjesht regjistrime të disa ngjarjeve që kanë ndodhur, fakte, por në asnjë mënyrë informacion në kuptimin e përgjithshëm të fjalës. Informacioni është ai që zvogëlon pasigurinë në çdo fushë. Dhe do të ishte shumë mirë nëse informacioni zvogëlonte pasigurinë në fushën e përgatitjes së vendimeve. Famëkeqja E.F. Codd, pioneri i teknologjive të menaxhimit të bazës së të dhënave relacionale në vitet 1970: "Ndërsa sistemet e menaxhimit të bazës së të dhënave relacionale janë në dispozicion të përdoruesve, ato nuk janë parë kurrë si një mjet i fuqishëm për sintetizimin, analizimin dhe konsolidimin (funksione të quajtura analiza të të dhënave me shumë ndryshime).") Me Bëhet fjalë pikërisht për sintezën e informacionit, për mënyrën se si të kthehen të dhënat e sistemeve operacionale në informacion dhe madje edhe në vlerësime cilësore. OLAP ju lejon të bëni këtë transformim.

OLAP bazohet në idenë e një modeli të të dhënave shumëdimensionale. Mendimi njerëzor është shumëdimensional sipas përkufizimit. Kur një person bën pyetje, ai vendos kufizime, duke formuluar kështu pyetje në shumë dimensione, kështu që procesi i analizës në një model shumëdimensional është shumë afër realitetit të të menduarit njerëzor. Sipas dimensioneve në modelin shumëdimensional, faktorët që ndikojnë në aktivitetet e ndërmarrjes (për shembull: koha, produktet, departamentet e kompanisë, gjeografia, etj.) Shtyhen. Kështu, merret një hiperkub (natyrisht, emri nuk është shumë i mirë, pasi një kub zakonisht kuptohet si një figurë me skaje të barabarta, e cila, në këtë rast, është larg rastit), e cila më pas mbushet me tregues të aktivitetet e ndërmarrjes (çmimet, shitjet, plani, fitimet, humbjet, etj etj.). Kjo mbushje mund të kryhet si me të dhëna reale të sistemeve operacionale ashtu edhe të parashikohet në bazë të të dhënave historike. Dimensionet e hiperkubit mund të jenë komplekse, hierarkike dhe mund të krijohen marrëdhënie mes tyre. Në procesin e analizës, përdoruesi mund të ndryshojë këndvështrimin mbi të dhënat (i ashtuquajturi operacioni i ndryshimit të pamjes logjike), duke parë kështu të dhënat në seksione të ndryshme dhe duke zgjidhur probleme specifike. Operacione të ndryshme mund të kryhen në kube, përfshirë parashikimin dhe planifikimin me kusht (çfarë-nëse analiza). Për më tepër, operacionet kryhen menjëherë në kube, d.m.th. një produkt, për shembull, do të rezultojë në një produkt hiperkub, secila qelizë e të cilit është produkt i qelizave të hiperkubave të shumëzuesit përkatës. Natyrisht, është e mundur të kryhen operacione në hiperkubë me numër të ndryshëm të dimensioneve.

3. Historia e krijimit të teknologjisë OLAP

Ideja e përpunimit të të dhënave në vargjet shumëdimensionale nuk është e re. Ajo në fakt daton në vitin 1962, kur Ken Iverson botoi librin e tij A Language Programming (APL). Zbatimi i parë praktik i APL u bë në fund të viteve gjashtëdhjetë nga IBM. APL është një gjuhë shumë elegante, e përcaktuar matematikisht me ndryshore shumëdimensionale dhe operacione të përpunueshme. Ai ishte menduar të ishte mjeti origjinal i fuqishëm transformues shumëdimensional në krahasim me gjuhët e tjera praktike të programimit.

Sidoqoftë, ideja nuk mori përdorim të gjerë për një kohë të gjatë, pasi ende nuk kishte ardhur koha për ndërfaqe grafike, pajisje printimi me cilësi të lartë dhe shfaqja e karaktereve greke kërkonte ekrane të veçanta, tastiera dhe pajisje printimi. Më vonë, fjalët angleze u përdorën ndonjëherë për të zëvendësuar operatorët grekë, por aktivistët e pastërtisë të APL penguan përpjekjet për të popullarizuar gjuhën e tyre të preferuar. APL gjithashtu konsumoi burimet e makinerisë. Përdorimi i tij ishte i shtrenjtë në ato ditë. Programet ishin shumë të ngadalta për t'u ekzekutuar dhe, për më tepër, vetë kostoja e drejtimit të tyre. U desh shumë kujtesë, në atë kohë vetëm vëllime tronditëse (rreth 6 MB).

Sidoqoftë, zhgënjimi i këtyre gabimeve fillestare nuk e vrau idenë. Ajo u përdor në shumë aplikime biznesi në vitet '70, '80. Shumë nga këto aplikacione kishin veçori të sistemeve moderne të përpunimit analitik. Për shembull, IBM u zhvillua sistemi operativ për APL, të quajtur VSPC, dhe disa njerëz e konsideruan atë mjedisin ideal për përdorim personal derisa spreadsheets u bënë kudo.

Por APL ishte shumë e vështirë për t'u përdorur, veçanërisht pasi çdo herë kishte mospërputhje midis vetë gjuhës dhe pajisjeve në të cilat u bënë përpjekje për ta zbatuar atë.

Në vitet 1980, APL u bë e disponueshme në makinat personale, por nuk gjeti përdorim në treg. Alternativa ishte programimi i aplikacioneve shumëdimensionale duke përdorur vargje në gjuhë të tjera. Kjo ishte një detyrë shumë e vështirë edhe për programuesit profesionistë, gjë që detyroi pritjen për gjeneratën e ardhshme të produkteve softuerike shumëdimensionale.

Në 1972, disa produkte softuerësh shumëdimensionalë të përdorur më parë për qëllime edukative gjetën përdorim komercial: Express. Mbetet në një formë plotësisht të rishkruar edhe tani, por konceptet origjinale të viteve '70 nuk janë më të rëndësishme. Express është një nga teknologjitë më të njohura OLAP në vitet '90 sot, dhe Oracle (r) do ta shtyjë atë përpara dhe do të shtojë veçori të reja.

Më shumë produkte shumëdimensionale u shfaqën në vitet 1980. Në fillim të dekadës - një produkt i quajtur Stratagem, i quajtur më vonë Acumate (sot në pronësi të Kenan Technologies), i cili u promovua akoma deri në fillim të viteve '90, por sot, ndryshe nga Express, praktikisht nuk përdoret.

Comshare System W ishte një produkt shumëdimensional i një stili të ndryshëm. U prezantua në 1981, ishte i pari që ofroi më shumë zhvillim të përdoruesve përfundimtarë dhe aplikacioneve financiare. Ai solli shumë koncepte që nuk ishin përshtatur mirë, të tilla si rregulla krejtësisht jo-procedurale, shikimi në ekran të plotë dhe redaktimi i të dhënave shumëdimensionale, rillogaritja automatike dhe integrimi në grup me të dhënat relacionale. Sidoqoftë, Comshare System W ishte mjaft i rëndë për pajisjet e kohës në krahasim me produktet e tjera dhe u përdor më pak në të ardhmen, u shit më pak dhe nuk bëri përmirësime të produktit. Edhe pse është ende në dispozicion në UNIX sot, nuk është server-klient, gjë që nuk e rrit ofertën e tij në tregun analitik. Në fund të viteve 1980, Comshare lëshoi ​​një produkt për DOS dhe më vonë për Windows. Këto produkte u quajtën Komandant Prizmi dhe përdorën të njëjtat koncepte si Sistemi W.

Një produkt tjetër krijues i fundit të viteve 80 u quajt Metafora. Ai kishte për qëllim tregtarët profesionistë. Ai gjithashtu propozoi shumë koncepte të reja që sapo kanë filluar të përdoren gjerësisht sot: llogaritja klient-server, përdorimi i një modeli shumëdimensional në të dhënat relacionale, zhvillimi i aplikacioneve të orientuara nga objekti. Sidoqoftë, pajisjet standarde të makinerive personale të atyre ditëve nuk ishin në gjendje të punonin me Metaphor dhe shitësit u detyruan të zhvillojnë standardet e tyre për makinat dhe rrjetet personale. Gradualisht Metafora filloi të punojë me sukses në makina personale serike, por produkti u bë ekskluzivisht për OS / 2 dhe kishte ndërfaqen e tij grafike të përdoruesit.

Metafora më pas hyri në një aleancë marketingu me IBM, e cila më pas u fitua. Në mesin e vitit 1994, IBM vendosi të integrojë teknologjinë Metaphor (u riemërua DIS) me teknologjitë e saj të ardhshme dhe kështu të përfundojë financimin për një drejtim të veçantë, por klientët shprehën pakënaqësinë e tyre dhe kërkuan mbështetje të vazhdueshme për produktin. Mbështetja vazhdoi për klientët e mbetur, dhe IBM ri-lëshoi ​​produktin me një emër të ri DIS, i cili, megjithatë, nuk e bëri atë popullor. Por konceptet krijuese, inovative të Metaforës nuk janë harruar dhe janë të dukshme sot në shumë produkte.

Në mesin e viteve '80, lindi termi EIS (Sistemi Ekzekutiv i Informacionit). Produkti i parë që demonstroi qartë këtë drejtim ishte Qendra e Komandës e Pilotit. Ishte një produkt që lejonte llogaritjen bashkëpunuese, atë që ne e quajmë llogaritja klient-server sot. Për shkak se fuqia e kompjuterëve personal në vitet 1980 ishte e kufizuar, produkti ishte shumë "server-centric", por parimi është ende shumë i popullarizuar sot. Piloti nuk e shiti Qendrën e Komandës për një kohë të gjatë, por ofroi shumë koncepte që mund të mësohen në produktet e sotme OLAP, duke përfshirë kohën automatike, llogaritjen shumëdimensionale të klientit / serverit dhe kontrollin e thjeshtuar të procesit të analizës (miu, ekrane të ndjeshëm, etj.). Disa nga këto koncepte u riaplikuan më vonë në Serverin e Analizës Pilot.

Në fund të viteve 1980, spreadsheets ishin mjeti dominues në treg për të siguruar analiza për përdoruesit përfundimtarë. Tabela e parë shumëdimensionale u prezantua nga Compete. Ai u tregtua si një produkt shumë i shtrenjtë për specialistët, por shitësit nuk ofruan një mundësi për kapjen e tregut për këtë produkt, dhe Computer Associates fitoi të drejtat për të së bashku me produktet e tjera, përfshirë Supercalc dhe 20/20. Efekti kryesor i blerjes së CA Compete ishte një ulje e mprehtë e çmimit dhe heqja e mbrojtjes nga kopja, e cila natyrisht kontribuoi në përhapjen e saj. Megjithatë, nuk pati sukses. Konkurrenca është në zemër të Supercalc 5, por aspekti i tij shumëdimensional nuk po promovohet. Konkurrenti i vjetër ende përdoret ndonjëherë për faktin se u investuan shumë para në të në të njëjtën kohë.

Lotus ishte tjetër që u përpoq të hynte në tregun shumëdimensional të tabelave me Improv, i cili funksionon në një makinë NeXT. Kjo siguroi, të paktën, që shitjet prej 1-2-3 të mos binin, por kur u lëshua përfundimisht për Windows, Excel tashmë kishte një pjesë të madhe të tregut, gjë që e pengoi Lotus të bënte ndonjë ndryshim në shpërndarjen e tregut. Lotus, si CA me Compete, e zhvendosi Improv në fundin e poshtëm të tregut, por kjo nuk ishte një parakusht për avancimin e suksesshëm të tregut, dhe zhvillimet e reja në këtë fushë nuk vazhduan. Doli se përdoruesit e kompjuterit personal preferonin 1-2-3 spreadsheets dhe nuk ishin të interesuar për aftësitë e reja shumëdimensionale nëse nuk ishin plotësisht në përputhje me spreadsheets e tyre të vjetër. Po kështu, konceptet e tabelave të vogla desktop, të ofruara si aplikacione personale, nuk kanë vërtetuar se janë të përshtatshme dhe nuk kanë zënë rrënjë në botën e vërtetë të biznesit. Microsoft (r) ka marrë këtë rrugë, duke shtuar PivotTables (në botimin rus quhet "tabela strumbullar") në Excel. Ndërsa disa përdorues të Excel kanë përfituar nga kjo veçori, është ndoshta i vetmi fakt që aftësitë e analizës shumëdimensionale përdoren gjerësisht në botë, thjesht sepse ka kaq shumë përdorues të Excel në botë.

4. OLAP, ROLAP, MOLAP ...

Dihet mirë se kur Codd publikoi rregullat e tij për ndërtimin e DBMS -ve relacionale në 1985, ato shkaktuan një reagim të fortë dhe më pas patën një ndikim të fortë në industrinë e DBMS në përgjithësi. Sidoqoftë, pak njerëz e dinë që në vitin 1993 Codd botoi një vepër të titulluar "OLAP për Analistët e Përdoruesve: Çfarë Duhet të jetë". Në të, ai përvijoi konceptet bazë të përpunimit analitik online dhe identifikoi 12 rregulla që duhet të përmbushen nga produktet që mundësojnë përpunimin analitik online.

Këto janë rregullat (teksti origjinal ruhet aty ku është e mundur):

1. Përfaqësimi konceptual shumëdimensional. Përdoruesi i analistit e sheh botën e ndërmarrjeve si një natyrë shumëdimensionale. Prandaj, modeli OLAP duhet të jetë shumëdimensional në thelbin e tij. Një skemë konceptuale shumëdimensionale ose një pamje e personalizuar lehtëson modelimin dhe analizën, si dhe llogaritjen.

2. Transparenca. Pavarësisht nëse produkti OLAP është pjesë e fondeve të përdoruesit apo jo, ky fakt duhet të jetë transparent për përdoruesin. Nëse OLAP sigurohet nga llogaritja klient-server, atëherë ky fakt gjithashtu, nëse është e mundur, duhet të jetë i padukshëm për përdoruesit. OLAP duhet të paraqitet në kontekstin e një arkitekture vërtet të hapur, duke lejuar përdoruesin, kudo që të jetë, të komunikojë me serverin duke përdorur një mjet analitik. Përveç kësaj, transparenca duhet të arrihet kur mjeti analitik ndërvepron me mjedise homogjene dhe heterogjene të bazës së të dhënave.

3. Disponueshmëria. Një përdorues i analistit OLAP duhet të jetë në gjendje të kryejë analiza bazuar në një skemë të zakonshme konceptuale që përmban të dhëna në shkallë ndërmarrjeje në një bazë të dhënash relacionale, si dhe të dhëna nga bazat e të dhënave të trashëguara, metodat e aksesit të përbashkët dhe një model të përbashkët analitik. Kjo do të thotë që OLAP duhet të sigurojë logjikën e vet për qasjen në një mjedis heterogjen të bazës së të dhënave dhe të kryejë transformimet e duhura për t'i paraqitur të dhënat përdoruesit. Për më tepër, është e nevojshme të mendoni paraprakisht se ku dhe si dhe cilat lloje të organizimit të të dhënave fizike do të përdoren në të vërtetë. Sistemi OLAP duhet të ketë qasje vetëm në të dhënat që nevojiten në të vërtetë, dhe të mos zbatojë parimin e përgjithshëm të "gypit të kuzhinës" që përfshin të dhëna të panevojshme.

4. Produktivitet konsistent gjatë zhvillimit të raporteve. Nëse numri i dimensioneve ose madhësia e bazës së të dhënave rritet, përdoruesi i analistit nuk duhet të ndiejë ndonjë degradim të rëndësishëm në performancë. Performanca e qëndrueshme është kritike për të mbështetur përdoruesin përfundimtar me lehtësinë e përdorimit dhe për të kufizuar kompleksitetin e OLAP. Nëse analisti përdorues përjeton dallime të rëndësishme në performancë sipas numrit të dimensioneve, atëherë ai do të kërkojë të kompensojë këto dallime me strategjinë e projektimit, e cila do të bëjë që të dhënat të paraqiten në mënyra të tjera nga mënyra se si të dhënat me të vërtetë duhet të paraqiten Me Marrja e kohës për të ecur nëpër sistem për të kompensuar papërshtatshmërinë e tij nuk është ajo që produktet analitike janë krijuar për të bërë.

5. Arkitektura klient-server. Shumica e të dhënave që duhet të përpunohen në internet sot përmbahen në mainframes dhe qasen përmes një PC. Kjo do të thotë, pra, që produktet OLAP duhet të jenë në gjendje të punojnë në një mjedis klient-server. Nga kjo pikëpamje, është e nevojshme që komponenti i serverit të mjetit analitik të jetë thelbësisht "inteligjent" në mënyrë që klientë të ndryshëm të lidhen me serverin me sherr minimal dhe programim integrimi. Një server "inteligjent" duhet të jetë në gjendje të kryejë hartëzimin dhe konsolidimin midis skemave të papërshtatshme logjike dhe fizike të bazës së të dhënave. Kjo do të sigurojë transparencë dhe do të ndërtojë një skemë të përgjithshme konceptuale, logjike dhe fizike.

6. Shumëdimensionaliteti i përgjithshëm. Çdo dimension duhet të aplikohet pa marrë parasysh strukturën e tij dhe aftësitë operacionale. Mund të ofrohen aftësi shtesë operacionale për dimensionet e zgjedhura, dhe meqenëse dimensionet janë simetrike, një funksion i vetëm mund t'i sigurohet çdo dimensioni. Strukturat bazë të të dhënave, formulat dhe formatet e raportit nuk duhet të jenë të njëanshëm ndaj asnjë dimensioni.

7. Menaxhimi dinamik i matricave të rralla. Paraqitja fizike e një mjeti OLAP duhet të përshtatet plotësisht me modelin specifik analitik për menaxhimin optimal të matricave të rralla. Për çdo matricë të dhënë të rrallë, ekziston një dhe vetëm një skemë optimale fizike. Kjo skemë siguron efikasitetin maksimal të kujtesës dhe funksionimin e matricës, nëse, natyrisht, i gjithë grupi i të dhënave nuk përshtatet në kujtesë. Fizika themelore e një mjeti OLAP duhet të konfigurohet në çdo nënbashkësi dimensionesh, në çdo rend, për operacione praktike me modele të mëdha analitike. Aksesorët fizikë gjithashtu duhet të ndryshojnë në mënyrë dinamike dhe të përmbajnë lloje të ndryshme mekanizmash, siç janë: llogaritja direkte, pemët B dhe derivatet, hash, aftësia për të kombinuar këto mekanizma nëse është e nevojshme. Rrallësia (e matur si përqindja e qelizave boshe në të gjitha të mundshme) është një nga karakteristikat e shpërndarjes së të dhënave. Pamundësia për të rregulluar rrallësinë mund ta bëjë efikasitetin e operacioneve të paarritshëm. Nëse mjeti OLAP nuk mund të kontrollojë dhe rregullojë shpërndarjen e vlerave të të dhënave të analizuara, një model që pretendon të jetë praktik, i bazuar në shumë rrugë dhe dimensione konsolidimi, në realitet, mund të jetë i panevojshëm dhe i pashpresë.

8. Mbështetje për shumë përdorues. Shpesh, përdorues të shumtë analitikë duhet të punojnë së bashku me të njëjtin model analitik ose të krijojnë modele të ndryshme nga të njëjtat të dhëna. Prandaj, mjeti OLAP duhet të sigurojë ndarjen (pyetjen dhe plotësimin), integritetin dhe aftësitë e sigurisë.

9. Krosove pa kufi. Nivelet e ndryshme të grumbullimit dhe shtigjet e konsolidimit, për shkak të natyrës së tyre hierarkike, përfaqësojnë marrëdhënie të varura në një model ose aplikim OLAP. Prandaj, mjeti në vetvete duhet të nënkuptojë llogaritjet e duhura dhe të mos kërkojë nga përdoruesi i analistit të ripërkufizojë ato llogaritje dhe operacione. Llogaritjet që nuk vijnë nga këto marrëdhënie të trashëguara kërkojnë që formula të ndryshme të përcaktohen sipas disa gjuhëve të zbatueshme. Një gjuhë e tillë mund të lejojë llogaritjen dhe manipulimin e të dhënave të çdo dimensioni dhe të mos kufizojë marrëdhënien midis qelizave të të dhënave, të mos i kushtojë vëmendje numrit të atributeve të zakonshme të të dhënave të qelizave të veçanta.

10. Manipulimi intuitiv i të dhënave. Riorientimi i shtigjeve të konsolidimit, detajimi, zgjerimi dhe manipulimet e tjera të rregulluara nga rrugët e konsolidimit duhet të aplikohen përmes një ndikimi të veçantë në qelizat e modelit analitik, dhe gjithashtu nuk duhet të kërkojë përdorimin e një sistemi menuje ose veprime të tjera të shumta me ndërfaqja e përdoruesit... Perspektiva e përdoruesit të analistit mbi dimensionet e përcaktuara në modelin analitik duhet të përmbajë të gjithë informacionin e nevojshëm për të kryer veprimet e mësipërme.

11. Opsionet fleksibile të raportimit. Analizimi dhe paraqitja e të dhënave është e thjeshtë kur rreshtat, kolonat dhe qelizat e të dhënave që do të krahasohen vizualisht me njëra -tjetrën do të jenë pranë njëra -tjetrës ose sipas ndonjë funksioni logjik që zhvillohet në ndërmarrje. Mjetet e raportimit duhet të paraqesin të dhëna të sintetizuara ose informacione që rezultojnë nga modeli i të dhënave në çdo orientim të mundshëm. Kjo do të thotë që rreshtat, kolonat ose faqet duhet të tregojnë nga 0 në N dimensione në të njëjtën kohë, ku N është numri i dimensioneve në të gjithë modelin analitik. Për më tepër, çdo dimension i përmbajtjes i treguar në një regjistrim, kolonë ose faqe të vetme duhet të jetë gjithashtu i aftë të tregojë çdo nënbashkësi të elementeve (vlerave) që përmbahen në dimension, në çfarëdo rendi.

12. Dimensioni dhe numri i pakufizuar i niveleve të grumbullimit. Hulumtimi në numrin e mundshëm të matjeve të kërkuara të kërkuara në një model analitik ka treguar se deri në 19 matje mund të përdoren njëkohësisht. Prandaj rekomandimi i fortë që mjeti analitik të jetë në gjendje të sigurojë të paktën 15 dimensione njëkohësisht dhe mundësisht 20. Për më tepër, secili nga dimensionet e përgjithshme nuk duhet të kufizohet nga numri i niveleve të grumbullimit të përcaktuara nga përdoruesi analitik dhe shtigjeve të konsolidimit.

Në fakt, zhvilluesit e produkteve OLAP sot ndjekin këto rregulla, ose të paktën përpiqen t'i ndjekin ato. Këto rregulla mund të konsiderohen baza teorike e përpunimit analitik operacional, është e vështirë të argumentosh me to. Më pas, shumë pasoja rrjedhin nga 12 rregullat, të cilat, megjithatë, ne nuk do t'i citojmë, në mënyrë që të mos e komplikojmë historinë pa nevojë.

Le të hedhim një vështrim më të afërt se si produktet OLAP ndryshojnë në zbatimin e tyre fizik.

Siç u përmend më lart, OLAP bazohet në idenë e përpunimit të të dhënave në strukturat shumëdimensionale. Kur themi OLAP, nënkuptojmë që struktura e të dhënave të një produkti analitik është logjikisht shumëdimensionale. Se si zbatohet saktësisht kjo është një çështje tjetër. Ekzistojnë dy lloje kryesore të përpunimit analitik, të cilat përfshijnë produkte të caktuara.

MOLAP ... Vetë OLAP shumëdimensional. Produkti bazohet në një strukturë të të dhënave jo-relacionale që siguron ruajtje, përpunim dhe prezantim shumëdimensional të të dhënave. Prandaj, bazat e të dhënave quhen shumëdimensionale. Produktet që i përkasin kësaj klase zakonisht kanë një server bazash të të dhënave shumëdimensionale. Të dhënat në procesin e analizës zgjidhen ekskluzivisht nga një strukturë shumëdimensionale. Kjo strukturë është shumë efikase.

ROLAP ... OLAP Relacional. Siç nënkupton edhe emri, struktura shumëdimensionale në mjete të tilla zbatohet nga tabela relacionale. Dhe të dhënat në procesin e analizës, përkatësisht, zgjidhen nga baza e të dhënave relacionale nga mjeti analitik.

Disavantazhet dhe përparësitë e secilës qasje janë, në përgjithësi, të dukshme. OLAP shumëdimensional siguron performancë më të mirë, por strukturat nuk mund të përdoren për të përpunuar sasi të mëdha të të dhënave, pasi dimensionet e mëdha do të kërkojnë burime të mëdha harduerike, dhe në të njëjtën kohë, rrallësia e hiperkubave mund të jetë shumë e lartë dhe, prandaj, përdorimi i kapacitetit të harduerit nuk do të justifikohet. Përkundrazi, OLAP relacional siguron përpunim në grupe të mëdha të të dhënave të ruajtura, pasi është e mundur të sigurohet ruajtje më ekonomike, por, në të njëjtën kohë, humbet ndjeshëm në shpejtësinë e punës shumëdimensionale. Arsyetimi i tillë çoi në identifikimin e një klase të re të mjeteve analitike - HOLAP. Ky është përpunim hibrid analitik në internet. Mjetet e kësaj klase ju lejojnë të kombinoni të dy qasjet - relacionale dhe shumëdimensionale. Qasja mund të bëhet si në të dhënat e bazës së të dhënave shumëdimensionale ashtu edhe në të dhënat relacionale.

Ekziston një lloj tjetër mjaft ekzotik i përpunimit analitik on -line - DOLAP. Ky është desktop OLAP. Ne po flasim për një përpunim të tillë analitik, ku hiperkubet janë të vegjël, dimensioni i tyre është i vogël, nevojat janë modeste, dhe për një përpunim të tillë analitik mjafton një makinë personale në desktop.

Përpunimi analitik operacional ju lejon të thjeshtoni dhe shpejtoni ndjeshëm procesin e përgatitjes dhe vendimmarrjes nga personeli menaxhues. Përpunimi analitik online i shërben qëllimit të shndërrimit të të dhënave në informacion. Ai ndryshon rrënjësisht nga procesi tradicional i mbështetjes së vendimeve, i cili më së shpeshti bazohet në shqyrtimin e raporteve të strukturuara. Për analogji, ndryshimi midis raporteve të strukturuara dhe OLAP është i njëjtë me atë midis ngasjes nëpër qytet me tramvaj dhe me makinë. Kur hipni në një tramvaj, ai lëviz përgjatë shinave, gjë që nuk ju lejon të shihni ndërtesa shumë të largëta, dhe aq më tepër për t'u afruar me to. Përkundrazi, ngasja e një makine private ju jep liri të plotë të lëvizjes (natyrisht, rregullat e trafikut duhet të respektohen). Mund të vozisni deri në çdo ndërtesë dhe të arrini në vendet ku tramvajet nuk funksionojnë.

Raportet e strukturuara janë shinat që pengojnë lirinë për të përgatitur vendime. OLAP është një mjet për trafik efikas në autostradat e informacionit.

magazina të të dhënave janë formuar në bazë të fotografive të bazave të të dhënave të funksionimit sistemi i informacionit dhe ndoshta burime të ndryshme të jashtme. Magazinat e të dhënave përdorin teknologjitë e bazës së të dhënave, OLAP, analizën e thellë të të dhënave, vizualizimin e të dhënave.

Karakteristikat kryesore të magazinave të të dhënave.

  • përmban të dhëna historike;
  • ruan informacion të detajuar, si dhe të dhëna të grumbulluara pjesërisht dhe plotësisht;
  • të dhënat janë kryesisht statike;
  • mënyrë ad-hoc, e pastrukturuar dhe heuristike e përpunimit të të dhënave;
  • intensitet i mesëm dhe i ulët i përpunimit të transaksioneve;
  • mënyra e paparashikueshme e përdorimit të të dhënave;
  • të destinuara për analiza;
  • i fokusuar ne fushat lëndore;
  • mbështetje për vendimmarrjen strategjike;
  • i shërben një numri relativisht të vogël drejtuesish.

Termi OLAP (Përpunimi Analitik On-Line) përdoret për të përshkruar modelin e paraqitjes së të dhënave dhe, në përputhje me rrethanat, teknologjinë për përpunimin e tyre në depot e të dhënave. OLAP përdor një pamje shumëdimensionale të të dhënave të grumbulluara për të siguruar qasje të shpejtë në aspektin strategjik informacion i rendesishem për analizë të thelluar. Aplikacionet OLAP duhet të kenë këto veti themelore:

  • shumëdimensionale prezantimi i të dhënave;
  • mbështetje për llogaritjet komplekse;
  • marrja në konsideratë e faktorit të kohës.

Përparësitë e OLAP:

  • Rritja produktiviteti personeli i prodhimit, zhvilluesit programet e aplikimit... Qasje në kohë në informacionin strategjik.
  • duke u siguruar përdoruesve mundësi të bollshme për të bërë ndryshimet e tyre në skemë.
  • Aplikimet OLAP mbështeten në magazina të të dhënave dhe sistemet OLTP, duke marrë të dhëna të përditësuara prej tyre, gjë që lejon kursimin kontrolli i integritetit të dhënat e korporatës.
  • zvogëlimin e ngarkesës në sistemet OLTP dhe magazina të të dhënave.

OLAP dhe OLTP. Karakteristikat dhe dallimet kryesore

OLAP OLTP
Ruajtja e të dhënave duhet të përfshijë të dhëna të brendshme të korporatës dhe të dhëna të jashtme burimi kryesor i informacionit që hyn në bazën e të dhënave operative janë aktivitetet e korporatës, dhe për analizën e të dhënave kërkohet të përfshijë burime të jashtme të informacionit (për shembull, raporte statistikore)
Vëllimi i bazave të të dhënave analitike është të paktën një rend i madhësisë më i madh se vëllimi i atyre operative. për analiza dhe parashikime të besueshme në dyqani i të dhënave ju duhet të keni informacion në lidhje me aktivitetet e korporatës dhe gjendjen e tregut për disa vjet Për përpunimin operacional, kërkohen të dhëna për muajt e fundit
Ruajtja e të dhënave duhet të përmbajë informacion të paraqitur dhe dakorduar në mënyrë uniforme që përputhet më së miri me përmbajtjen e bazave të të dhënave operative. Një komponent nevojitet për të nxjerrë dhe "pastruar" informacionin nga burime të ndryshme. Shumë korporata të mëdha kanë njëkohësisht disa IS operacionale me bazat e tyre të të dhënave (për arsye historike). Baza e të dhënave operacionale mund të përmbajë informacion semantikisht të barabartë të paraqitur në formate të ndryshme, me tregues të ndryshëm të kohës së mbërritjes së tij, ndonjëherë edhe kontradiktore
Grupi i pyetjeve kundër një baze të dhënash analitike është i pamundur të parashikohet. magazina të të dhënave ekzistojnë për t'iu përgjigjur kërkesave të analistëve ad hoc. Mund të mbështeteni vetëm në faktin se kërkesat nuk do të vijnë shumë shpesh dhe do të përfshijnë sasi të mëdha informacioni. Madhësia e bazës së të dhënave analitike stimulon përdorimin e pyetjeve me agregate (shuma, minimumi, maksimumi, do të thotë etj) Sistemet e përpunimit të të dhënave janë krijuar me qëllim të zgjidhjes së problemeve specifike. Informacioni nga baza e të dhënave zgjidhet shpesh dhe në pjesë të vogla. Zakonisht, grupi i pyetjeve në bazën e të dhënave operative është i njohur tashmë gjatë hartimit.
Me ndryshueshmëri të ulët të bazave të të dhënave analitike (vetëm kur ngarkoni të dhëna), renditja e vargjeve, metodat e indeksimit më të shpejtë për marrjen e mostrave në masë, ruajtja e të dhënave të para-grumbulluara rezulton të jetë e arsyeshme. Sistemet e përpunimit të të dhënave janë nga natyra e tyre shumë e paqëndrueshme, e cila merret parasysh në DBMS të përdorur (struktura e normalizuar e bazës së të dhënave, rreshtat ruhen në mënyrë të parregulluar, pemët B për indeksimin, transaksionale)
Informacioni analitik i bazës së të dhënave është aq kritik për një korporatë saqë kërkohet një grimcë e madhe e mbrojtjes (të drejtat individuale të aksesit në rreshta dhe / ose kolona të caktuara të tabelës) Për sistemet e përpunimit të të dhënave, zakonisht mjafton mbrojtjen e informacionit në nivelin e tryezës

Rregullat e kodit për sistemet OLAP

Në vitin 1993, Codd publikoi një vepër të titulluar OLAP për përdoruesit analitikë: Mënyra se si duhet të jetë. Në të, ai përvijoi konceptet bazë të përpunimit analitik online dhe identifikoi 12 rregulla që duhet të përmbushen nga produktet që mundësojnë përpunimin analitik online.

  1. Pamje konceptuale shumëdimensionale. Modeli OLAP duhet të jetë shumëdimensional në thelbin e tij. Një skemë konceptuale shumëdimensionale ose një pamje e personalizuar lehtëson modelimin dhe analizën, si dhe llogaritjen.
  2. Transparenca. Përdoruesi është në gjendje të marrë të gjitha të dhënat e nevojshme nga makina OLAP, pa e ditur as nga vjen. Pavarësisht nëse produkti OLAP është pjesë e mjeteve të përdoruesit apo jo, ky fakt duhet të jetë i padukshëm për përdoruesin. Nëse OLAP sigurohet nga llogaritjet nga ana e klientit-server, atëherë ky fakt gjithashtu, nëse është e mundur, duhet të jetë i padukshëm për përdoruesit. OLAP duhet të paraqitet në kontekstin e një arkitekture vërtet të hapur, duke lejuar përdoruesin, kudo që të jetë, të komunikojë me serverin duke përdorur një mjet analitik. Përveç kësaj, transparenca duhet të arrihet edhe kur mjeti analitik ndërvepron me mjedise homogjene dhe heterogjene të bazës së të dhënave.
  3. Disponueshmëria. OLAP duhet të sigurojë të vetin diagram logjik për qasje në një mjedis heterogjen të bazës së të dhënave dhe kryerjen e transformimeve të përshtatshme për të siguruar të dhëna për përdoruesit. Për më tepër, është e nevojshme të mendoni paraprakisht se ku dhe si dhe cilat lloje të organizimit të të dhënave fizike do të përdoren në të vërtetë. Një sistem OLAP duhet të ketë qasje vetëm në të dhënat që nevojiten në të vërtetë, dhe të mos zbatojë parimin e përgjithshëm të "gypit të kuzhinës", i cili përfshin hyrje të panevojshme.
  4. Konstante performanca gjatë zhvillimit të raporteve. Performanca raportimi nuk duhet të bjerë ndjeshëm me rritjen e numrit të dimensioneve dhe madhësisë së bazës së të dhënave.
  5. Arkitektura klient-server. Produkti kërkohet të jetë jo vetëm klient / server, por edhe që komponenti i serverit është mjaft i zgjuar në mënyrë që klientë të ndryshëm të mund të lidhen me një minimum përpjekjesh dhe programimi.
  6. Shumëdimensionaliteti i përgjithshëm. Të gjitha dimensionet duhet të jenë të barabarta, secili dimension duhet të jetë ekuivalent si në strukturë ashtu edhe në aftësitë operacionale. Vërtetë, lejohen mundësi shtesë operacionale për dimensionet individuale (me sa duket, koha nënkuptohet), por funksione të tilla shtesë duhet t'i sigurohen çdo dimensioni. Nuk duhet të jetë aq themelore strukturat e të dhënave, formatet llogaritëse ose raportuese ishin më specifike për çdo dimension.
  7. Kontroll dinamik matrica të rralla... Sistemet OLAP duhet të rregullojnë automatikisht skemën e tyre fizike bazuar në llojin e modelit, vëllimet e të dhënave dhe rrallësinë e bazës së të dhënave.
  8. Mbështetje për shumë lojtarë. Mjeti OLAP duhet të ofrojë aftësi ndarjen(kërkesa dhe shtesa), integriteti dhe siguria.
  9. Krosverë të pakufizuar. Të gjitha llojet e operacioneve duhet të lejohen për çdo matje.
  10. Manipulimi intuitiv i të dhënave. Manipulimi i të dhënave u krye përmes veprimeve të drejtpërdrejta në qeliza në modalitetin e shikimit pa përdorur menutë dhe operacione të shumta.
  11. Opsionet fleksibile të raportimit. Matjet duhet të vendosen në raport sipas nevojës së përdoruesit.
  12. E pakufizuar

4. Klasifikimi i produkteve OLAP.

5. Parimet e punës së klientëve OLAP.

7. Sferat e aplikimit të teknologjive OLAP.

8. Një shembull i përdorimit të teknologjive OLAP për analiza në fushën e shitjeve.

1. Vendi i OLAP në strukturën e informacionit të ndërmarrjes.

Termi "OLAP" është i lidhur pazgjidhshmërisht me termin "depo e të dhënave".

Të dhënat në magazinë vijnë nga sistemet operacionale (sistemet OLTP), të cilat janë krijuar për të automatizuar proceset e biznesit. Përveç kësaj, magazina mund të plotësohet me burime të jashtme, siç janë raportet statistikore.

Qëllimi i depove është të sigurojë "lëndën e parë" për analiza në një vend dhe në një strukturë të thjeshtë, të kuptueshme.

Ekziston një arsye tjetër që justifikon shfaqjen e një depoje të veçantë - pyetjet komplekse analitike për informacionin operacional ngadalësojnë punën aktuale të kompanisë, për një kohë të gjatë duke bllokuar tabelat dhe duke kapur burimet e serverit.

Ruajtja nuk do të thotë domosdoshmërisht një grumbullim gjigant i të dhënave - gjëja kryesore është se është i përshtatshëm për analiza.

Centralizimi dhe strukturimi i përshtatshëm nuk janë gjithçka që i nevojitet një analisti. Ai ende ka nevojë për një mjet për të parë dhe vizualizuar informacionin. Raporteve tradicionale, madje të ndërtuara në bazë të një depoje të vetme, u mungon një gjë - fleksibiliteti. Ato nuk mund të rrotullohen, zgjerohen ose shemben për të marrë pamjen e dëshiruar të të dhënave. Uroj që ai të kishte një mjet të tillë që do të lejonte zgjerimin dhe shembjen e të dhënave thjesht dhe me lehtësi! OLAP vepron si një mjet i tillë.

Edhe pse OLAP nuk është një atribut i domosdoshëm i një depoje të të dhënave, ai gjithnjë e më shumë po përdoret për të analizuar informacionin e grumbulluar në këtë magazinë.

Vendi i OLAP në strukturën e informacionit të ndërmarrjes (Fig. 1).

Figura 1... Nje vendOLAP në strukturën e informacionit të ndërmarrjes

Të dhënat operacionale mblidhen nga burime të ndryshme, pastrohen, integrohen dhe ruhen në një depo relacionale. Për më tepër, ato janë tashmë në dispozicion për analiza duke përdorur mjete të ndryshme raportet e ndërtimit. Pastaj të dhënat (tërësisht ose pjesërisht) përgatiten për analizën OLAP. Ato mund të ngarkohen në një bazë të dhënash të veçantë OLAP ose të lihen në një ruajtje relacionale. Elementi më i rëndësishëm i tij janë meta të dhëna, domethënë informacione në lidhje me strukturën, vendosjen dhe transformimin e të dhënave. Falë tyre, sigurohet ndërveprim efikas i përbërësve të ndryshëm të ruajtjes.

Si përmbledhje, OLAP mund të përkufizohet si një koleksion i mjeteve shumëdimensionale të analizës së të dhënave të grumbulluara në magazinë.

2. Përpunimi operativ i të dhënave analitike.

Koncepti OLAP bazohet në parimin e prezantimit të të dhënave shumëdimensionale. Në vitin 1993, EF Codd adresoi të metat e modelit relacional, kryesisht duke vënë në dukje pamundësinë e "kombinimit, shikimit dhe analizimit të të dhënave nga një perspektivë shumëdimensionale, domethënë, në mënyrën më të kuptueshme për analistët e korporatave", dhe identifikoi kërkesat e përgjithshme për Sistemet OLAP që zgjerojnë funksionalitetin DBMS relacionale dhe përfshijnë analizën me shumë ndryshore si një nga karakteristikat e tij.

Sipas Codd, një pamje konceptuale shumë-dimensionale është një perspektivë e shumëfishtë e përbërë nga disa dimensione të pavarura përgjatë të cilave grupe të veçanta të të dhënave mund të analizohen.

Analiza e njëkohshme në dimensione të shumta përcaktohet si analiza me shumë ndryshore. Çdo dimension përfshin drejtimet e konsolidimit të të dhënave, të përbërë nga një seri nivelesh të njëpasnjëshme të grumbullimit, ku secili nivel më i lartë i përgjigjet një shkalle më të madhe të grumbullimit të të dhënave për dimensionin përkatës.

Kështu, dimensioni i Kontraktuesit mund të përcaktohet nga drejtimi i konsolidimit, i cili përbëhet nga nivelet e përgjithësimit "ndërmarrje - departament - departament - punonjës". Dimensioni Koha madje mund të përfshijë dy drejtime konsolidimi - vit - tremujor - muaj - ditë dhe javë - ditë, sepse numërimi i kohës sipas muajit dhe javës është i papajtueshëm. Në këtë rast, bëhet e mundur që në mënyrë arbitrare të zgjidhni nivelin e dëshiruar të detajeve të informacionit për secilën nga matjet.

Operacioni i shpimit korrespondon me lëvizjen nga fazat më të larta të konsolidimit në ato më të ulëta; përkundrazi, një operacion rrotullimi nënkupton kalimin nga nivelet më të ulëta në nivelet më të larta (Fig. 2).


Figura 2Matjet dhe drejtimet e konsolidimit të të dhënave

3. Kërkesat për mjete për përpunim analitik on-line.

Qasja shumëdimensionale u shfaq pothuajse njëkohësisht dhe paralelisht me qasjen relacionale. Sidoqoftë, vetëm që nga mesi i viteve nëntëdhjetë, ose më saktë që nga ajo kohë
1993, interes për MSUBD filloi të marrë një karakter të përgjithshëm. Ishte në këtë vit që u shfaq një artikull i ri i programit nga një prej themeluesve të qasjes relacionale E. Codda, në të cilën ai formuloi 12 kërkesa themelore për mjetet e zbatimit OLAP(Tabela 1).

Tabela 1.

Paraqitja e të dhënave shumëdimensionale

Mjetet duhet të mbështesin një pamje konceptuale shumëdimensionale të të dhënave.

Transparenca

Përdoruesi nuk duhet të jetë i vetëdijshëm se cilat mjete specifike përdoren për të ruajtur dhe përpunuar të dhënat, si organizohen të dhënat dhe nga vijnë.

Disponueshmëria

I takon mediave të zgjedhin dhe të komunikojnë me më të mirët për të formësuar përgjigjen kjo kërkesë Burim i të dhënave. Mjetet duhet të jenë në gjendje të hartojnë automatikisht logjikën e tyre në burime të ndryshme heterogjene të të dhënave.

Performancë e qëndrueshme

Performanca duhet të jetë praktikisht e pavarur nga numri i Dimensioneve në një kërkesë.

Mbështetje për arkitekturën klient-server

Mjetet duhet të punojnë në një arkitekturë klient-server.

Barazia e të gjitha matjeve

Asnjëra nga matjet nuk duhet të jetë bazë, të gjitha duhet të jenë të barabarta (simetrike).

Përpunimi dinamik i matricave të rralla

Vlerat e pacaktuara duhet të ruhen dhe trajtohen në mënyrën më efikase.

Mbështetje për mënyrën e përdorimit të shumë përdoruesve me të dhëna

Mjetet duhet të ofrojnë aftësinë për të punuar për më shumë se një përdorues.

Mbështetje për operacionet e bazuara matje të ndryshme

Të gjitha operacionet shumëdimensionale (p.sh. Grumbullimi) duhet të zbatohen në mënyrë të njëtrajtshme dhe të qëndrueshme në çdo numër të çdo dimensioni.

Lehtësia e manipulimit të të dhënave

Mjetet duhet të kenë ndërfaqen e përdoruesit më të përshtatshme, natyrale dhe të rehatshme.

Mjete të avancuara të prezantimit

Mjetet duhet të mbështesin mënyra të ndryshme të vizualizimit (paraqitjes) së të dhënave.

Numri i pakufizuar i dimensioneve dhe niveleve të grumbullimit të të dhënave

Nuk duhet të ketë kufi në numrin e dimensioneve të mbështetura.

Rregullat për vlerësimin e produkteve softuerike të klasës OLAP

Grupi i këtyre kërkesave, i cili shërbeu si përkufizim de facto i OLAP, duhet të konsiderohet si një udhëzues, dhe produktet specifike duhet të gjykohen mbi shkallën e afërsisë me pajtueshmërinë e përsosur me të gjitha kërkesat.

Më vonë, përkufizimi i Codd u rishikua në të ashtuquajturin test FASMI, i cili kërkon një aplikim OLAP për të siguruar aftësinë për të analizuar shpejt informacionin e ndarë shumëdimensional.

Kujtimi i 12 Rregullave të Codd është shumë i rëndë për shumicën e njerëzve. Doli se ju mund të përmblidhni përkufizimin OLAP me vetëm pesë fjalë kyçe: Analiza e shpejtë e informacionit të përbashkët shumëdimensional - ose, shkurtimisht - FASMI (përkthyer nga anglishtja:F ast A naliza e S hared M ultidimensionale Une nformacion).

Ky përkufizim u formulua për herë të parë në fillim të 1995 dhe nuk ka nevojë për rishikim që atëherë.

SHPEJT ( Shpejt) - do të thotë që sistemi duhet të jetë në gjendje t'u japë shumicën e përgjigjeve përdoruesve brenda afërsisht pesë sekondash. Në të njëjtën kohë, kërkesat më të thjeshta përpunohen brenda një sekonde dhe shumë pak - më shumë se 20 sekonda. Hulumtimet kanë treguar se përdoruesit përfundimtarë e perceptojnë procesin si të pasuksesshëm nëse nuk merren rezultate pas 30 sekondash.

Në shikim të parë, mund të duket e habitshme që kur merrni një raport në një minutë, i cili jo shumë kohë më parë zgjati ditë, përdoruesi shumë shpejt mërzitet gjatë pritjes dhe projekti rezulton të jetë shumë më pak i suksesshëm sesa në rastin e një përgjigje të menjëhershme, edhe me koston e analizës më pak të detajuar.

ANALIZA (Analiza)do të thotë që sistemi mund të trajtojë çdo analizë logjike dhe statistikore specifike për një aplikim të caktuar, dhe siguron që të ruhet në një formë të arritshme për përdoruesin përfundimtar.

Nuk ka rëndësi nëse kjo analizë bëhet në kutinë e veglave të një shitësi ose në një produkt të jashtëm softuerik të jashtëm të tillë si një spreadsheet, thjesht duhet të sigurojë të gjithë funksionalitetin e kërkuar të analizës në një mënyrë intuitive për përdoruesit përfundimtarë. Mjetet e analizës mund të përfshijnë procedura të veçanta të tilla si analiza e serive kohore, alokimi i kostos, transferimet e këmbimit valutor, kërkimi i synuar, ndryshimet e strukturës shumëdimensionale, modelimi jo-procedural, zbulimi i përjashtimeve, nxjerrja e të dhënave dhe operacione të tjera të varura nga aplikacioni. Aftësi të tilla ndryshojnë shumë midis produkteve, në varësi të orientimit të synuar.

NDAR do të thotë që sistemi përmbush të gjitha kërkesat për mbrojtjen e konfidencialitetit (ndoshta deri në nivelin e qelizës) dhe, nëse kërkohet qasje e shumëfishtë e shkrimit, siguron bllokimin e modifikimit në nivelin e duhur. Jo të gjitha aplikacionet kanë nevojë të shkruajnë të dhëna. Sidoqoftë, numri i aplikacioneve të tilla po rritet dhe sistemi duhet të jetë në gjendje të trajtojë modifikime të shumta në kohën e duhur, në mënyrë të sigurt.

MULTIDIMENSIONAL - kjo është një kërkesë kryesore. Nëse do të duhej të përkufizonit OLAP me një fjalë, ju do ta zgjidhni atë. Sistemi duhet të sigurojë një pamje konceptuale shumëdimensionale të të dhënave, duke përfshirë mbështetjen e plotë për hierarkitë dhe hierarkitë e shumta, pasi kjo është padyshim mënyra më logjike për të analizuar biznesin dhe organizatat. Nuk ka një numër minimal të dimensioneve që duhen përpunuar sepse është gjithashtu i varur nga aplikacioni, dhe shumica e produkteve OLAP kanë dimensione të mjaftueshme për tregjet që synojnë.

INFORMACION - eshte e gjitha. Informacioni i nevojshëm duhet të merret aty ku është e nevojshme. Sidoqoftë, shumë varet nga aplikimi. Fuqia e produkteve të ndryshme matet në lidhje me sasinë e të dhënave që mund të përpunojnë, por jo sa gigabajt mund të ruajnë. Fuqia e produkteve ndryshon shumë - produktet më të mëdha OLAP mund të trajtojnë të paktën një mijë herë më shumë të dhëna sesa ato më të vogla. Ka shumë faktorë që duhen marrë parasysh në këtë drejtim, duke përfshirë dyfishimin e të dhënave, RAM -in e kërkuar, shfrytëzimin e hapësirës në disk, performancën, integrimin e ruajtjes së të dhënave dhe më shumë.

Testi FASMI është një përkufizim i arsyeshëm dhe i kuptueshëm i qëllimeve që OLAP është i fokusuar në arritjen e tij.

4. KlasifikimiOLAP-produkte.

Pra, thelbi i OLAP konsiston në faktin se informacioni fillestar për analizën paraqitet në formën e një kubi shumëdimensional, dhe sigurohet aftësia për ta manipuluar atë në mënyrë arbitrare dhe për të marrë seksionet e nevojshme të informacionit - raportet. Në të njëjtën kohë, përdoruesi përfundimtar e sheh kubin si një tabelë dinamike shumëdimensionale që përmbledh automatikisht të dhënat (faktet) në seksione të ndryshme (dimensione), dhe lejon kontroll interaktiv të llogaritjeve dhe formës së raportit. Ekzekutimi i këtyre operacioneve është i siguruar OLAP -makinë (ose makinë) Llogaritjet OLAP).

Deri më sot, shumë produkte janë zhvilluar në botë që zbatojnë OLAP -teknologjitë. Për ta bërë më të lehtë lundrimin midis tyre, përdoren klasifikimet OLAP -produkte: sipas mënyrës së ruajtjes së të dhënave për analiza dhe sipas vendndodhjes OLAP -makina Le të hedhim një vështrim më të afërt në secilën kategori Produktet OLAP.

Klasifikimi sipas metodës së ruajtjes

Kubat shumëdimensionalë janë ndërtuar në bazë të të dhënave burimore dhe agregate. Të dhënat e papërpunuara dhe ato agregate për kubet mund të ruhen si në bazat e të dhënave relacionale ashtu edhe në ato shumëdimensionale. Prandaj, aktualisht përdoren tre mënyra për ruajtjen e të dhënave: MOLAP (OLAP shumëdimensional), ROLAP (OLAP Relacional) dhe HOLAP (OLAP hibrid ) Përkatësisht, OLAP -Produktet ndahen në tri kategori të ngjashme sipas ruajtjes së të dhënave:

1. Në rastin e MOLAP , burimet dhe të dhënat e përgjithshme ruhen në një bazë të dhënash shumëdimensionale ose në një kub lokal shumëdimensional.

2. Në ROLAP -produkte, të dhënat burimore ruhen në bazat e të dhënave relacionale ose në tabela të sheshta lokale në një server skedar. Të dhënat e përgjithshme mund të vendosen në tabelat e shërbimit në të njëjtën bazë të dhënash. Shndërrimi i të dhënave nga një bazë të dhënash relacionale në kube shumëdimensionale ndodh sipas kërkesës Mjetet OLAP.

3. Në rast përdorimi HOLAP arkitektura, të dhënat origjinale mbeten në bazën e të dhënave relacionale, dhe agregatët janë të vendosur në atë shumëdimensional. Ndërtimi OLAP -kubi kryhet sipas kërkesës OLAP -Mjetet e bazuara në të dhëna relacionale dhe shumëdimensionale.

Klasifikimi i vendndodhjes OLAP-makina

Mbi këtë bazë OLAP -produktet ndahen në Serverat OLAP dhe klientët OLAP:

Serveri OLAP -mjetet e llogaritjes dhe ruajtjes së të dhënave agregate kryhen me një proces të veçantë - serverin. Aplikacioni i klientit merr vetëm rezultatet e pyetjeve kundër kubeve shumëdimensionale që ruhen në server. Disa OLAP -serverët mbështesin ruajtjen e të dhënave vetëm në bazat e të dhënave relacionale, disa - vetëm në ato shumëdimensionale. Shumë moderne OLAP -serverët mbështesin të tre mënyrat e ruajtjes së të dhënave:MOLAP, ROLAP dhe HOLAP.

MOLAP.

MOLAP është Përpunimi Analitik Shumëdimensional On-Line, domethënë OLAP shumëdimensional.Kjo do të thotë që serveri përdor një bazë të dhënash shumëdimensionale (MDB) për të ruajtur të dhënat. Kuptimi i përdorimit të MDB është i qartë. Mund të ruajë me efikasitet të dhëna që janë të natyrës shumëdimensionale, duke siguruar një mjet për të shërbyer shpejt pyetjet e bazës së të dhënave. Të dhënat transferohen nga një burim i të dhënave në një bazë të dhënash shumëdimensionale, dhe pastaj baza e të dhënave grumbullohet. Para-llogaritja është ajo që i bën pyetjet OLAP më të shpejta, sepse të dhënat përmbledhëse tashmë janë llogaritur. Koha e kërkesës bëhet një funksion vetëm i kohës së kërkuar për të hyrë në një pjesë të caktuar të të dhënave dhe për të kryer një llogaritje. Kjo metodë mbështet konceptin se puna bëhet një herë dhe rezultatet pastaj përdoren pa pushim. Baza e të dhënave shumëdimensionale është një teknologji relativisht e re. Përdorimi i MDB ka të njëjtat disavantazhe si shumica e teknologjive të reja. Gjegjësisht, ato nuk janë aq të qëndrueshme sa bazat e të dhënave relacionale (RDB), dhe ato nuk janë optimizuar në të njëjtën masë. Tjetër dobësi MDB qëndron në pamundësinë e përdorimit të shumicës së bazave të të dhënave shumëdimensionale në procesin e grumbullimit të të dhënave, kështu që kërkon kohë që informacioni i ri të bëhet i disponueshëm për analiza.

ROLAP.

ROLAP është Përpunimi Analitik Relacional On-Line, domethënë OLAP Relacional.Termi ROLAP nënkupton që serveri OLAP bazohet në një bazë të dhënash relacionale. Të dhënat burimore futen në një bazë të dhënash relacionale, zakonisht në skemën e yllit ose flokut të dëborës, për të ndihmuar në zvogëlimin e kohës së marrjes. Serveri ofron një model të të dhënave shumëdimensionale duke përdorur pyetje të optimizuara SQL.

Ekzistojnë një numër arsyesh për të zgjedhur një bazë të dhënash relacionale mbi një bazë të dhënash shumëdimensionale. RDB është një teknologji e vendosur mirë me shumë mundësi për optimizim. Përdorimi i botës reale rezultoi në një produkt më të përpunuar. Përveç kësaj, RDB -të mbështesin sasi më të mëdha të të dhënave sesa MDB -të. Ato janë krijuar vetëm për vëllime të tilla. Argumenti kryesor kundër RDB -ve është kompleksiteti i pyetjeve të kërkuara për të marrë informacion nga një bazë të dhënash e madhe duke përdorur SQL. Një programues i papërvojë SQL mund të ngarkojë lehtësisht burimet e vlefshme të sistemit duke u përpjekur të ekzekutojë një pyetje të ngjashme, e cila është shumë më e lehtë për t'u ekzekutuar në MDB.

Të dhëna të grumbulluara / Para-grumbulluara.

Zbatimi i shpejtë i pyetjeve është i domosdoshëm për OLAP. Ky është një nga parimet themelore të OLAP - aftësia për të manipuluar në mënyrë intuitive të dhënat kërkon marrje të shpejtë të informacionit. Në përgjithësi, sa më shumë llogaritje të duhet për të marrë një pjesë të informacionit, aq më e ngadalshme është përgjigja. Prandaj, për të kursyer një kohë të vogël për zbatimin e pyetjeve, pjesët e informacionit që zakonisht aksesohen më shpesh, por që në të njëjtën kohë kërkojnë llogaritjen, i nënshtrohen grumbullimit paraprak. Kjo do të thotë, ato llogariten dhe më pas ruhen në bazën e të dhënave si të dhëna të reja. Një shembull i një lloji të të dhënave që mund të llogaritet paraprakisht janë të dhënat përmbledhëse - për shembull, shifrat e shitjeve sipas muajit, tremujorit ose vitit - për të cilat të dhënat aktuale të futura janë shifra ditore.

Shitësit e ndryshëm kanë metoda të ndryshme përzgjedhjeje për parametrat që kërkojnë para-grumbullim dhe një numër vlerash të para-llogaritura. Qasja e grumbullimit ndikon si në bazën e të dhënave ashtu edhe në kohën e ekzekutimit të pyetjeve. Nëse llogariten më shumë vlera, gjasat që përdoruesi të kërkojë një vlerë tashmë të llogaritur rritet, dhe për këtë arsye koha e përgjigjes do të jetë më e shkurtër, pasi nuk keni pse të kërkoni vlerën fillestare për llogaritjen. Sidoqoftë, nëse llogaritim të gjitha vlerat e mundshme, kjo nuk është zgjidhja me e mire- në këtë rast, madhësia e bazës së të dhënave rritet ndjeshëm, gjë që do ta bëjë atë të pakontrollueshme, dhe koha e grumbullimit do të jetë shumë e gjatë. Përveç kësaj, kur vlerat numerike i shtohen bazës së të dhënave, ose nëse ato ndryshojnë, ky informacion duhet të pasqyrohet në vlerat e para-llogaritura në varësi të të dhënave të reja. Kështu, përditësimi i bazës së të dhënave gjithashtu mund të marrë një kohë të gjatë në rastin e një numri të madh të vlerave të para-llogaritura. Meqenëse baza e të dhënave është zakonisht jashtë linje gjatë grumbullimit, është e dëshirueshme që koha e grumbullimit të mos jetë shumë e gjatë.

OLAP -klienti është rregulluar ndryshe. Ndërtimi i një kubi shumëdimensional dhe OLAP -llogaritjet kryhen në kujtesën e kompjuterit klient.OLAP -klientët gjithashtu ndahen në ROLAP dhe MOLAP.Dhe disa mund të mbështesin të dy llojet e qasjes në të dhëna.

Secila prej këtyre qasjeve ka të mirat dhe të këqijat e veta. Përkundër besimit të përhapur në lidhje me avantazhet e mjeteve të serverit mbi ato të klientit, në një numër rastesh përdorimi i OLAP - klienti për përdoruesit mund të jetë më efikas dhe fitimprurës sesa përdorimi Serverat OLAP.

Zhvillimi i aplikacioneve analitike duke përdorur mjetet e klientit OLAP është një proces i shpejtë dhe nuk kërkon trajnim special për kontraktorin. Një përdorues me njohuri për zbatimin fizik të bazës së të dhënave mund të zhvillohet aplikim analitik në mënyrë të pavarur, pa përfshirjen e një specialisti IT.

Kur përdorni një server OLAP, duhet të studioni 2 sisteme të ndryshme, ndonjëherë nga shitës të ndryshëm - për krijimin e kubeve në server dhe për zhvillimin e një aplikacioni klienti.

Klienti OLAP siguron një ndërfaqe vizuale të unifikuar për përshkrimin e kubeve dhe personalizimin e ndërfaqeve të tyre të përdoruesit.

Pra, në cilat raste përdorimi i një klienti OLAP për përdoruesit mund të jetë më efikas dhe fitimprurës sesa përdorimi i një serveri OLAP?

· Fizibiliteti ekonomik i aplikimit OLAP -serveri ndodh kur sasia e të dhënave është shumë e madhe dhe e padurueshme për të OLAP - klienti, përndryshe përdorimi i këtij të fundit është më i justifikuar. Në këtë rast OLAP -Klienti kombinon karakteristikat e performancës së lartë me kosto të ulët.

· Kompjuterat analistë të fuqishëm janë një arsye tjetër e mirë OLAP -klientë. Kur aplikoni OLAP -server, këto kapacitete nuk përdoren.

Ndër avantazhet e klientëve OLAP janë këto:

· Kostot e zbatimit dhe mirëmbajtjes OLAP - klienti është dukshëm më i ulët se kostoja e Serveri OLAP.

· Duke përdorur OLAP - për një klient me një makinë të integruar, transmetimi i të dhënave në rrjet bëhet një herë. Ndërsa bën OLAP -operacionet e rrymave të reja të të dhënave nuk krijohen.

5. Parimet e punës OLAP-klientë.

Le të shikojmë procesin e krijimit të një aplikacioni OLAP duke përdorur mjetin e klientit (Figura 1).

Figura 1Ndërtoni një Aplikacion OLAP duke Përdorur ROLAP Client Tool

Parimi i funksionimit të klientëve ROLAP është një përshkrim paraprak i shtresës semantike prapa së cilës fshihet struktura fizike e të dhënave fillestare. Në këtë rast, burimet e të dhënave mund të jenë: tabelat lokale, RDBMS. Lista e burimeve të të dhënave të mbështetura është specifike për produktin. Pas kësaj, përdoruesi mund të manipulojë në mënyrë të pavarur objektet që ai i kupton në aspektin e fushës së lëndës për të krijuar kube dhe ndërfaqe analitike.

Klienti i serverit OLAP funksionon ndryshe. Në serverin OLAP, kur krijon kube, përdoruesi manipulon përshkrimet fizike të bazës së të dhënave. Kjo krijon përshkrime të personalizuara në vetë kubin. Klienti i serverit OLAP është i konfiguruar vetëm për kub.

Kur krijoni një shtresë semantike, burimet e të dhënave - tabelat e Shitjes dhe Marrëveshjes - përshkruhen në terma të kuptueshëm për përdoruesit përfundimtarë dhe kthehen në "Produkte" dhe "Oferta". Fusha "ID" nga tabela "Produkte" riemërohet në "Kod", dhe "Emri" në "Produkt", etj.

Pastaj krijohet objekti i biznesit të Shitjeve. Një objekt biznesi është një tryezë e sheshtë nga e cila formohet një kub shumëdimensional. Kur krijohet një objekt biznesi, tabelat "Produkte" dhe "Oferta" kombinohen me fushën "Kodi" të produktit. Meqenëse të gjitha fushat e tabelës nuk kërkohet të shfaqen në raport, objekti i biznesit përdor vetëm fushat "Item", "Data" dhe "Shuma".

Në shembullin tonë, bazuar në objektin e biznesit Sales, ne kemi krijuar një raport mbi shitjet e mallrave sipas muajit.

Kur punoni me një raport ndërveprues, përdoruesi mund të vendosë kushte filtrimi dhe grupimi me të njëjtat lëvizje të thjeshta të miut. Në këtë pikë, klienti ROLAP i qaset të dhënave në cache. Nga ana tjetër, klienti i serverit OLAP gjeneron një pyetje të re kundër bazës së të dhënave shumëdimensionale. Për shembull, duke aplikuar një filtër sipas mallrave në raportin e shitjeve, ju mund të merrni një raport mbi shitjet e mallrave me interes për ne.

Të gjitha cilësimet e aplikacionit OLAP mund të ruhen në një depo të dedikuar të meta të dhënave, në një aplikacion, ose në një depo të sistemit të bazës së të dhënave shumëdimensionale.Zbatimi varet nga produkti specifik i softuerit.

Çdo gjë që përfshihet në këto aplikacione është një vështrim standard në ndërfaqen, funksionet dhe strukturën e paracaktuar, dhe vendime të shpejta për situata pak a shumë standarde. Për shembull, paketat financiare janë të njohura. Aplikimet financiare të para-ndërtuara do t'i lejojnë profesionistët të përdorin instrumente financiare të njohura pa pasur nevojë të hartojnë një strukturë të bazës së të dhënave ose forma dhe raporte të zakonshme.

Interneti është një formë e re e klientit. Përveç kësaj, ajo mban vulën e teknologjive të reja; shume nga zgjidhje interneti ndryshojnë ndjeshëm në aftësitë e tyre në përgjithësi dhe në cilësinë e një zgjidhjeje OLAP në veçanti. Ka shumë përparësi për të gjeneruar raporte OLAP në internet. Më e rëndësishmja është mungesa e nevojës për softuer të specializuar për qasje në informacion. Kjo i kursen kompanisë shumë kohë dhe para.

6. Zgjedhja e arkitekturës së aplikacionit OLAP.

Kur zbatoni një sistem informacioni dhe analitik, është e rëndësishme të mos bëni një gabim në zgjedhjen e një arkitekture të aplikacionit OLAP. Përkthimi fjalë për fjalë i termit Procesi Analitik On -Line - "përpunimi analitik on -line" - shpesh merret fjalë për fjalë në kuptimin që të dhënat që hyjnë në sistem të analizohen menjëherë. Ky është një mashtrim - efikasiteti i analizës nuk ka të bëjë me kohën reale të azhurnimit të të dhënave në sistem. Kjo karakteristikë i referohet kohës së përgjigjes së sistemit OLAP ndaj kërkesave të përdoruesve. Në të njëjtën kohë, të dhënat e analizuara janë shpesh një fotografi e informacionit "për dje", nëse, për shembull, të dhënat në magazina azhurnohen një herë në ditë.

Në këtë kontekst, përkthimi i OLAP si "përpunim analitik interaktiv" është më i saktë. Theshtë aftësia për të analizuar të dhënat në mënyrë ndërvepruese që dallon sistemet OLAP nga sistemet për përgatitjen e raporteve të rregulluara.

Një tipar tjetër i përpunimit ndërveprues në formulimin e themeluesit të OLAP E. Codd është aftësia për të "kombinuar, parë dhe analizuar të dhënat nga pikëpamja e dimensioneve të shumëfishta, domethënë në mënyrën më të kuptueshme për analistët e korporatave". Për vetë Codd, termi OLAP nënkupton një mënyrë ekskluzivisht specifike të përfaqësimit të të dhënave në nivelin konceptual - shumëdimensional. Në nivelin fizik, të dhënat mund të ruhen në bazat e të dhënave relacionale, por në realitet, mjetet OLAP kanë tendencë të punojnë me bazat e të dhënave shumëdimensionale në të cilat të dhënat janë të organizuara në një hiperkub (Figura 1).

Figura 1 OLAP- kub (hiperkub, metakub)

Për më tepër, rëndësia e këtyre të dhënave përcaktohet nga momenti kur hiperkubi mbushet me të dhëna të reja.

Natyrisht, koha e formimit të një baze të të dhënave shumëdimensionale varet ndjeshëm nga vëllimi i të dhënave të ngarkuara në të, kështu që është e arsyeshme të kufizohet ky vëllim. Por si të mos ngushtoni mundësitë e analizës dhe të mos privoni përdoruesin nga aksesi në të gjitha informacionet me interes? Ekzistojnë dy rrugë alternative: Analizoni pastaj pyetjen dhe Query pastaj analizoni.

Ndjekësit e rrugës së parë sugjerojnë ngarkimin e informacionit të përgjithësuar në një bazë të dhënash shumëdimensionale, për shembull, shumat mujore, tremujore, vjetore për departamentet. Dhe nëse është e nevojshme të përsosni të dhënat, përdoruesit i kërkohet të krijojë një raport mbi bazën e të dhënave relacionale që përmban përzgjedhjen e kërkuar, për shembull, në ditë për një departament të caktuar ose sipas muajve dhe punonjësve të një departamenti të zgjedhur.

Përkrahësit e mënyrës së dytë, përkundrazi, i ofrojnë përdoruesit, para së gjithash, të përcaktojë të dhënat që ai do të analizojë dhe t'i ngarkojë ato në një mikrokub - një bazë të dhënash të vogël shumëdimensionale. Të dyja qasjet ndryshojnë konceptualisht dhe kanë avantazhet dhe disavantazhet e tyre.

Përparësitë e qasjes së dytë përfshijnë "freskinë" e informacionit që përdoruesi merr në formën e një raporti shumëdimensional - "mikrokub". Mikrokubi gjenerohet bazuar në informacionin e kërkuar vetëm nga baza e të dhënave aktuale relacionale. Puna me një mikrokub kryhet në një mënyrë interaktive - marrja e feta informacioni dhe detajimi i tij brenda mikrokubit kryhet menjëherë. Një pikë tjetër pozitive është se dizajni i strukturës dhe mbushja e mikrokubit kryhet nga përdoruesi "në fluturim", pa pjesëmarrjen e administratorit të bazës së të dhënave. Sidoqoftë, qasja gjithashtu vuan nga disavantazhe serioze. Përdoruesi nuk e sheh fotografinë e përgjithshme dhe duhet të përcaktohet paraprakisht me drejtimin e kërkimit të tij. Përndryshe, mikrokubi i kërkuar mund të jetë shumë i vogël dhe të mos përmbajë të gjitha të dhënat me interes, dhe përdoruesi do të duhet të kërkojë një mikrokub të ri, pastaj një të ri, pastaj përsëri dhe përsëri. Qasja e analizës së pyetësorit zbaton mjetin BusinessObjects të kompanisë me të njëjtin emër dhe mjetet e platformës Contour Company.Intersoft Laborator

Me qasjen Analyze then query, sasia e të dhënave të ngarkuara në një bazë të dhënash shumëdimensionale mund të jetë mjaft e madhe, mbushja duhet të kryhet sipas rregullave dhe mund të marrë shumë kohë. Sidoqoftë, të gjitha këto disavantazhe paguhen më vonë kur përdoruesi ka qasje në pothuajse të gjitha të dhënat e nevojshme në çdo kombinim. Referimi i të dhënave origjinale në një bazë të dhënash relacionale kryhet vetëm si mjeti i fundit, kur nevojiten informacione të hollësishme, për shembull, në një faturë specifike.

Puna e një baze të dhënash të vetme shumëdimensionale praktikisht nuk ndikohet nga numri i përdoruesve që hyjnë në të. Ata lexojnë vetëm të dhënat e disponueshme atje, në kontrast me metodën Query pastaj analize, në të cilën numri i mikrokubave në rastin ekstrem mund të rritet me të njëjtën ritëm me numrin e përdoruesve.

Me këtë qasje, ngarkesa në shërbimet e TI -së rritet, të cilat, përveç atyre relacionale, detyrohen gjithashtu t'i shërbejnë bazave të të dhënave shumëdimensionale.Janë këto shërbime që janë përgjegjëse për kohën përditësim automatik të dhëna në bazat e të dhënave shumëdimensionale.

Përfaqësuesit më të shquar të qasjes "Analizo pastaj pyetjen" janë mjetet PowerPlay dhe Impromptu nga Cognos.

Zgjedhja e qasjes dhe mjetit për zbatimin e saj varet kryesisht nga qëllimi i ndjekur: gjithmonë duhet të balanconi mes kursimit të buxhetit dhe përmirësimit të cilësisë së shërbimit për përdoruesit përfundimtarë. Duhet të kihet parasysh se, në aspektin strategjik, krijimi i sistemeve të informacionit dhe analitikës ndjek qëllimin e arritjes së një avantazhi konkurrues, dhe jo shmangien e kostos së automatizimit. Për shembull, një sistem informacioni dhe analitik i korporatës mund të sigurojë informacionin e nevojshëm, në kohë dhe të besueshëm në lidhje me një kompani, publikimi i të cilave për investitorët e mundshëm do të sigurojë transparencën dhe parashikueshmërinë e kësaj kompanie, e cila në mënyrë të pashmangshme do të bëhet kusht për atraktivitetin e saj të investimeve.

7. Sferat e aplikimit të teknologjive OLAP.

OLAP është i zbatueshëm kudo ku ka një detyrë të analizës së të dhënave me shumë faktorë. Në përgjithësi, nëse keni një tabelë me të dhëna, në të cilën ka të paktën një kolonë përshkruese (dimension) dhe një kolonë me numra (masa ose fakte), një mjet OLAP zakonisht do të jetë një mjet efektiv për analizimin dhe gjenerimin e raporteve.

Le të shqyrtojmë disa fusha të aplikimit të teknologjive OLAP, të marra nga jeta reale.

1. Shitjet.

Bazuar në analizën e strukturës së shitjeve, zgjidhen çështjet e nevojshme për marrjen e vendimeve menaxheriale: për ndryshimin e asortimentit të mallrave, çmimet, mbylljen dhe hapjen e dyqaneve, degëve, përfundimin dhe nënshkrimin e kontratave me tregtarët, kryerjen ose përfundimin e fushatave reklamuese, etj.

2. Blerjet.

Detyra është e kundërta e analizës së shitjeve. Shumë ndërmarrje blejnë komponentë dhe materiale nga furnizuesit. Tregtarët blejnë mallra për rishitje. Ka shumë detyra të mundshme në analizën e prokurimit, nga planifikimi Paratë bazuar në përvojën e kaluar, më parë kontrollin mbi menaxherët zgjedhja e furnizuesve.

3. Çmimet.

Analiza e blerjeve është e lidhur ngushtë me analizën e çmimeve të tregut. Qëllimi i kësaj analize është të zgjedh kostot, të zgjedhë ofertat më të favorshme.

4. Marketingu.

Me analizën e marketingut do të kuptojmë vetëm fushën e analizës së blerësve ose konsumatorëve-konsumatorëve të shërbimeve. Detyra e kësaj analize është pozicionimi i saktë i produktit, identifikimi i grupeve të blerësve për reklama të synuara dhe optimizimi i asortimentit. Detyra e OLAP në këtë rast është t'i sigurojë përdoruesit një mjet që shpejt, me shpejtësinë e mendimit, të marrë përgjigje për pyetjet që lindin në mënyrë intuitive gjatë analizës së të dhënave.

5. Magazina.

Analiza e strukturës së gjendjeve të aksioneve në kontekstin e llojeve të mallrave, magazinave, analiza e jetëgjatësisë së mallrave, analiza e dërgesës nga marrësi dhe shumë lloje të tjera të analizave të rëndësishme për kompaninë janë të mundshme nëse organizata ka kontabilitetin e magazinave.

6. Rrjedha e parasë.

Kjo është një fushë e tërë analize, me shumë shkolla dhe metodologji. Teknologjia OLAP mund të shërbejë si një mjet për zbatimin ose përmirësimin e këtyre teknikave, por jo si një zëvendësim për to. Qarkullimi monetar i fondeve pa para dhe para të gatshme për sa i përket transaksioneve të biznesit, palëve, monedhave dhe kohës është analizuar në mënyrë që të optimizojë flukset, të sigurojë likuiditet, etj. Përbërja e matjeve varet fuqimisht nga specifikat e biznesit, industrisë dhe metodologjisë.

7. Buxheti.

Një nga fushat më pjellore të aplikimit për teknologjitë OLAP. Jo për asgjë, as për një sistem modern buxhetimi nuk konsiderohet i plotë pa mjete OLAP për analizën e buxhetit. Shumica e raporteve buxhetore ndërtohen lehtësisht në bazë të sistemeve OLAP. Në të njëjtën kohë, raportet i përgjigjen një game të gjerë pyetjesh: analiza e strukturës së shpenzimeve dhe të ardhurave, krahasimi i shpenzimeve për zëra të caktuar në departamente të ndryshme, analiza e dinamikës dhe tendencave të shpenzimeve për zëra të caktuar, analiza e kostos dhe fitimit Me

8. Llogaritë.

Bilanci klasik, i përbërë nga një numër llogarie dhe që përmban bilancet hyrëse, qarkullimet dhe tepricat dalëse, mund të analizohet në mënyrë perfekte në sistemin OLAP. Për më tepër, sistemi OLAP mund të llogarisë automatikisht dhe shumë shpejt bilancet e konsoliduara të një organizate shumë-degëshe, gjendjet për muajin, tremujorin dhe vitin, bilancet e grumbulluara sipas hierarkisë së llogarive, bilancet analitike të bazuara në karakteristikat analitike.

9. Raportimi financiar.

Një sistem raportimi i avancuar teknologjikisht nuk është asgjë më shumë se një grup treguesish të emëruar me vlera që nga data, të cilët duhet të grupohen dhe përmblidhen në aspekte të ndryshme për të marrë raporte specifike. Në këtë rast, shfaqja dhe shtypja e raporteve është më e lehta dhe më e lirë për t'u zbatuar në sistemet OLAP. Në çdo rast, sistemi i brendshëm i raportimit të ndërmarrjes nuk është aq konservator dhe mund të rindërtohet për të kursyer para në punën teknike në krijimin e raporteve dhe për të marrë aftësitë e analizave operacionale shumëdimensionale.

10. Trafiku i faqes në internet.

Skedari log i serverit të Internetit është i natyrës shumëdimensionale, që do të thotë se është i përshtatshëm për analizën OLAP. Faktet janë: numri i vizitave, numri i goditjeve, koha e kaluar në faqe dhe informacione të tjera të disponueshme në regjistër.

11. Vëllimet e prodhimit.

Ky është një shembull tjetër i analizës statistikore. Kështu, është e mundur të analizohen vëllimet e patateve të rritura, çeliku të shkrirë, mallrat e prodhuara.

12. Konsumi i materialeve harxhuese.

Imagjinoni një fabrikë të përbërë nga dhjetëra punëtori, e cila konsumon lëngje ftohëse, shpëlarëse, vajra, lecka, letër zmerile - qindra artikuj harxhues. Për planifikim të saktë dhe optimizim të kostos, kërkohet një analizë e plotë e konsumit aktual të konsumit.

13. Përdorimi i lokaleve.

Një lloj tjetër i analizës statistikore. Shembuj: analiza e ngarkesës së klasave, ndërtesave dhe lokaleve të dhëna me qira, përdorimi i dhomave të konferencave, etj.

14. Qarkullimi i punonjësve në ndërmarrje.

Analiza e qarkullimit të stafit në ndërmarrje në kontekstin e degëve, departamenteve, profesioneve, nivelit arsimor, gjinisë, moshës, kohës.

15. Trafiku i udhëtarëve.

Analiza e numrit të biletave të shitura dhe shumave në kontekstin e stinëve, drejtimeve, llojeve të makinave (klasave), llojeve të trenave (avionëve).

Shtrirja e aplikimit nuk është e kufizuar në këtë listë. OLAP - teknologjitë. Për shembull, merrni parasysh teknologjinë OLAP -analiza në fushën e shitjeve.

8. Shembull përdorimi OLAP -teknologjitë për analiza në fushën e shitjeve.

Hartimi i një përfaqësimi shumëdimensional të të dhënave për OLAP -analiza fillon me formimin e një harte matëse. Për shembull, kur analizoni shitjet, mund të jetë e këshillueshme të veçoni pjesë të caktuara të tregut (konsumatorë në zhvillim, të qëndrueshëm, të mëdhenj dhe të vegjël, gjasat e konsumatorëve të rinj, etj.) Dhe të vlerësoni vëllimet e shitjeve sipas produkteve, territoreve, klientëve, tregut segmentet, kanalet e shpërndarjes, etj madhësia e porosive. Këto drejtime formojnë rrjetin e pamjes shumëdimensionale të shitjeve - struktura e dimensioneve të saj.

Meqenëse veprimtaria e çdo ndërmarrje zhvillohet me kohë, pyetja e parë që lind në analizë është çështja e dinamikës së zhvillimit të biznesit. Organizimi i saktë i boshtit kohor do t'i japë një përgjigje cilësore kësaj pyetjeje. Zakonisht boshti kohor ndahet në vite, tremujorë dhe muaj. Edhe më shumë fragmentim në javë dhe ditë është i mundur. Struktura e dimensionit kohor formohet duke marrë parasysh shpeshtësinë e marrjes së të dhënave; mund të kushtëzohet edhe nga frekuenca e kërkesës për informacion.

Dimensioni i "grupit të produktit" është krijuar për të pasqyruar sa më afër strukturën e produkteve që shiten. Në të njëjtën kohë, është e rëndësishme të vëzhgoni një ekuilibër të caktuar në mënyrë që, nga njëra anë, të shmangni detajet e tepërta (numri i grupeve duhet të jetë i parashikueshëm), dhe nga ana tjetër, të mos humbisni një segment të rëndësishëm të tregut.

Dimensioni "Konsumatorët" pasqyron strukturën e shitjeve sipas vendndodhjes gjeografike. Çdo dimension mund të ketë hierarkitë e veta, për shembull, në këtë dimension mund të jetë një strukturë: Vendet - Rajonet - Qytetet - Klientët.

Për të analizuar performancën e departamenteve, duhet të krijoni dimensionin tuaj. Për shembull, mund të dalloni dy nivele të hierarkisë: departamentet dhe nënndarjet e tyre, të cilat duhet të pasqyrohen në dimensionin "Departamentet".

Në fakt, dimensionet "Koha", "Produktet", "Konsumatorët" përcaktojnë plotësisht hapësirën e zonës së subjektit.

Për më tepër, është e dobishme të ndash këtë hapësirë ​​në zona të kushtëzuara bazuar në karakteristikat e llogaritura, për shembull, diapazonet e vëllimit të transaksioneve në terma vlerash. Atëherë i gjithë biznesi mund të ndahet në një numër vargjesh vlerash në të cilat kryhet. Në këtë shembull, mund të kufizoheni në treguesit e mëposhtëm: sasia e shitjeve të mallrave, numri i mallrave të shitura, sasia e të ardhurave, numri i transaksioneve, numri i klientëve, vëllimi i blerjeve nga prodhuesit.

OLAP - kubi për analizë do të duket (Fig. 2):


Figura 2OLAP- një kub për analizimin e vëllimit të shitjeve

Preciselyshtë pikërisht një grup i tillë tre-dimensional në termat OLAP që quhet kub. Në fakt, nga pikëpamja e matematikës së rreptë, një grup i tillë nuk do të jetë gjithmonë një kub: një kub i vërtetë duhet të ketë të njëjtin numër elementësh në të gjitha dimensionet, ndërsa kubet OLAP nuk kanë një kufizim të tillë. Një kub OLAP nuk duhet të jetë fare 3D. Mund të jetë dy dhe shumëdimensionale - në varësi të problemit që zgjidhet. Produktet serioze OLAP janë të dizajnuara për rreth 20 dimensione. Aplikacionet më të thjeshta të desktopit mbështesin rreth 6 dimensione.

Duhet të mbushen larg të gjithë elementëve të kubit: nëse nuk ka informacion në lidhje me shitjet e Produktit 2 te Klienti 3 në tremujorin e tretë, vlera në qelizën përkatëse thjesht nuk do të përcaktohet.

Sidoqoftë, vetë kubi nuk është i përshtatshëm për analizë. Nëse është ende e mundur të përfaqësohet ose të përshkruhet në mënyrë adekuate një kub tre-dimensionale, atëherë me gjashtë ose nëntëmbëdhjetë-dimensionale situata është shumë më e keqe. Prandaj, para përdorimit, tabelat e zakonshme dy-dimensionale nxirren nga kubi shumëdimensional. Ky operacion quhet "prerje" e kubit. Analisti, si të thuash, merr dhe "shkurton" dimensionet e kubit sipas etiketave të interesit. Në këtë mënyrë, analisti merr një fetë dy-dimensionale të kubit (raporti) dhe punon me të. Struktura e raportit është treguar në Figurën 3.

Figura 3Struktura e raportit analitik

Le të presim kubin tonë OLAP dhe të marrim raportin e shitjeve për tremujorin e tretë, do të duket kështu (Fig. 4).

Figura 4Raporti i Shitjeve i Tremujorit të Tretë

Ju mund të shkurtoni kubin përgjatë një aksi të ndryshëm dhe të merrni një raport mbi shitjet e grupit të produktit 2 gjatë vitit (Fig. 5).

Figura 5Raporti tremujor i shitjeve të produkteve 2

Në mënyrë të ngjashme, ju mund të analizoni marrëdhënien me klientin 4, duke prerë kubin tek etiketa Klientët(fig. 6)

Figura 6Raporti për dërgimin e mallrave tek klienti 4

Ju mund të studioni raportin sipas muajit ose të flisni për dërgesat e mallrave në një degë të veçantë të klientëve.

Në një seri artikujsh "Hyrje në bazat e të dhënave", të botuara kohët e fundit (shiko ComputerPress # 3'2000 - 3'2001), ne diskutuam teknologji dhe programe të ndryshme të përdorura për krijimin sistemet e informacionit- DBMS desktop dhe server, mjete të projektimit të të dhënave, mjete të zhvillimit të aplikacioneve, si dhe Inteligjenca e Biznesit - mjete të analizës dhe përpunimit të të dhënave në shkallë ndërmarrjeje që tani po bëhen gjithnjë e më popullore në botë, përfshirë edhe në vendin tonë. Vini re, megjithatë, se çështjet e përdorimit të mjeteve dhe teknologjive të Inteligjencës së Biznesit të përdorura për të krijuar aplikime të kësaj klase nuk janë mbuluar ende mjaftueshëm në literaturën vendase. Në një seri të re artikujsh, ne do të përpiqemi të mbushim këtë boshllëk dhe të flasim për cilat janë teknologjitë në themel të aplikacioneve të tilla. Si shembuj të zbatimit, ne do të përdorim kryesisht teknologjitë OLAP nga Microsoft (kryesisht Shërbimet e Analizës në Microsoft SQL Server 2000), por shpresojmë që pjesa më e madhe e materialit të jetë e dobishme për përdoruesit e mjeteve të tjera.

Artikulli i parë në këtë seri i kushtohet bazave të OLAP (Përpunimi Analitik On -Line) - një teknologji për analizën e të dhënave shumëdimensionale. Në të do të mbulojmë konceptet e magazinave të të dhënave dhe OLAP, kërkesat për depot e të dhënave dhe mjetet OLAP, organizimin logjik të të dhënave OLAP, dhe termat dhe konceptet bazë të përdorura kur diskutohet analiza shumëdimensionale.

Çfarë është një depo e të dhënave

Sistemet e informacionit të shkallës së ndërmarrjes, si rregull, përmbajnë aplikacione të dizajnuara për analiza komplekse me shumë ndryshime të të dhënave, dinamikën e tyre, tendencat, etj. Kjo analizë ka për qëllim përfundimisht të lehtësojë vendimmarrjen. Shpesh këto sisteme quhen sisteme mbështetëse të vendimeve.

Isshtë e pamundur të merret ndonjë vendim menaxhimi pa pasur informacionin e nevojshëm për këtë, zakonisht sasior. Kjo kërkon krijimin e magazinave të të dhënave, domethënë procesin e grumbullimit, shqyrtimit dhe parapërpunim të dhëna në mënyrë që të sigurojë informacionin që rezulton tek përdoruesit për analiza statistikore (dhe shpesh të krijojë raporte analitike).

Ralph Kimball, një nga krijuesit e konceptit të magazinës së të dhënave, e përshkroi depon e të dhënave si "një vend ku njerëzit mund të kenë qasje në të dhënat e tyre" (shih, për shembull, Ralph Kimball, "The Data Warehouse Toolkit: Techniques Praktike për Ndërtimin e Depove Dimensionale të të Dhënave ", John Wiley & Sons, 1996 dhe" The Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse ", John Wiley & Sons, 2000). Ai gjithashtu formuloi kërkesat themelore për depot e të dhënave:

  • mbështetje për shpejtësinë e lartë të marrjes së të dhënave nga ruajtja;
  • ruajtja e qëndrueshmërisë së të dhënave të brendshme;
  • aftësia për të marrë dhe krahasuar të ashtuquajturat feta të të dhënave (fetë dhe zare);
  • disponueshmëria e shërbimeve të përshtatshme për shikimin e të dhënave në ruajtje;
  • plotësia dhe besueshmëria e të dhënave të ruajtura;
  • mbështetje për një proces të rimbushjes së të dhënave me cilësi të lartë.

Shpesh nuk është e mundur të plotësohen të gjitha kërkesat e listuara brenda të njëjtit produkt. Prandaj, për zbatimin e depove të të dhënave, zakonisht përdoren disa produkte, disa prej të cilave janë mjetet aktuale të ruajtjes së të dhënave, të tjerët janë mjete për nxjerrjen dhe shikimin e tyre, të tjerët janë mjete për rimbushjen e tyre, etj.

Një dyqan tipik i të dhënave është zakonisht i ndryshëm nga një bazë të dhënash e rregullt relacionale. Së pari, bazat e të dhënave të rregullta janë krijuar për të ndihmuar përdoruesit të bëjnë punën e tyre të përditshme, ndërsa depot e të dhënave janë krijuar për të marrë vendime. Për shembull, shitjet e mallrave dhe faturimi bëhen duke përdorur një bazë të dhënash për përpunimin e transaksioneve, dhe analiza e dinamikës së shitjeve gjatë disa viteve, e cila ju lejon të planifikoni punën me furnizuesit, bëhet duke përdorur një depo të të dhënave.

Së dyti, bazat e të dhënave konvencionale i nënshtrohen ndryshimeve të vazhdueshme ndërsa përdoruesit punojnë, dhe magazina e të dhënave është relativisht e qëndrueshme: të dhënat në të zakonisht përditësohen sipas një programi (për shembull, javor, ditor ose orë, në varësi të nevojave). Në mënyrë ideale, procesi i rimbushjes është thjesht shtimi i të dhënave të reja gjatë një periudhe të caktuar kohe pa ndryshuar informacionin e vjetër tashmë në magazinë.

Dhe së treti, bazat e të dhënave të zakonshme janë më shpesh burimi i të dhënave që hyjnë në magazinë. Përveç kësaj, magazina mund të plotësohet me burime të jashtme, siç janë raportet statistikore.

Çfarë është OLAP

Sistemet mbështetëse të vendimeve zakonisht kanë mjete për t'i siguruar përdoruesit të dhëna të përgjithshme për mostra të ndryshme nga grupi fillestar në një formë që është e përshtatshme për perceptim dhe analizë. Në mënyrë tipike, funksione të tilla agregate formojnë një bazë të dhënash shumëdimensionale (dhe për këtë arsye jo-relacionale) (shpesh quhet një hiperkub ose metakub), akset e të cilave përmbajnë parametra dhe qelizat e të cilëve përmbajnë të dhëna të përgjithshme që varen prej tyre. Përgjatë secilit aks, të dhënat mund të organizohen në një hierarki që përfaqëson nivele të ndryshme detajesh. Falë këtij modeli të dhënash, përdoruesit mund të formulojnë pyetje komplekse, të gjenerojnë raporte dhe të marrin nënbashkësi të dhënash.

Teknologjia për analizën komplekse të të dhënave me shumë ndryshime quhet OLAP (Përpunimi Analitik On-Line). OLAP është një komponent kryesor i organizatës së ruajtjes së të dhënave. Koncepti OLAP u përshkrua në 1993 nga Edgar Codd, një studiues i njohur i bazës së të dhënave dhe autor i modelit të të dhënave relacionale (shih EF Codd, SB Codd dhe CTSalley, Sigurimi i OLAP (përpunimi analitik on-line) analistëve të përdoruesve: Një mandat IT . Raporti teknik, 1993). Në 1995, bazuar në kërkesat e përcaktuara nga Codd, u formulua i ashtuquajturi test i Analizës së Shpejtë të Informacionit Shumëdimensional të Përbashkët (FASMI), i cili përfshin kërkesat e mëposhtme për aplikimet për analiza me shumë ndryshore:

  • sigurimi i përdoruesit me rezultatet e analizës në një kohë të arsyeshme (zakonisht jo më shumë se 5 sekonda), edhe me koston e një analize më pak të detajuar;
  • aftësia për të kryer çdo analizë logjike dhe statistikore tipike për këtë aplikacion dhe për ta ruajtur atë në një formë të arritshme për përdoruesit përfundimtar;
  • qasje të shumë përdoruesve në të dhëna me mbështetjen e mekanizmave të përshtatshëm të kyçjes dhe mjeteve të autorizuara të hyrjes;
  • përfaqësimi konceptual shumëdimensional i të dhënave, përfshirë mbështetjen e plotë për hierarkitë dhe hierarkitë e shumta (kjo është një kërkesë kryesore e OLAP);
  • aftësia për të hyrë në çdo informacion të nevojshëm, pavarësisht nga vëllimi dhe vendndodhja e tij e ruajtjes.

Duhet të theksohet se funksionaliteti OLAP mund të zbatohet në mënyra të ndryshme, nga mjetet më të thjeshta të analizës së të dhënave në aplikacionet e zyrës deri tek sistemet analitike të shpërndara të bazuara në produktet e serverit. Por, para se të flasim për zbatimet e ndryshme të këtij funksionaliteti, le të shohim se cilat janë kubet OLAP nga pikëpamja logjike.

Kube shumëdimensionale

Në këtë pjesë, ne do të hedhim një vështrim më të afërt në konceptin e OLAP dhe kubeve shumëdimensionale. Si shembull i një baze të dhënash relacionale që do të përdorim për të ilustruar parimet OLAP, ne do të përdorim bazën e të dhënave Northwind të përfshirë me Microsoft SQL Server ose Microsoft Access dhe është një bazë e të dhënave tipike që ruan informacion në lidhje me transaksionet tregtare të një shitësi me shumicë të ushqimit. Këto të dhëna përfshijnë informacion në lidhje me furnizuesit, klientët, kompanitë e shpërndarjes, një listë të mallrave të furnizuar dhe kategoritë e tyre, të dhëna për porositë dhe mallrat e porositura, një listë të punonjësve të kompanisë. Pershkrim i detajuar Baza e të dhënave Northwind mund të gjenden në referencë Sistemet e Microsoft SQL Server ose Microsoft Access - ne nuk e përfshijmë këtu për shkak të kufizimeve të hapësirës.

Për të eksploruar konceptin OLAP, ne do të përdorim pamjen e Faturave dhe tabelat e Produkteve dhe Kategorive nga baza e të dhënave Northwind për të krijuar një pyetje që do të tërheqë detajet e të gjithë artikujve të porositur dhe faturat e lëshuara:

SELECT dbo.Invoices.Country, dbo.Invoices.City, dbo.Invoices.CustomerName, dbo.Invoices.Salesperson, dbo.Invoices.OrderDate, dbo.Categories.CategoryName, dbo.Invoices.ProductName, dbo.Invoices.ShippperName .Invo .Çmimi i zgjeruar NGA dbo. Produktet BASHKOHUNI i brendshëm dbo.Kategoritë në dbo.Produktet.KategoriaID = dbo.Kategoritë. KategoriaID BASHKIMI I Brendshëm i dbo. Faturat N ON dbo.Produkte.ProductID = dbo. Faturat.ProductID

Në Access 2000, një pyetje e ngjashme duket kështu:

SELECT Faturat. Vendi, Faturat.Qyteti, Faturat.Klientët.KompaniaName AS CustomerName, Faturat.Shitësit, Faturat.OrderDate, Kategoritë. Emri i Kategorisë, Faturat.Emri i Produktit, Faturat.Shippers.CompanyName AS ShipperName, Invoices .ProductID = Produktet.ProductID) ON Kategoritë.KategoriaID = Produktet.KategoriaID;

Kjo pyetje hyn në pamjen e Faturave, e cila përmban informacione për të gjitha faturat e lëshuara, dhe tabelat e Kategorive dhe Produkteve, të cilat përmbajnë informacion në lidhje me kategoritë e produkteve që janë porositur dhe vetë produktet, përkatësisht. Si rezultat i kësaj kërkese, ne do të marrim një sërë të dhënash për porosinë, duke përfshirë kategorinë dhe emrin e artikullit të porositur, datën e vendosjes së porosisë, emrin e zyrtarit të faturimit, qytetin, vendin dhe emrin e kompanisë së porosisë kompanisë, si dhe emrin e kompanisë përgjegjëse për dorëzimin.

Për lehtësi, le ta ruajmë këtë kërkesë si pamje dhe ta quajmë Fatura1. Rezultati i qasjes në këtë pamje është treguar në Fig. 1

Çfarë të dhënash të përgjithshme mund të marrim nga kjo pamje? Zakonisht këto janë përgjigje për pyetjet si:

  • Cila është vlera totale e porosive të bëra nga klientët nga Franca?
  • Cila është vlera totale e porosive të bëra nga klientët në Francë dhe të dorëzuara nga Speedy Express?
  • Cila është vlera totale e porosive të bëra nga klientët francezë në 1997 dhe të dorëzuar nga Speedy Express?

Le t'i përkthejmë këto pyetje në pyetje në gjuhën SQL (Tabela 1).

Secila nga pyetjet e mësipërme do të kthejë një numër. Nëse zëvendësoni "Francën" me "Austri" ose një vend tjetër në pyetjen e parë, mund ta ekzekutoni pyetjen përsëri dhe të merrni një numër tjetër. Duke kryer këtë procedurë me të gjitha vendet, ne marrim grupin e të dhënave të mëposhtëm (fragmenti është treguar më poshtë):

Vend SUM (Çmimi i Zgjeruar)
Argjentina 7327.3
Austria 110788.4
Belgjika 28491.65
Brazil 97407.74
Kanadaja 46190.1
Danimarka 28392.32
Finlanda 15296.35
Francës 69185.48
Gjermani 209373.6

Grupi që rezulton i vlerave të përgjithshme (në këtë rast, shumat) mund të interpretohet si një grup i të dhënave një-dimensionale. I njëjti grup i të dhënave mund të merret si rezultat i një pyetjeje me klauzolën GROUP BY të formularit të mëposhtëm:

SELECT Country, SUM (ExtendedPrice) NGA faturat 1 GROUP NGA Vendi

Tani le t'i drejtohemi pyetjes së dytë të mësipërme, e cila përmban dy kushte në klauzolën WHERE. Nëse ekzekutojmë këtë pyetje, duke zëvendësuar të gjitha vlerat e mundshme të parametrave Country dhe ShipperName në të, marrim një grup të dhënash dy-dimensionale të formës së mëposhtme (fragmenti është treguar më poshtë):

Emri i Transportuesit
Vend Transporti Federal Ekspres i shpejtë Paketa e Bashkuar
Argjentina 1 210.30 1 816.20 5 092.60
Austria 40 870.77 41 004.13 46 128.93
Belgjika 11 393.30 4 717.56 17 713.99
Brazil 16 514.56 35 398.14 55 013.08
Kanadaja 19 598.78 5 440.42 25 157.08
Danimarka 18 295.30 6 573.97 7 791.74
Finlanda 4 889.84 5 966.21 7 954.00
Francës 28 737.23 21 140.18 31 480.90
Gjermani 53 474.88 94 847.12 81 962.58

Ky grup i të dhënave quhet një tabelë pivot ose një tabelë kryq (kryqëzim). Shumë spreadsheets dhe DBMS të desktopit ju lejojnë të krijoni tabela të tilla - nga Paradox për DOS në Microsoft Excel 2000. Për shembull, një pyetje e ngjashme duket kështu në Microsoft Access 2000:

Shuma e TRANSFORMS (Faturat1.Çmimi i Zgjatur) AS SumOfExtendedPmimi ZGJIDH Faturat1.Shtetëra NGA Faturat1 GRUPI NGA Faturat1.Faturat PIVOT të Shtetit1.Emri i Transportuesit;

Të dhënat e përgjithshme për një tabelë të tillë strumbullare mund të merren gjithashtu duke përdorur një pyetje të rregullt GROUP BY:

SELECT Country, ShipperName, SUM (ExtendedPrice) NGA faturat 1 GROUP NGA VENDI, ShipperName Vini re, megjithatë, se rezultati i kësaj pyetjeje nuk do të jetë vetë tabela bosht, por vetëm një grup të dhënash të përgjithshme për ndërtimin e tij (fragmenti është treguar më poshtë ):

Vend Emri i Transportuesit SUM (Çmimi i Zgjeruar)
Argjentina Transporti Federal 845.5
Austria Transporti Federal 35696.78
Belgjika Transporti Federal 8747.3
Brazil Transporti Federal 13998.26

E treta e pyetjeve të mësipërme ka tashmë tre parametra në klauzolën WHERE. Duke i ndryshuar ato, ne marrim një bazë të dhënash tre-dimensionale (Fig. 2).

Qelizat e kubit të treguar në Fig. 2, përmbajnë të dhëna të përgjithshme që korrespondojnë me vlerat e parametrave të pyetjes në klauzolën WHERE të vendosura në akset e kubit.

Ju mund të merrni një grup tabelash dy-dimensionale duke prerë një kub me aeroplan paralel me fytyrat e tij (ato shënohen me termat seksione kryq dhe feta).

Natyrisht, të dhënat e përfshira në qelizat e kubit gjithashtu mund të merren duke përdorur pyetjen përkatëse me klauzolën GROUP BY. Për më tepër, disa fletëllogaritëse (në veçanti, Microsoft Excel 2000) gjithashtu ju lejojnë të krijoni një grup të dhënash tre-dimensionale dhe të shihni seksione të ndryshme të kubit, paralelisht me faqen e tij, të përshkruara në një fletë të një libri pune (fletore pune).

Nëse klauzola WHERE përmban katër ose më shumë parametra, grupi i vlerave që rezulton (i quajtur edhe një kub OLAP) mund të jetë 4-dimensionale, 5-dimensionale, etj.

Duke marrë parasysh se çfarë janë kubet OLAP shumëdimensional, le të kalojmë në disa terma dhe koncepte kryesore të përdorura në analizën e të dhënave shumëdimensionale.

Disa terma dhe koncepte

Së bashku me sasitë në qelizat e kubit OLAP, rezultatet e ekzekutimit të të tjerëve funksionet agregate Gjuha SQL të tilla si MIN, MAX, AVG, COUNT, dhe në disa raste të tjera (varianca, devijimi standard, etj.). Për të përshkruar vlerat e të dhënave në qeliza, përdoret termi përmbledhje (në përgjithësi, mund të ketë disa prej tyre në një kub), për të treguar të dhënat fillestare në bazë të të cilave janë llogaritur, termin masë dhe tregojnë parametrat e pyetjeve, termi dimension (i përkthyer në rusisht zakonisht si "dimension" kur flitet për kubet OLAP, dhe si "dimension" kur flitet për depot e të dhënave). Vlerat e vizatuara në akset quhen anëtarë.

Duke folur për dimensionet, duhet përmendur se vlerat e vizatuara në akset mund të kenë nivele të ndryshme detajesh. Për shembull, ne mund të jemi të interesuar për vlerën totale të porosive të bëra nga klientët në vende të ndryshme, ose vlera totale e porosive të bëra nga klientë jorezidentë apo edhe klientë individualë. Natyrisht, grupi rezultues i të dhënave të përgjithshme në rastet e dyta dhe të treta do të jetë më i detajuar sesa në të parën. Vini re se aftësia për të marrë të dhëna të përgjithshme me shkallë të ndryshme të grimcave korrespondon me një nga kërkesat për depot e të dhënave - kërkesën për disponueshmërinë e fetave të ndryshme të të dhënave për krahasim dhe analizë.

Meqenëse në shembullin e konsideruar, në rastin e përgjithshëm, secili vend mund të ketë disa qytete, dhe një qytet mund të ketë disa klientë, ne mund të flasim për hierarkitë e vlerave në dimensione. Në këtë rast, vendet janë të vendosura në nivelin e parë të hierarkisë, qytetet në të dytin, dhe klientët në të tretin (Fig. 3).

Vini re se hierarkitë mund të jenë të balancuara, siç është hierarkia e treguar në Fig. 3, si dhe hierarkitë e datës dhe kohës dhe të pabalancuara. Një shembull tipik i një hierarkie të pabalancuar është një hierarki bosi-vartëse (mund të ndërtohet, për shembull, duke përdorur vlerat e fushës së Shitësit në bazën e të dhënave origjinale nga shembulli i mësipërm), treguar në Fig. 4

Ndonjëherë termi hierarki prindër-fëmijë përdoret për hierarki të tilla.

Ekzistojnë gjithashtu hierarki që janë të ndërmjetme midis të balancuara dhe të pabalancuara (të quajtura të rreckosura). Ato zakonisht përmbajnë anëtarë "prindërit" e të cilëve nuk janë në nivelin e prindërve të menjëhershëm (për shembull, ka nivele Vendi, Qyteti dhe Shteti në hierarkinë gjeografike, por ka vende në grupin e të dhënave që nuk kanë shtete ose rajone midis Nivelet e vendit dhe qytetit); fig. 5).

Vini re se hierarkitë e pabalancuara dhe "të pabarabarta" nuk mbështeten nga të gjitha mjetet OLAP. Për shembull, Microsoft Analysis Services 2000 mbështet të dy llojet e hierarkisë, ndërsa Microsoft OLAP Services 7.0 mbështet vetëm ato të balancuara. Numri i niveleve të hierarkisë, numri maksimal i lejuar i anëtarëve të një niveli, dhe numri maksimal i mundshëm i dimensioneve në vetvete mund të jenë të ndryshme në mjete të ndryshme OLAP.

Përfundim

Në këtë artikull, ne mësuam për bazat e OLAP. Ne mësuam sa vijon:

  • Qëllimi i magazinave të të dhënave është t'u sigurojë përdoruesve informacion për analiza statistikore dhe vendimmarrje të menaxhimit.
  • Magazinat e të dhënave duhet të sigurojnë një shpejtësi të madhe të marrjes së të dhënave, aftësinë për të marrë dhe krahasuar të ashtuquajturat feta të të dhënave, si dhe konsistencën, plotësinë dhe besueshmërinë e të dhënave.
  • OLAP (Përpunimi Analitik On-Line) është një komponent kryesor i ndërtimit dhe përdorimit të magazinave të të dhënave. Kjo teknologji bazohet në ndërtimin e grupeve të të dhënave shumëdimensionale - kube OLAP, akset e të cilave përmbajnë parametra, dhe qelizat - të dhënat e përgjithshme që varen prej tyre.
  • Aplikimet me funksionalitetin OLAP duhet t'i sigurojnë përdoruesit rezultatet e analizës në një kohë të arsyeshme, të kryejnë analiza logjike dhe statistikore, të mbështesin aksesin e shumë përdoruesve në të dhëna, të zbatojnë përfaqësime konceptuale shumëdimensionale të të dhënave dhe të jenë në gjendje të kenë qasje në çdo informacion të kërkuar.

Përveç kësaj, ne shqyrtuam parimet themelore të organizimit logjik të kubeve OLAP, dhe gjithashtu mësuam termat dhe konceptet themelore të përdorura në analizën me shumë ndryshore. Më në fund, ne kuptuam se cilat janë llojet e ndryshme të hierarkive në dimensionet e kubit OLAP.

Në artikullin tjetër në këtë seri, ne do të shikojmë një strukturë tipike të depove të të dhënave, do të flasim për atë që janë klienti dhe serveri OLAP dhe do të ndalemi në disa nga aspektet teknike të ruajtjes shumëdimensionale të të dhënave.

ComputerPress 4 "2001

Qëllimi i raportit

Ky raport do të përqëndrohet në një nga kategoritë e teknologjive inteligjente që janë një mjet i përshtatshëm analitik - teknologjitë OLAP.

Qëllimi i raportit: të zbulojë dhe nxjerrë në pah 2 pyetje: 1) konceptin e OLAP dhe kuptimin e tyre të aplikuar në Menaxhimi Financiar; 2) zbatimi i funksionalitetit OLAP në zgjidhjet softuerike: dallimet, mundësitë, avantazhet, disavantazhet.

Dua të vë në dukje menjëherë se OLAP është një mjet universal që mund të përdoret në çdo fushë të aplikuar, jo vetëm në financa (siç mund të kuptohet nga titulli i raportit), i cili kërkon analiza të të dhënave me metoda të ndryshme.

Menaxhimi Financiar

Menaxhimi financiar është një fushë ku analiza është më e rëndësishme se çdo tjetër. Çdo vendim financiar dhe menaxhues lind si rezultat i procedurave të caktuara analitike. Sot, menaxhimi financiar po merr një rol të rëndësishëm për funksionimin e suksesshëm të një ndërmarrje. Përkundër faktit se menaxhimi financiar është një proces ndihmës në ndërmarrje, ai kërkon vëmendje të veçantë, pasi vendimet e gabuara financiare dhe menaxhuese mund të çojnë në humbje të mëdha.

Menaxhimi financiar synon t'i sigurojë ndërmarrjes burime financiare në vëllimet e kërkuara, në kohën e duhur dhe në vendin e duhur, në mënyrë që të marrë efektin maksimal nga përdorimi i tyre përmes shpërndarjes optimale.

Ndoshta është e vështirë të përcaktohet niveli i "efikasitetit maksimal të përdorimit të burimeve", por në çdo rast,

Zyrtari financiar duhet të dijë gjithmonë:

  • sa burime financiare ka?
  • nga do të vijnë fondet dhe në çfarë sasie?
  • ku të investoni në mënyrë më efikase dhe pse?
  • dhe në cilat pika kohore duhet të bëhet e gjithë kjo?
  • sa nevojitet për të siguruar funksionimin normal të ndërmarrjes?

Për të marrë përgjigje të arsyeshme për këto pyetje, ju duhet të keni, analizoni dhe dini se si të analizoni një numër mjaft të madh të treguesve të performancës. Për më tepër, FI mbulon një numër të madh fushash: analiza e flukseve monetare (flukset e parasë), analiza e aktiveve dhe detyrimeve, analiza e përfitimit, analiza e marzhit, analiza e përfitimit, analiza e asortimentit.

Njohuri

Prandaj, faktori kryesor në efektivitetin e procesit të menaxhimit financiar është disponueshmëria e njohurive:

  • Njohuri personale në fushën e lëndës (mund të thuhet teorike dhe metodologjike), duke përfshirë përvojën, intuitën e një financuesi / ZKF
  • Njohuri të përgjithshme (korporative) ose informacion të sistemuar në lidhje me faktet e transaksioneve financiare në ndërmarrje (dmth. Informacion në lidhje me gjendjen e kaluar, të tashme dhe të ardhshme të ndërmarrjes, të paraqitur në tregues dhe matje të ndryshme)

Nëse e para qëndron në fushën e veprimit të këtij financuesi (ose drejtorit të burimeve njerëzore që punësoi këtë punonjës), atëherë e dyta duhet të krijohet me qëllim në ndërmarrje nga përpjekjet e përbashkëta të punonjësve të shërbimeve financiare dhe informacioni.

Çfarë është tani

Sidoqoftë, një situatë paradoksale tani është tipike për ndërmarrjet: ka informacion, ka shumë, shumë. Por është në një gjendje kaotike: e pastrukturuar, jokonsistente, e shpërndarë, jo gjithmonë e besueshme dhe shpesh e gabuar, është pothuajse e pamundur ta gjesh dhe ta marrësh atë. Bëhet një gjenerim i gjatë dhe shpesh i padobishëm i pasqyrave financiare, i cili është i papërshtatshëm për analizën financiare, i vështirë për t'u kuptuar, pasi nuk është krijuar për menaxhimin e brendshëm, por për paraqitjen tek autoritetet e jashtme rregullatore.

Sipas rezultateve të një studimi të kryer nga kompania Reuters mes 1,300 menaxherëve ndërkombëtarë, 38% e të anketuarve thonë se shpenzojnë shumë kohë duke u përpjekur për të gjetur informacionin që u nevojitet. Rezulton se një specialist shumë i kualifikuar e kalon kohën e tij të paguar shumë jo në analizën e të dhënave, por në mbledhjen, kërkimin dhe organizimin e informacionit të nevojshëm për këtë analizë. Në të njëjtën kohë, menaxherët përjetojnë një ngarkesë të madhe të të dhënave që shpesh janë të parëndësishme, gjë që përsëri zvogëlon efikasitetin e tyre. Arsyeja për këtë situatë: një tepricë informacioni dhe mungesë njohurish.

Çfarë të bëni

Informacioni duhet të shndërrohet në njohuri. Për biznesin modern, informacioni i vlefshëm, marrja e tij sistematike, sinteza, shkëmbimi, përdorimi është një lloj monedhe, por për ta marrë atë, është e nevojshme të menaxhohet informacioni, si çdo proces biznesi.

Çelësi i menaxhimit të informacionit është dhënia e informacionit të duhur në mënyrën e duhur palëve të interesuara brenda organizatës në një kohë të caktuar. Qëllimi i një qeverisjeje të tillë është të ndihmojë njerëzit të punojnë më mirë së bashku duke përdorur sasi në rritje të informacionit.

Teknologjitë e informacionit në këtë rast veprojnë si një mjet me të cilin do të ishte e mundur të sistematizohet informacioni në ndërmarrje, t'u sigurohet përdoruesve të caktuar qasje në të dhe t'u jepet atyre mjete për shndërrimin e këtij informacioni në njohuri.

Konceptet themelore të teknologjive OLAP

OLAP-teknologjia (nga Përpunimi Analitik On-Line Anglisht) nuk është emri i një produkti specifik, por i një teknologjie të tërë të analizës operacionale të të dhënave shumëdimensionale të grumbulluara në ruajtje. Për të kuptuar thelbin e OLAP, është e nevojshme të merret parasysh procesi tradicional i marrjes së informacionit për vendimmarrje.

Sistemi tradicional i mbështetjes së vendimeve

Këtu, natyrisht, mund të ketë edhe shumë opsione: kaosi i plotë i informacionit ose situata më tipike kur ndërmarrja ka sisteme operative, me ndihmën e të cilave faktet e operacioneve të caktuara regjistrohen dhe ruhen në bazat e të dhënave. Për të marrë të dhëna nga bazat e të dhënave për qëllime analitike, është ndërtuar një sistem pyetjesh për mostra të caktuara të të dhënave.

Por kjo metodë e mbështetjes së vendimit nuk ka fleksibilitet dhe ka shumë disavantazhe:

  • përdor sasi të papërfillshme të të dhënave që mund të jenë të dobishme për marrjen e vendimeve
  • ndonjëherë krijohen raporte komplekse me shumë faqe, nga të cilat 1-2 rreshta përdoren në të vërtetë (pjesa tjetër është në rast)-mbingarkesa e informacionit
  • reagim i ngadalshëm i procesit ndaj ndryshimeve: nëse nevojitet një përfaqësim i ri i të dhënave, atëherë kërkesa duhet të përshkruhet dhe kodohet zyrtarisht nga programuesi, vetëm atëherë të ekzekutohet. Koha e pritjes: orë, ditë. Ndoshta një zgjidhje është e nevojshme tani, menjëherë. Por pas marrjes së informacionit të ri, do të lindë një pyetje e re (sqaruese)

Nëse raportet e pyetjeve paraqiten në një format njëdimensional, atëherë problemet e biznesit janë zakonisht shumëdimensionale dhe të shumëanshme. Nëse keni nevojë të merrni një pamje të qartë të biznesit të kompanisë, atëherë është e nevojshme të analizoni të dhënat në aspekte të ndryshme.

Shumë kompani krijojnë baza të dhënash të shkëlqyera relacionale, duke zbërthyer në mënyrë ideale malet e informacionit të papërdorur, i cili në vetvete nuk siguron një reagim të shpejtë ose mjaft kompetent ndaj ngjarjeve të tregut. PO - bazat e të dhënave relacionale ishin, janë dhe do të jenë teknologjia më e përshtatshme për ruajtjen e të dhënave të korporatës. Nuk bëhet fjalë për Teknologji e re DB, por më shumë në lidhje me mjetet e analizës që plotësojnë funksionet e DBMS ekzistuese dhe janë mjaft fleksibile për të siguruar dhe automatizuar llojet e ndryshme të minierave të qenësishme në OLAP.

Kuptimi i OLAP

Çfarë jep OLAP?

  • Mjete të përparuara për të hyrë në ruajtjen e të dhënave
  • Manipulimi dinamik i të dhënave interaktive (rrotullimi, konsolidimi ose stërvitja)
  • Shfaqja e qartë vizuale e të dhënave
  • Analizë e shpejtë - në kohë reale
  • Prezantimi i të dhënave shumëdimensionale - analiza e njëkohshme e treguesve të shumtë në dimensione të shumta

Për të marrë një efekt nga përdorimi i teknologjive OLAP, ju duhet: 1) të kuptoni thelbin e vetë teknologjive dhe aftësitë e tyre; 2) përcaktoni qartë se cilat procese duhet të analizohen, cilët tregues do të karakterizohen dhe në cilat dimensione është e këshillueshme t'i shihni ato, domethënë të krijoni një model analize.

Konceptet themelore të përdorura nga teknologjitë OLAP janë si më poshtë:

Shumëdimensionaliteti

Për të kuptuar shumëdimensionalitetin e të dhënave, së pari duhet të paraqisni një tabelë që shfaq, për shembull, performancën e Kostove të Ndërmarrjes sipas elementit ekonomik dhe njësisë së biznesit.

Këto të dhëna paraqiten në dy dimensione:

  • artikull
  • njësi biznesi

Kjo tabelë nuk është informative, pasi tregon shitjet për një periudhë të caktuar kohore. Për periudha të ndryshme kohore, analistët do të duhet të krahasojnë disa tabela (për secilën periudhë kohore):

Figura tregon një dimension të tretë, Koha, përveç dy të parëve. (Neni, njësia e biznesit)

Një mënyrë tjetër për të treguar të dhëna shumëdimensionale është t'i përfaqësoni ato në formën e një kubi:

Kubat OLAP lejojnë analistët të marrin të dhëna në feta të ndryshme për të marrë përgjigje në pyetjet që po bën biznesi:

  • Cilat janë kostot kritike në cilat njësi biznesi?
  • Si ndryshojnë kostot e njësisë së biznesit me kalimin e kohës?
  • Si ndryshojnë artikujt e kostos me kalimin e kohës?

Përgjigjet e pyetjeve të tilla janë të nevojshme për marrjen e vendimeve të menaxhimit: për zvogëlimin e artikujve të caktuar të kostos, ndikimin në strukturën e tyre, identifikimin e arsyeve për ndryshimet në kostot me kalimin e kohës, devijimet nga plani dhe eliminimin e tyre - optimizimi i strukturës së tyre.

Në këtë shembull, merren parasysh vetëm 3 dimensione. Difficultshtë e vështirë të përshkruash më shumë se 3 dimensione, por funksionon në të njëjtën mënyrë si me 3 dimensione.

Në mënyrë tipike, aplikacionet OLAP ju lejojnë të merrni të dhëna në 3 ose më shumë dimensione, për shembull, mund të shtoni një dimension më shumë - Plani -Aktual, Kategoria e kostos: e drejtpërdrejtë, indirekte, sipas porosive, sipas muajit. Dimensionet shtesë ju lejojnë të merrni më shumë feta analitike dhe të jepni përgjigje për pyetjet me kushte të shumta.

Hierarkia

OLAP gjithashtu lejon analistët të organizojnë çdo dimension në një hierarki të grupeve dhe nëngrupeve dhe totalit që përfaqësojnë një masë në të gjithë organizatën - mënyra më logjike për të analizuar një biznes.

Për shembull, është e këshillueshme që të gruponi kostot në mënyrë hierarkike:

OLAP i lejon analistët të marrin të dhëna nga një masë përmbledhëse e përgjithshme (në nivelin më të lartë), dhe pastaj të stërviten deri në fund dhe në nivelin tjetër, duke zbuluar kështu arsyen e saktë të ndryshimit të masës.

Duke lejuar analistët të përdorin dimensione të shumta në një kub të dhënash, me mundësinë e dimensioneve të ndërtuara në mënyrë hierarkike, OLAP siguron një pamje të biznesit që nuk është e ngjeshur nga struktura e depove të të dhënave.

Ndryshoni drejtimet e analizës në një kub (rrotullimi i të dhënave)

Si rregull, ato veprojnë me koncepte: dimensionet e specifikuara në kolona, ​​rreshta (mund të ketë disa prej tyre), pjesa tjetër formojnë feta, përmbajtja e tabelës formohet sipas dimensioneve (shitjet, kostot, paratë e gatshme)

Në mënyrë tipike, OLAP ju lejon të ndryshoni orientimin e dimensioneve të një kubi, duke paraqitur kështu të dhëna në pamje të ndryshme.

Shfaqja e të dhënave të kubit varet nga:

  • orientimet e dimensioneve: cilat dimensione specifikohen në rreshta, kolona, ​​feta;
  • grupet e treguesve të theksuar në rreshta, kolona, ​​feta.
  • Ndryshimi i dimensioneve qëndron në fushën e veprimit të përdoruesit.

Kështu, OLAP ju lejon të kryeni lloje të ndryshme të analizave dhe të kuptoni lidhjen e tyre me rezultatet e tyre.

  • Analiza e devijimit - një analizë e zbatimit të planit, e cila plotësohet me një analizë faktor të shkaqeve të devijimeve duke treguar tregues të detajuar.
  • Analiza e varësisë: OLAP ju lejon të identifikoni varësi të ndryshme midis ndryshimeve të ndryshme, për shembull, kur birra u hoq nga asortimenti gjatë dy muajve të parë, u gjet një rënie në shitjet e roach.
  • Krahasimi (analiza krahasuese). Krahasimi i rezultateve të ndryshimeve në tregues me kalimin e kohës, për një grup të caktuar produktesh, në rajone të ndryshme, etj.
  • Analiza e dinamikës na lejon të identifikojmë tendenca të caktuara në ndryshimin e treguesve me kalimin e kohës.

Shpejtësia: mund të themi se OLAP bazohet në ligjet e psikologjisë: aftësinë për të përpunuar kërkesat e informacionit në "kohë reale" - me ritmin e procesit të të kuptuarit analitik të të dhënave nga përdoruesi.

Nëse mund të lexoni rreth 200 regjistrime në sekondë nga një bazë të dhënash relacionale dhe të shkruani 20, atëherë një server i mirë OLAP, duke përdorur rreshta dhe kolona të llogaritura, mund të konsolidojë 20,000-30,000 qeliza (ekuivalente me një regjistrim në një bazë të dhënash relacionale) në sekondë.

Dukshmëria: Duhet të theksohet se OLAP siguron një paraqitje grafike të avancuar të të dhënave tek përdoruesi përfundimtar. Truri i njeriut është në gjendje të perceptojë dhe analizojë informacionin që paraqitet në formën e imazheve gjeometrike, në një vëllim disa rende të madhësisë më të mëdha se informacioni i paraqitur në formë alfanumerike. Shembull: Supozoni se duhet të gjeni një fytyrë të njohur në një nga njëqind fotografi. Unë besoj se ky proces do t'ju marrë më pak se një minutë. Tani imagjinoni që në vend të fotografive do t'ju ofrohen njëqind përshkrime verbale të të njëjtëve persona. Unë mendoj se ju nuk do të jeni në gjendje të zgjidhni problemin e propozuar fare.

Thjeshtësia: Karakteristika kryesore e këtyre teknologjive është se ato janë të fokusuara në përdorimin jo nga një specialist i IT -së, jo nga një statistikues ekspert, por nga një profesionist në fushën e aplikuar - menaxheri i departamentit të kredive, menaxheri i departamentit të buxhetit, dhe së fundi, drejtori. Ato kanë për qëllim që analisti të komunikojë me problemin, jo me kompjuterin..

Përkundër aftësive të mëdha të OLAP (përveç kësaj, ideja është relativisht e vjetër - vitet '60), në fakt, përdorimi i tij praktikisht nuk gjendet në ndërmarrjet tona. Pse?

  • nuk ka informacion ose mundësitë nuk janë të qarta
  • shprehi për të menduar në mënyrë dy-dimensionale
  • barriera e çmimeve
  • prodhueshmëri e tepërt e artikujve kushtuar OLAP: termat e panjohur trembin - OLAP, "gërmimi dhe prerja e të dhënave", "pyetje ad hoc", "identifikimi i korrelacioneve të rëndësishme"

Qasja jonë dhe qasja perëndimore ndaj aplikimit të OLAP

Përveç kësaj, ne gjithashtu kemi një kuptim specifik të dobisë së OLAP edhe kur kuptojmë aftësitë e tij teknologjike.

Autorët tanë dhe rusë të materialeve të ndryshme mbi OLAP shprehin mendimin e mëposhtëm në lidhje me dobinë e OLAP: shumica e percepton OLAP si një mjet që ju lejon të zgjeroni dhe shembni të dhënat thjesht dhe me lehtësi, duke kryer manipulime që vijnë në kokën e analistit gjatë analiza. Sa më shumë "feta" dhe "shkurtime" të dhënash që sheh analisti, aq më shumë ide ka ai, të cilat, nga ana tjetër, kërkojnë gjithnjë e më shumë "feta" për t'u verifikuar. Nuk është e drejtë.

Kuptimi perëndimor i dobisë së OLAP bazohet në një model metodologjik të analizës, i cili duhet të përcaktohet në hartimin e zgjidhjeve OLAP. Analisti nuk duhet të luajë me kubin OLAP dhe të ndryshojë pa qëllim dimensionet dhe nivelet e tij të detajeve, orientimin e të dhënave, shfaqjen grafike të të dhënave (dhe me të vërtetë duhet!), Por të kuptojë qartë se për cilat pamje i nevojiten, në çfarë sekuence dhe pse (natyrisht , elemente "zbulimesh" mund të ketë, por ky nuk është një element themelor i dobisë së OLAP).

Përdorimi i aplikuar i OLAP

  • Buxheti
  • Rrjedha e fondeve

Një nga fushat më pjellore të aplikimit për teknologjitë OLAP. Jo më kot asnjë sistem modern i buxhetimit nuk konsiderohet i plotë pa praninë e mjeteve OLAP për analizën e buxhetit në përbërjen e tij. Shumica e raporteve buxhetore ndërtohen lehtësisht në bazë të sistemeve OLAP. Në të njëjtën kohë, raportet i përgjigjen një game të gjerë pyetjesh: analiza e strukturës së shpenzimeve dhe të ardhurave, krahasimi i shpenzimeve për zëra të caktuar në departamente të ndryshme, analiza e dinamikës dhe tendencave të shpenzimeve për zëra të caktuar, analiza e kostos dhe fitimit Me

OLAP do t'ju lejojë të analizoni hyrjet dhe daljet e parasë në kontekstin e transaksioneve të biznesit, palëve, monedhave dhe kohës në mënyrë që të optimizoni flukset e tyre.

  • Raportimi financiar dhe menaxhimi (me analitikë që i duhen menaxhmentit)
  • Marketingu
  • Kartë e barazuar e rezultateve
  • Analiza e përfitimit

Nëse të dhënat përkatëse janë të disponueshme, mund të gjeni një aplikacion të ndryshëm të teknologjisë OLAP.

Produktet OLAP

Ky seksion do të flasë për OLAP si një zgjidhje softuerike.

Kërkesat e përgjithshme për produktet OLAP

Ka shumë mënyra për të zbatuar aplikacionet OLAP, atëherë asnjë teknologji e veçantë nuk duhet të ishte kërkuar, apo edhe rekomanduar. Në kushte dhe rrethana të ndryshme, njëra qasje mund të jetë më e preferueshme se tjetra. Teknika e zbatimit përfshin shumë ide të ndryshme pronësore për të cilat shitësit janë aq krenarë: shijet e arkitekturës klient-server, analiza e serive kohore, orientimi i objektit, optimizimi i ruajtjes, proceset paralele, etj. Por këto teknologji nuk mund të jenë pjesë e përkufizimit të OLAP.

Ka karakteristika që duhet të respektohen në të gjitha produktet OLAP (nëse është një produkt OLAP), të cilat janë teknologjia ideale. Këto janë 5 përkufizimet kryesore që karakterizojnë OLAP (i ashtuquajturi test FASMI): Analiza e shpejtë e informacionit të ndarë shumëdimensional.

  • Shpejt(FAST) - do të thotë që sistemi duhet të jetë në gjendje t'u japë përgjigje më të madhe përdoruesve brenda afërsisht pesë sekondash. Edhe nëse sistemi paralajmëron se procesi do të zgjasë shumë më gjatë, përdoruesit mund të shpërqendrohen dhe të humbasin mendimet e tyre, ndërsa cilësia e analizës vuan. Kjo shpejtësi nuk është e lehtë të arrihet me sasi të mëdha të të dhënave, veçanërisht nëse kërkohen llogaritjet speciale gjatë fluturimit. Shitësit po përdorin një larmi të madhe metodash për të arritur këtë qëllim, duke përfshirë format e specializuara të ruajtjes së të dhënave, para-llogaritjen e gjerë ose shtrëngimin e kërkesave të pajisjeve. Sidoqoftë, aktualisht nuk ka zgjidhje plotësisht të optimizuara. Në shikim të parë, mund të duket e habitshme që kur merrni një raport në një minutë, i cili jo shumë kohë më parë zgjati ditë, përdoruesi shumë shpejt mërzitet gjatë pritjes dhe projekti rezulton të jetë shumë më pak i suksesshëm sesa në rastin e një përgjigje të menjëhershme, edhe me koston e analizës më pak të detajuar.
  • Ndarë do të thotë që sistemi bën të mundur plotësimin e të gjitha kërkesave për mbrojtjen e të dhënave dhe zbatimin e aksesit të shpërndarë dhe të njëkohshëm në të dhëna për nivele të ndryshme të përdoruesve. Sistemi duhet të jetë në gjendje të trajtojë ndryshimet e shumta të të dhënave në kohën e duhur, në mënyrë të sigurt. Kjo është një dobësi e madhe në shumë produkte OLAP, të cilat priren të supozojnë se të gjitha aplikacionet OLAP janë vetëm për lexim dhe ofrojnë mbrojtje të thjeshtuar.
  • Shumëdimensionaleështë një kërkesë kryesore. Nëse do të duhej të përkufizonit OLAP me një fjalë, ju do ta zgjidhni atë. Sistemi duhet të sigurojë një pamje konceptuale shumëdimensionale të të dhënave, duke përfshirë mbështetjen e plotë për hierarkitë dhe hierarkitë e shumta, pasi kjo përcakton mënyrën më logjike për të analizuar biznesin. Nuk ka një numër minimal të dimensioneve për tu përpunuar, pasi varet edhe nga aplikimi, dhe shumica e produkteve OLAP kanë dimensione të mjaftueshme për tregjet që synojnë. Përsëri, ne nuk po specifikojmë se cila teknologji e bazës së të dhënave duhet të përdoret nëse përdoruesi merr një përfaqësim konceptual vërtet shumëdimensional të informacionit. Kjo veçori është në zemër të OLAP
  • Informacion. Informacioni i nevojshëm duhet të merret aty ku është e nevojshme, pavarësisht nga vëllimi dhe vendi i ruajtjes. Sidoqoftë, shumë varet nga aplikimi. Fuqia e produkteve të ndryshme matet në lidhje me sasinë e të dhënave që mund të përpunojnë, por jo sa gigabajt mund të ruajnë. Fuqia e produkteve ndryshon shumë - produktet më të mëdha OLAP mund të trajtojnë të paktën një mijë herë më shumë të dhëna sesa ato më të vogla. Ka shumë faktorë që duhen marrë parasysh në këtë drejtim, duke përfshirë dyfishimin e të dhënave, RAM -in e kërkuar, shfrytëzimin e hapësirës në disk, performancën, integrimin e ruajtjes së të dhënave dhe më shumë.
  • Analiza do të thotë që sistemi mund të trajtojë çdo analizë logjike dhe statistikore specifike për një aplikim të caktuar, dhe siguron që të ruhet në një formë të arritshme për përdoruesin përfundimtar. Përdoruesi duhet të jetë në gjendje të përcaktojë llogaritjet e reja me porosi si pjesë e analizës pa pasur nevojë për programim. Kjo do të thotë, i gjithë funksionaliteti i kërkuar i analizës duhet të sigurohet në një mënyrë intuitive për përdoruesit përfundimtarë. Mjetet e analizës mund të përfshijnë procedura të veçanta, të tilla si analiza e serive kohore, alokimi i kostos, transferimet në valutë, kërkimi i synimeve, etj. Aftësi të tilla ndryshojnë shumë midis produkteve, në varësi të orientimit të synuar.

Me fjalë të tjera, këto 5 përkufizime kryesore janë qëllimet që produktet OLAP janë krijuar për të arritur.

Aspektet teknologjike OLAP

Sistemi OLAP përfshin përbërës të caktuar. Ekzistojnë skema të ndryshme të punës së tyre që një produkt i veçantë mund të zbatojë.

Përbërësit e sistemeve OLAP (nga çfarë përbëhet një sistem OLAP?)

Në mënyrë tipike, një sistem OLAP përfshin përbërësit e mëposhtëm:

  • Burim i të dhënave
    Burimi nga i cili merren të dhënat për analiza (magazina e të dhënave, baza e të dhënave të sistemeve të kontabilitetit operacional, një grup tabelash, kombinime të sa më sipër).
  • Serveri OLAP
    Të dhënat nga burimi transferohen ose kopjohen në serverin OLAP, ku organizohen dhe përgatiten për gjenerimin më të shpejtë pasues të përgjigjeve ndaj pyetjeve.
  • Klienti OLAP
    Ndërfaqja e përdoruesit me serverin OLAP, në të cilin përdoruesi operon

Duhet të theksohet se jo të gjithë përbërësit janë të nevojshëm. Ka sisteme desktop OLAP që ju lejojnë të analizoni të dhënat e ruajtura drejtpërdrejt në kompjuterin e përdoruesit dhe nuk kërkojnë një server OLAP.

Sidoqoftë, cili element kërkohet është burimi i të dhënave: disponueshmëria e të dhënave është një çështje e rëndësishme. Nëse ato janë, në çfarëdo forme, si një tabelë Excel, në bazën e të dhënave të sistemit të kontabilitetit, në formën e raporteve të strukturuara të degëve, specialisti i IT -së do të jetë në gjendje të integrohet me sistemin OLAP drejtpërdrejt ose me një transformim të ndërmjetëm. Për këtë, sistemet OLAP kanë mjete speciale. Nëse këto të dhëna nuk janë të disponueshme, ose janë mjaft të plota dhe me cilësi të pamjaftueshme, OLAP nuk do të ndihmojë. Kjo do të thotë, OLAP është vetëm një shtesë mbi të dhënat, dhe nëse nuk ka asnjë, bëhet një gjë e padobishme.

Shumica e të dhënave për aplikimet OLAP vijnë nga sisteme të tjera. Sidoqoftë, në disa aplikacione (për shembull, për planifikimin ose buxhetimin), të dhënat mund të gjenerohen drejtpërdrejt në aplikimet OLAP. Kur të dhënat vijnë nga aplikacione të tjera, zakonisht është e nevojshme që të dhënat të ruhen në një formë të veçantë, të kopjuar për aplikacionin OLAP. Prandaj, është e këshillueshme që të krijohen magazina të të dhënave.

Duhet të theksohet se termi OLAP është i lidhur pazgjidhshmërisht me termin Magazina e të Dhënave. Depoja e të dhënave është një koleksion i të dhënave specifike për domenin, i kufizuar në kohë dhe i pandryshueshëm për të mbështetur procesin e vendimmarrjes së menaxhimit. Të dhënat në magazinë vijnë nga sistemet operacionale (sistemet OLTP), të cilat janë krijuar për të automatizuar proceset e biznesit; magazina mund të rimbushet nga burime të jashtme, për shembull, raporte statistikore.

Përkundër faktit se ato përmbajnë informacion të qëllimshëm të tepërt, i cili tashmë është në bazat e të dhënave ose skedarët e sistemeve operative, ruajtja e të dhënave është e nevojshme sepse:

  • fragmentimi i të dhënave, ruajtja në formate të ndryshme DBMS;
  • performanca e përmirësuar e marrjes së të dhënave
  • nëse në ndërmarrje të gjitha të dhënat ruhen në një server të bazës së të dhënave qendrore (gjë që është jashtëzakonisht e rrallë), analisti ndoshta nuk do të kuptojë strukturat e tyre komplekse, ndonjëherë konfuze
  • pyetje komplekse analitike për informacionin operacional ngadalësojnë punën aktuale të kompanisë, duke bllokuar tabelat për një kohë të gjatë dhe duke kapur burimet e serverit
  • aftësia për të pastruar dhe pajtuar të dhënat
  • është e pamundur ose shumë e vështirë të analizohen të dhënat e sistemeve operacionale drejtpërdrejt;

Qëllimi i depove është të sigurojë lëndët e para për analiza në një vend dhe në një strukturë të thjeshtë, të kuptueshme. Kjo do të thotë, koncepti i Depove të të Dhënave nuk është një koncept i analizës së të dhënave, përkundrazi është një koncept i përgatitjes së të dhënave për analiza. Ai përfshin zbatimin e një burimi të vetëm të integruar të të dhënave.

Produktet OLAP: Arkitektura

Kur përdorni produkte OLAP, 2 pyetje janë të rëndësishme: si dhe ku mbaj dhe të procesojmë të dhënave. Arkitekturat OLAP dallohen në varësi të mënyrës se si zbatohen këto dy procese. Ekzistojnë 3 mënyra për të ruajtur të dhënat për OLAP dhe 3 mënyra për të përpunuar këto të dhëna. Shumë prodhues ofrojnë disa opsione, disa po përpiqen të provojnë se qasja e tyre është e vetmja më e matur. Kjo, natyrisht, është absurde. Sidoqoftë, shumë pak produkte mund të funksionojnë me efikasitet në më shumë se një mënyrë.

Opsionet e ruajtjes së të dhënave OLAP

Ruajtja në këtë kontekst nënkupton përmbajtjen e të dhënave në një gjendje të përditësuar vazhdimisht.

  • Baza e të dhënave relacionale: Kjo është zgjedhja tipike nëse ndërmarrja ruan kredencialet në një RDB. Në shumicën e rasteve, të dhënat duhet të ruhen në një strukturë të çrregulluar (skema e yjeve është më e pranueshme). Një bazë e të dhënave e normalizuar është e papranueshme për shkak të performancës shumë të ulët të pyetjeve kur gjenerohen vlera të grumbulluara për OLAP (shpesh totalet ruhen në tabela të përmbledhura).
  • Skedarët e bazës së të dhënave në kompjuterin e klientit (kioska ose pajisje të dhënash): Këto të dhëna mund të para-përhapen ose të gjenerohen sipas kërkesës në kompjuterët e klientëve.

Baza e të dhënave shumëdimensionale: Supozon se të dhënat ruhen në një bazë të dhënash shumëdimensionale në një server. Mund të përfshijë të dhëna të marra dhe të përmbledhura nga sistemet e tjera dhe bazat e të dhënave relacionale, skedarët e përdoruesve përfundimtarë, etj. Në shumicën e rasteve, bazat e të dhënave shumëdimensionale ruhen në disk, por disa produkte gjithashtu lejojnë përdorimin e RAM-it, duke llogaritur të dhënat më të përdorura në fluturo ". Në një numër shumë të vogël të produkteve të bazuara në bazat e të dhënave shumëdimensionale, redaktime të shumta të të dhënave janë të mundshme, shumë produkte lejojnë redaktime të vetme, por lexime të shumta të të dhënave, ndërsa të tjerat janë të kufizuara vetëm për lexim.

Këto tre vende magazinimi kanë kapacitete të ndryshme magazinimi dhe janë rregulluar sipas rendit në rënie të kapacitetit. Ato gjithashtu kanë karakteristika të ndryshme të performancës së pyetjeve: bazat e të dhënave relacionale janë shumë më të ngadalta se dy të fundit.

Opsionet e përpunimit të të dhënave OLAP

Ekzistojnë 3 opsione të njëjta të përpunimit të të dhënave:

  • Përdorimi i SQL: Ky opsion, natyrisht, përdoret kur ruani të dhënat në një RDB. Sidoqoftë, SQL nuk lejon llogaritjet shumëdimensionale në një pyetje të vetme, kështu që pyetjeve komplekse SQL kërkohen për të arritur asgjë më shumë sesa funksionalitet normal shumëdimensional. Sidoqoftë, kjo nuk i ndalon zhvilluesit të përpiqen. Në shumicën e rasteve, ata kryejnë një numër të kufizuar të llogaritjeve përkatëse SQL, me rezultate që mund të merren nga përpunimi shumëdimensional i të dhënave ose nga makina klient. Alsoshtë gjithashtu e mundur të përdoret kujtesë e gjallë që mund të ruajë të dhëna duke përdorur më shumë se një kërkesë: kjo përmirësoi në mënyrë dramatike përgjigjen.
  • Përpunimi shumëdimensional nga ana e klientit: Produkti i klientit OLAP i bën llogaritjet më vete, por ky përpunim është i disponueshëm vetëm nëse përdoruesit kanë kompjuterë relativisht të fuqishëm.

Përpunimi shumëdimensional nga ana e serverit: Ky është një vend i njohur për llogaritjen shumëdimensionale në aplikacionet OLAP të klient-serverit dhe përdoret në shumë produkte. Performanca është zakonisht e mirë sepse shumica e llogaritjeve tashmë janë bërë. Sidoqoftë, kjo kërkon shumë hapësirë ​​në disk.

Matrica e arkitekturës OLAP

Prandaj, duke kombinuar opsionet e ruajtjes / përpunimit, mund të merrni një matricë të arkitekturave të sistemeve OLAP. Prandaj, teorikisht, mund të ketë 9 kombinime të këtyre metodave. Sidoqoftë, meqenëse 3 prej tyre nuk kanë sens të përbashkët, në realitet ka vetëm 6 mundësi për ruajtjen dhe përpunimin e të dhënave OLAP.

Opsionet e ruajtjes shumëdimensionale
të dhënave

Variantet
shumëdimensionale
përpunimin e të dhënave

Baza e të dhënave relacionale

Baza e të dhënave shumëdimensionale nga ana e serverit

Kompjuter klienti

Shkalla e kartezës

Përpunimi shumëdimensional i serverit

Crystal Holos (modaliteti ROLAP)

Serveri IBM DB2 OLAP

CA EUREKA: Strategjia

Informix MetaCube

Media Speedware / MR

Shërbimet e Microsoft Analysis

Oracle Express (modaliteti ROLAP)

Server Pilot Analiza

Aplikoni iTM1

Holo kristal

Vendimi i Comshare

Hyperion Essbase

Oracle Express

Media Speedware / M

Shërbimet e Microsoft Analysis

Serveri i Ndërmarrjeve PowerPlay

Server Pilot Analiza

Aplikoni iTM1

Përpunimi shumëdimensional në kompjuterin e klientit

Zbuluesi i Orakullit

Informix MetaCube

Pasqyrë dimensionale

Ndërmarrja Hyperion

Cognos PowerPlay

Express personal

iTM1 Perspektivat

Meqenëse është ruajtja ajo që përcakton përpunimin, është e zakonshme të grupoheni sipas opsioneve të ruajtjes, domethënë:

  • Produktet ROLAP në sektorët 1, 2, 3
  • OLAP i desktopit - në sektorin 6

Produktet MOLAP - në sektorët 4 dhe 5

Produktet HOLAP (duke lejuar ruajtjen e të dhënave shumëdimensionale dhe relacionale) - në 2 dhe 4 (me shkronja të pjerrëta)

Kategoritë e produkteve OLAP

Ka më shumë se 40 ofrues të OLAP, megjithëse të gjithë ata nuk mund të konsiderohen konkurrentë, sepse aftësitë e tyre janë shumë të ndryshme dhe, në fakt, ata punojnë në segmente të ndryshme të tregut. Ato mund të grupohen në 4 kategori themelore, të cilat ndryshojnë në bazë të koncepteve: funksionalitet kompleks - funksionalitet i thjeshtë, performancë - hapësirë ​​në disk. Convenientshtë i përshtatshëm për të nxjerrë kategoritë si një katror sepse tregon qartë marrëdhënien midis tyre. Një tipar dallues i secilës prej kategorive paraqitet në anën e saj, dhe ngjashmëritë me të tjerat - në anët ngjitur, prandaj, kategoritë në anët e kundërta janë thelbësisht të ndryshme.

Veçoritë

Përparësitë

disavantazhet

Përfaqësuesit

OLAP i aplikuar

Aplikime të plota, të pasura me funksionalitet. Pothuajse të gjithë kërkojnë një bazë të dhënash shumëdimensionale, megjithëse disa punojnë edhe me një bazë të dhënash relacionale. Shumë nga kjo kategori aplikimesh janë të specializuara, për shembull, shitjet, prodhimi, bankat, buxhetimi, konsolidimi financiar, analiza e shitjeve

Aftësia për t'u integruar me aplikacione të ndryshme

Niveli i lartë i funksionalitetit

Niveli i lartë i fleksibilitetit dhe shkallëzueshmërisë

Kompleksiteti i aplikimit (nevoja për trajnim të përdoruesve)

Cmim i larte

Zgjidhje Hyperion

Vendimet kristalore

Ndërtuesit e informacionit

Produkti bazohet në një strukturë të të dhënave jo-relacionale që siguron ruajtje, përpunim dhe prezantim shumëdimensional të të dhënave. Të dhënat në procesin e analizës zgjidhen ekskluzivisht nga një strukturë shumëdimensionale. Pavarësisht nivelit të lartë të hapjes, furnizuesit i bindin klientët të blejnë veglat e tyre të veglave.

Performancë e lartë (llogaritjet e përmbledhjes së shpejtë dhe transformimet e ndryshme shumëdimensionale për çdo dimension). Koha mesatare e përgjigjes ndaj një pyetjeje analitike ad hoc kur përdorni një bazë të dhënash shumëdimensionale është zakonisht 1-2 urdhra të madhësisë më pak se në rastin e një RDB

Niveli i lartë i hapjes: një numër i madh i produkteve me të cilat integrimi është i mundur

Ata përballojnë me lehtësi detyrat e përfshirjes së funksioneve të ndryshme të integruara në modelin e informacionit, kryerjen e analizave të specializuara nga përdoruesi, etj.

Nevoja për një hapësirë ​​të madhe në disk për ruajtjen e të dhënave (për shkak të tepricës së të dhënave që ruhen). Ky është një përdorim jashtëzakonisht joefikas i kujtesës - për shkak të denormalizimit dhe grumbullimit të kryer më parë, sasia e të dhënave në një bazë të dhënash shumëdimensionale korrespondon me 2.5-100 herë më pak se vëllimi i të dhënave të hollësishme origjinale. Në çdo rast, MOLAP nuk lejon punën me bazat e të dhënave të mëdha. Kufiri i vërtetë është një bazë prej 10-25 gigabajt

Shpërthimi i mundshëm i bazës së të dhënave - rritje e papritur, e mprehtë, joproporcionale e vëllimit të tij

Mungesa e fleksibilitetit kur është e nevojshme të modifikohen strukturat e të dhënave. Çdo ndryshim në strukturën e dimensioneve kërkon pothuajse gjithmonë një ristrukturim të plotë të hiperkubit.

Për bazat e të dhënave shumëdimensionale, aktualisht nuk ka standarde uniforme për ndërfaqen, gjuhë për përshkrimin dhe manipulimin e të dhënave

Hyperion (Essbase)

DOLAP (OLAP i desktopit)

Produkte të klientit OLAP që janë mjaft të lehtë për t'u zbatuar dhe kanë kosto të ulët për vend

Ne po flasim për një përpunim të tillë analitik, ku hiperkubet janë të vegjël, dimensioni i tyre është i vogël, nevojat janë modeste, dhe për një përpunim të tillë analitik, një makinë personale në desktop është e mjaftueshme.

Qëllimi i prodhuesve në këtë treg është të automatizojnë qindra dhe mijëra vende pune, por përdoruesit duhet të bëjnë një analizë mjaft të thjeshtë. Blerësit shpesh udhëzohen të blejnë më shumë vende pune sesa është e nevojshme

Integrim i mirë i bazës së të dhënave: shumëdimensionale, relacionale

Aftësia për të bërë blerje komplekse, e cila zvogëlon koston e projekteve të zbatimit

Lehtësia e përdorimit të aplikacioneve

Funksionalitet shumë i kufizuar (nuk krahasohet në këtë drejtim me produktet e specializuara)

Fuqia shumë e kufizuar (vëllime të vogla të të dhënave, pak matje)

Cognos (PowerPlay)

Objektet e Biznesit

Vendimet kristalore

Ky është sektori më i vogël i tregut.

Të dhënat e hollësishme mbeten aty ku ishin fillimisht - në një bazë të dhënash relacionale; disa agregate ruhen në të njëjtën bazë të dhënash në tabela shërbimi të krijuara posaçërisht

I aftë të trajtojë sasi shumë të mëdha të të dhënave (ruajtje ekonomike)

Siguron një mënyrë funksionimi me shumë përdorues, duke përfshirë modalitetin e redaktimit, jo vetëm leximin

Niveli më i lartë i mbrojtjes së të dhënave dhe mundësi të mira për diferencimin e të drejtave të aksesit

Ndryshimet e shpeshta në strukturën e matjes janë të mundshme (nuk kërkojnë riorganizim fizik të bazës së të dhënave)

Performanca e dobët, në mënyrë të konsiderueshme inferiore në shpejtësinë e përgjigjes ndaj atyre shumëdimensionale (përgjigja ndaj pyetjeve komplekse matet në minuta apo edhe orë dhe jo sekonda). Ata janë krijues raportesh më miqësorë për përdoruesit sesa mjete analitike ndërvepruese

Kompleksiteti i produkteve. Kërkon kosto të konsiderueshme të shërbimit të TI -së. Sistemet relacionale kërkojnë skemë të kujdesshme të bazës së të dhënave dhe akordim të indeksit për të arritur performancë të krahasueshme me MOLAP, që do të thotë shumë përpjekje nga ana e DBA -ve.

I kushtueshëm për t’u zbatuar

Kufizimet e SQL mbeten një realitet, i cili parandalon shumë funksione të integruara që sigurohen lehtësisht në sisteme të bazuara në përfaqësimin e të dhënave shumëdimensionale në një RDBMS.

Avantazhi i informacionit

Informix (MetaCube)

Duhet të theksohet se konsumatorët e produkteve hibride që lejojnë përzgjedhjen e mënyrës ROLAP dhe MOLAP, të tilla si Microsoft Analysis Services, OracleExpress, Crystal Holos, IBM DB2 OLAPServer, pothuajse gjithmonë zgjedhin modalitetin MOLAP.

Secila prej kategorive të paraqitura ka pikat e forta dhe të dobëta, nuk ka vetëm një zgjedhje optimale... Zgjedhja prek 3 aspekte të rëndësishme: 1) performancën; 2) hapësirë ​​në disk për ruajtjen e të dhënave; 3) aftësitë, funksionalitetin dhe veçanërisht shkallëzueshmërinë e zgjidhjes OLAP. Në të njëjtën kohë, është e nevojshme të merren parasysh vëllimet e të dhënave të përpunuara, fuqia e teknologjisë, nevojat e përdoruesve dhe të kërkohet një kompromis midis shpejtësisë dhe tepricës së hapësirës në disk të zënë nga baza e të dhënave, e thjeshtë dhe shumëfunksionale.

Klasifikimi i Dyqaneve të të Dhënave në përputhje me madhësinë e bazës së të dhënave të synuar

Disavantazhet e OLAP

Ashtu si çdo teknologji OLAP, ajo gjithashtu ka të metat e saj: kërkesa të larta për pajisje, trajnim dhe njohuri të personelit administrativ dhe përdoruesve përfundimtarë, kosto të larta për zbatimin e projektit të zbatimit (si monetar ashtu edhe kohor, intelektual).

Zgjedhja e një produkti OLAP

Zgjedhja e produktit të duhur OLAP është e vështirë, por shumë e rëndësishme nëse dëshironi që projekti juaj të mos dështojë.

Siç mund ta shihni, ndryshimet e produkteve qëndrojnë në shumë fusha: funksionale, arkitektonike, teknike. Disa produkte janë mjaft të kufizuara në personalizim. Disa janë të dizajnuara për fusha të specializuara: marketing, shitje, financa. Ka produkte për qëllime të përgjithshme, të cilat nuk janë të destinuara për përdorim në aplikim, të cilat duhet të jenë mjaft fleksibile. Si rregull, produkte të tilla janë më të lira se ato të specializuara, por ka më shumë kosto zbatimi. Gama e produkteve OLAP është shumë e gjerë - nga mjetet më të thjeshta për ndërtimin e tabelave kryesore dhe tabelave që janë pjesë e produkteve të zyrës, deri tek analiza e të dhënave dhe kërkimi i modeleve, kostoja e të cilave është dhjetëra mijëra dollarë.

Ashtu si me çdo fushë, nuk mund të ketë udhëzime përfundimtare për zgjedhjen e mjeteve në fushën OLAP. Mund të përqendroheni vetëm në një numër pikash kryesore dhe të përputheni me aftësitë e softuerit të ofruara me nevojat e organizatës. Një gjë është e rëndësishme: nëse nuk mendoni se si do të përdorni mjetet OLAP, rrezikoni të keni një dhimbje koke të fortë.

Në procesin e përzgjedhjes, është e nevojshme të merren parasysh 2 pyetje:

  • vlerësoni nevojat dhe aftësitë e ndërmarrjes
  • vlerësoni furnizimin ekzistues në treg, tendencat e zhvillimit janë gjithashtu të rëndësishme

Atëherë e gjithë kjo mund të krahasohet dhe, në fakt, bëri një zgjedhje.

Nevojat e vlerësimit

Ju nuk mund të bëni një zgjedhje racionale të një produkti pa e kuptuar se për çfarë do të përdoret. Shumë kompani duan "produktin më të mirë" pa një kuptim të qartë se si duhet të përdoret.

Në mënyrë që projekti të zbatohet me sukses, CFO duhet të paktën të formulojë saktë dëshirat dhe kërkesat e tij drejtuesit dhe specialistëve të shërbimit të automatizimit. Shumë probleme lindin për shkak të gatishmërisë dhe informacionit të pamjaftueshëm për zgjedhjen e OLAP, specialistët e IT dhe përdoruesit përfundimtarë përjetojnë vështirësi në komunikim vetëm sepse manipulojnë koncepte dhe terma të ndryshëm në një bisedë dhe parashtrojnë preferenca konfliktuale. Keni nevojë për qëndrueshmëri në qëllim brenda kompanisë.

Disa faktorë janë bërë tashmë të dukshëm pas leximit të përmbledhjes së kategorive të produkteve OLAP, domethënë:

Aspektet teknike

  • Burimet e të dhënave: magazina e të dhënave të korporatave, sistemi OLTP, skedarët e tabelave, bazat e të dhënave relacionale. Mundësia e lidhjes së mjeteve OLAP me të gjitha DBMS të përdorura në organizatë. Siç tregon praktika, integrimi i produkteve të ndryshme në një sistem operativ të qëndrueshëm është një nga çështjet më të rëndësishme, dhe zgjidhja e tij në disa raste mund të shoqërohet me probleme të mëdha. Shtë e nevojshme të kuptohet se sa e lehtë dhe e besueshme është të integrohen mjetet OLAP me DBMS ekzistuese në organizatë. Alsoshtë gjithashtu e rëndësishme të vlerësoni mundësitë e integrimit jo vetëm me burimet e të dhënave, por edhe me aplikacionet e tjera në të cilat mund të keni nevojë të eksportoni të dhëna: e-mail, aplikacione zyre
  • Ndryshueshmëria e të dhënave që merret parasysh
  • Platforma e serverit: NT, Unix, AS / 400, Linux - por mos insistoni që produktet e specifikuara të OLAP të funksionojnë në platforma të dyshimta ose që po vdesin që po përdorni akoma
  • Standardet nga ana e klientit dhe shfletuesit
  • Arkitektura e vendosshme: rrjetit lokal dhe PC modem komunikimi, klient / server me shpejtësi të lartë, intranet, ekstranet, internet
  • Karakteristikat ndërkombëtare: mbështetje me shumë monedha, operacione shumëgjuhëshe, ndarja e të dhënave, lokalizimi, licencimi, përditësimi i Windows

Sasitë e informacionit hyrës që janë në dispozicion dhe të cilat do të shfaqen në të ardhmen

Anëtarët

  • Fusha e aplikimit: analiza e shitjeve / marketingut, buxhetimi / planifikimi, analiza e treguesve të performancës, analiza e raporteve të kontabilitetit, analiza cilësore, gjendja financiare, formimi i materialeve analitike (raporteve)
  • Numri i përdoruesve dhe vendndodhja e tyre, kërkesat për ndarjen e të drejtave të aksesit në të dhëna dhe funksione, fshehtësia (konfidencialiteti) i informacionit
  • Pamja e përdoruesit: menaxhmenti i lartë, financa, marketingu, burimet njerëzore, shitjet, prodhimi, etj.
  • Eksperienca e perdoruesit. Niveli i aftësive të përdoruesit. Konsideroni ofrimin e trajnimit. Veryshtë shumë e rëndësishme që aplikacioni i klientit OLAP të jetë i tillë që përdoruesit të ndihen të sigurt dhe ta përdorin atë në mënyrë efektive.

Karakteristikat kryesore: nevoja për rishkrim të të dhënave, llogaritja e shpërndarë, konvertime komplekse të monedhës, nevoja për shtypjen e raporteve, ndërfaqja e tabelave, kompleksiteti i logjikës së aplikimit, dimensioni i kërkuar, llojet e analizave: statistikore, kërkimi i qëllimeve, çfarë-nëse analiza

Zbatimi

  • Kush do të zbatojë dhe operojë: konsulentë të jashtëm, IT të brendshëm ose përdorues përfundimtarë
  • Buxheti: softuer, hardueri, shërbimet, transmetimi i të dhënave. Mos harroni se licencat e produkteve OLAP janë vetëm një pjesë e vogël e kostos totale të projektit. Kostot e zbatimit dhe harduerit mund të jenë më të mëdha se tarifat e licencës, dhe kostot afatgjata të mbështetjes, mirëmbajtjes dhe administrimit janë pothuajse me siguri më të larta. Dhe nëse keni marrë vendimin e gabuar për të blerë produktin e gabuar vetëm sepse është më i lirë, përfundimisht mund të keni një kosto totale më të lartë të projektit për shkak të mirëmbajtjes, administrimit dhe / ose kostove më të larta të harduerit, ndërsa ka të ngjarë të merrni nivel më të ulët të përfitimeve të biznesit Me Kur vlerësoni kostot totale, sigurohuni që të bëni pyetjet e mëposhtme: Sa e gjerë është përzgjedhja e burimeve për zbatim, trajnim dhe mbështetje? A është stoku i përgjithshëm potencial (punonjësit, kontraktorët, konsulentët) i prirur ndaj rritjes ose zvogëlimit? Sa gjerësisht mund ta përdorni përvojën tuaj profesionale industriale?

Përkundër faktit se kostoja e sistemeve analitike edhe sot mbetet mjaft e lartë, dhe metodologjitë dhe teknologjitë për zbatimin e sistemeve të tilla janë ende në fazën e formimit të tyre, edhe sot, efekti ekonomik i siguruar prej tyre tejkalon ndjeshëm efektin e traditës sistemet operative.

Efekti nga organizim korrekt, planifikimi strategjik dhe operacional i zhvillimit të biznesit është i vështirë të vlerësohet paraprakisht në shifra, por është e qartë se mund të tejkalojë kostot e zbatimit të sistemeve të tilla me dhjetëra apo edhe qindra herë. Sidoqoftë, nuk duhet gabuar. Efekti sigurohet jo nga vetë sistemi, por nga njerëzit që punojnë me të. Prandaj, deklaratat e llojit: "sistemi i depove të të dhënave dhe teknologjitë OLAP do të ndihmojnë menaxherin të marrë vendimet e duhura" nuk janë plotësisht të sakta. Sistemet analitike moderne nuk janë sisteme inteligjence artificiale dhe ata as nuk mund të ndihmojnë e as të pengojnë vendimmarrjen. Qëllimi i tyre është t'i sigurojnë menaxherit të gjithë informacionin e nevojshëm për marrjen e një vendimi në një formë të përshtatshme në kohën e duhur. Dhe çfarë informacioni do të kërkohet dhe cili vendim do të merret në bazë të tij varet vetëm nga personi specifik që e përdor atë.

Një gjë mbetet për t'u thënë, këto sisteme mund të ndihmojnë në zgjidhjen e shumë problemeve të biznesit dhe mund të kenë efekte pozitive të gjera. Mbetet vetëm të presim se kush është i pari që kupton përparësitë e kësaj qasjeje dhe do të jetë përpara të tjerëve.



Artikujt e lidhur: