Vad är Olap-teknik. Analytiska OLAP-system


Den största skillnaden mellan fakta och information är att vi tar emot och tar del av uppgifterna, och vi kan använda informationen till vår fördel. Grovt sett är information analyserad och systematiserad data. Tack vare den information som mottagits i tid klarar många företag att stå emot både finanskrisen och den hårdaste konkurrensen. Det räcker inte att samla fakta och ha all data du behöver. Du måste också kunna analysera dem. Olika stödsystem har utvecklats för att göra det lättare för människor att fatta viktiga affärsbeslut. Det är för detta ändamål som olika komplexa system har utvecklats som låter dig analysera stora mängder heterogena data och omvandla dem till information användbar för en affärsanvändare. Det nya området business intelligence syftar till att förbättra processhanteringen av affärssystem genom användning av datalager och teknologier.

Marknaden för informationssystem för företag erbjuder idag ett brett utbud av lösningar som hjälper ett företag att organisera förvaltningsredovisning, säkerställa operativ ledning av produktion och försäljning och effektivt interagera med kunder och leverantörer.

En separat nisch på marknaden för affärssystem upptas av analytiska mjukvaruprodukter utformade för att stödja beslutsfattande på strategisk nivå för företagsledning. Huvudskillnaden mellan sådana verktyg och operativa ledningssystem är att de senare tillhandahåller företagsledning i ett "fungerande läge", det vill säga implementeringen av ett väldefinierat produktionsprogram, medan analytiska system på strategisk nivå hjälper företagsledningen att arbeta fram lösningar i ett "utvecklingsläge".

Omfattningen av de förändringar som genomförs kan variera från djupgående omstruktureringar till partiell förnyelse av teknik vid vissa produktionsanläggningar, men i vilket fall som helst överväger beslutsfattare utvecklingsalternativ, som företagets öde beror på på lång sikt.

Oavsett hur kraftfullt och utvecklat företagets informationssystem är, kan det inte hjälpa till att lösa dessa problem, för det första eftersom det är inställt på stationära, väletablerade affärsprocesser, och för det andra är det inte, och kan inte vara, information för fatta beslut om nya affärsområden, ny teknik, nya organisatoriska beslut.

Tack vare OLAP (On-Line Analytical Processing) databehandlingsteknik kan vilken organisation som helst nästan omedelbart (inom fem sekunder) få den data den behöver för att fungera. OLAP kan sammanfattas i fem nyckelord.

FAST (Snabb) - detta betyder att sökningen och leveransen av nödvändig information inte tar mer än fem sekunder. De enklaste frågorna bearbetas på en sekund, och endast ett fåtal komplexa frågor har en bearbetningstid på mer än tjugo sekunder. För att uppnå detta resultat används olika metoder, från speciella former av datalagring till omfattande förberäkningar. Således kan du få en rapport på en minut, som tidigare tog dagar att förbereda.

ANALYS (Analytisk) säger att systemet kan göra vilken analys som helst, både statistisk och logisk, och lagrar den sedan i en tillgänglig form.

DELAD betyder att systemet ger den nödvändiga integriteten, ner till cellnivå

MULTIDIMENSIONELL - Detta är den huvudsakliga egenskapen hos OLAP. Systemet måste fullt ut stödja hierarkier och flera hierarkier, eftersom detta är det mest logiska sättet att analysera både verksamheten och aktiviteterna i organisationer.

INFORMATION Den information du behöver ska levereras där den behövs.

Under arbetet i en organisation samlas alltid data relaterade till dess verksamhetsområde, som ibland lagras på helt andra platser, och det är inte lätt och tidskrävande att sammanföra dem. Det är för att påskynda insamlingen av data för att testa nya affärshypoteser som teknologin för interaktiv analytisk databehandling eller OLAP utvecklades. Huvudsyftet med sådana OLAP-system är att snabbt svara på godtyckliga användarförfrågningar. Ett sådant behov uppstår ofta när man utvecklar något viktigt affärsprojekt, när utvecklaren behöver en arbetshypotes som har uppstått. Oftast bör informationen användaren behöver presenteras i form av något slags beroende – till exempel hur försäljningsvolymen beror på produktkategori, på försäljningsregion, på säsong osv. Tack vare OLAP har han möjlighet att omedelbart ta emot nödvändiga data i önskad layout för den valda perioden.

Interaktiv OLAP-teknik förvandlar enorma högar med rapporter och massor av data till användbar och korrekt information som hjälper en anställd att fatta ett välgrundat affärs- eller ekonomiskt beslut vid rätt tidpunkt.

Tack vare OLAP ökar dessutom bearbetningseffektiviteten, och användaren kan få stora volymer sorterad (aggregerad) information nästan omedelbart. Tack vare OLAP kan användaren tydligt se hur effektivt hans organisation fungerar, har förmågan att snabbt och flexibelt reagera på externa förändringar och har förmågan att minimera de ekonomiska förlusterna för sin organisation. OLAP tillhandahåller korrekt information som förbättrar beslutsfattandet.

Den enda nackdelen med business intelligence-system är deras höga kostnad. Skapandet av ett personligt informationslager tar både tid och mycket pengar.

Användningen av OLAP-teknik i affärer gör att du snabbt kan få den nödvändiga informationen, som på användarens begäran kan presenteras i den vanliga formen - rapporter, grafer eller tabeller.

Systemintegrationsrutiner för affärsstrukturer baseras på användning av gemensamma ERP-, CRM- och SCM-lösningar. I många fall levereras system av olika tillverkare och den importerade datan måste genomgå en process av dataavstämning och presentation i form av heterogena data. I en affärsmiljö antas ett entydigt krav - en fullständig analys av data, vilket innebär att man ser de konsoliderade rapporterna från olika synvinklar.

Olika leverantörer har olika presentationsmekanismer. Den heterogena representationsproceduren involverar extraktion, transformation och laddning (ETL). Till exempel, i Microsoft SQL Server 2005 Analysis Services, implementeras datakonsolideringsproblemet med hjälp av Data Source Views, som är typer av datakällor som beskriver analytiska vymodeller.

Affärsapplikationer baserade på OLAP-teknologier, produktexempel. De vanligaste tillämpningarna av OLAP-tekniker är:

Dataanalys.

Den uppgift som OLAP-verktyg ursprungligen användes för och fortfarande är den mest populära. En multidimensionell datamodell, förmågan att analysera betydande mängder data och ett snabbt svar på förfrågningar gör sådana system oumbärliga för att analysera försäljning, marknadsföringsaktiviteter, distribution och andra uppgifter med en stor mängd initial data.

Produktexempel: Microsoft Excel Pivot Tables, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Ekonomisk planering och budgetering.

En multidimensionell modell gör att du samtidigt kan mata in data och enkelt analysera den (till exempel plan-faktaanalys). Därför använder ett antal moderna produkter i klassen CPM (Corporate Performance Management) OLAP%-modellen. En viktig uppgift är flerdimensionell tillbakaberäkning (backsolve, breakback, writeback), som låter dig beräkna de nödvändiga ändringarna i detaljerade celler när det aggregerade värdet ändras. Det är ett vad-om-analysverktyg. att spela olika varianter av evenemang vid planering.

Produktexempel: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

Finansiell konsolidering.

Att konsolidera data i enlighet med internationella redovisningsstandarder, med hänsyn tagen till ägarandelar, olika valutor och interna omsättningar, är en angelägen uppgift i samband med skärpta krav på revisionsorgan (SOX, Basel II) och företag som går in i börsintroduktioner. OLAP-tekniker gör det möjligt att påskynda beräkningen av konsoliderade rapporter och öka transparensen i hela processen.

Produktexempel: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Datalager och OLAP-tekniker (On-Line Analytical Processing).
är väsentliga delar av affärsbeslutsstöd, som alltmer blir en integrerad del av alla branscher. Användningen av OLAP-teknologier som ett verktyg för business intelligence ger mer kontroll och snabb tillgång till strategiska
information som bidrar till ett effektivt beslutsfattande.
Detta ger möjlighet att simulera verkliga prognoser och mer effektiv användning av resurser. OLAP gör det möjligt för en organisation att reagera snabbare på marknadens krav.

Bibliografi:

1. Erik Thomsen. OLAP-lösningar: Bygga flerdimensionella informationssystem andra upplagan. Wiley Computer Publishing John Wiley & Sons, Inc., 2002.

2. OLAP Council white paper, http://www.olapcouncil.org/research/whtpaply.htm

3. Gerd Stumme och Bernhard Ganter. Formell konceptanalys _ Matematiska grunder.

Konceptet med OLAP-teknik formulerades av Edgar Codd 1993.

Denna teknik är baserad på konstruktionen av flerdimensionella datamängder - de så kallade OLAP-kuberna (inte nödvändigtvis tredimensionella, som man kan dra slutsatsen från definitionen). Syftet med att använda OLAP-teknik är att analysera data och presentera denna analys i en form som är bekväm för ledningspersonal att uppfatta och fatta beslut baserat på dem.

Nyckelkrav för multivariat analysapplikationer:

  • - förse användaren med analysresultaten inom rimlig tid (inte mer än 5 s.);
  • - Fleranvändaråtkomst till data;
  • - multidimensionell datapresentation;
  • - Möjligheten att komma åt all information oavsett lagringsplats och volym.

OLAP-systemverktyg ger möjlighet att sortera och välja data enligt specificerade förhållanden. Olika kvalitativa och kvantitativa villkor kan specificeras.

Den huvudsakliga datamodellen som används i många verktyg för att skapa och underhålla databaser - DBMS, är relationsmodellen. Data i den presenteras i form av en uppsättning tvådimensionella relationstabeller länkade av nyckelfält. För att eliminera dubbelarbete, inkonsekvens, minska arbetskostnaderna för att underhålla databaser, används en formell apparat för normalisering av enhetstabeller. Användningen är dock associerad med ytterligare tid som läggs på att generera svar på databasfrågor, även om minnesresurser sparas.

En multidimensionell datamodell representerar det undersökta objektet i form av en flerdimensionell kub, oftare används en tredimensionell modell. Dimensioner eller attributattribut plottas längs kubens axlar eller ytor. Basattribut är fyllningen av kubcellerna. En flerdimensionell kub kan representeras av en kombination av tredimensionella kuber för att underlätta uppfattning och presentation i bildandet av rapporterande och analytiska dokument och multimediapresentationer baserade på material för analytiskt arbete i beslutsstödssystemet.

Inom ramen för OLAP-teknologier, baserat på det faktum att den multidimensionella presentationen av data kan organiseras både med hjälp av relationella DBMS och multidimensionella specialiserade verktyg, finns det tre typer av multidimensionella OLAP-system:

  • - flerdimensionell OLAP-MOLAP;
  • - relationell (Relation) OLAP-ROLAP;
  • - blandad eller hybrid (Hibrid) OLAP-HOLAP.

I flerdimensionella DBMS:er organiseras data inte i form av relationstabeller, utan i form av ordnade flerdimensionella arrayer i form av hyperkuber, när all lagrad data måste ha samma dimension, vilket innebär behovet av att utgöra den mest kompletta basen för mätningar. Data kan organiseras i form av polykuber, i denna version lagras värdena för varje indikator med sin egen uppsättning mätningar, databehandling utförs av systemets eget verktyg. Lagringsstrukturen i detta fall är förenklad, eftersom det finns inget behov av en flerdimensionell eller objektorienterad lagringsyta. De enorma arbetskostnaderna för att skapa modeller och system för att transformera data från en relationsmodell till en objektmodell minskar.

Fördelarna med MOLAP är:

  • - snabbare än med ROLAP som tar emot svar på förfrågningar - tiden som spenderas är en till två storleksordningar mindre;
  • – Många inbyggda funktioner är svåra att implementera på grund av SQL-begränsningar.

MOLAP-restriktioner inkluderar:

  • - Relativt liten storlek på databaser.
  • - på grund av denormalisering och preliminär aggregering använder flerdimensionella arrayer 2,5-100 gånger mer minne än originaldata (minneskonsumtionen växer exponentiellt med en ökning av antalet mätningar);
  • - Det finns inga standarder för gränssnittet och verktygen för datamanipulation;
  • - det finns begränsningar vid laddning av data.

Ansträngningen som krävs för att skapa flerdimensionell data ökar dramatiskt. i denna situation finns det praktiskt taget inga specialiserade medel för att objektifiera den relationsdatamodell som finns i informationslagringen. Svarstiden på frågor kan ofta inte uppfylla kraven för OLAP-system.

Fördelarna med ROLAP-system är:

  • - Möjligheten till onlineanalys av data som finns direkt i datalagret, eftersom de flesta källdatabaser är relationella;
  • - med en variabel dimension av problemet, RO-LAP vinna, eftersom ingen fysisk omorganisation av databasen krävs;
  • - ROLAP-system kan använda mindre kraftfulla klientstationer och servrar, och servrarna bär huvuddelen av bördan av att bearbeta komplexa SQL-frågor;
  • - nivån på informationsskydd och differentiering av åtkomsträttigheter i relationella DBMS är ojämförligt högre än i flerdimensionella.

Nackdelarna med ROLAP-system är lägre prestanda, behovet av noggrann utarbetning av databasscheman, speciell justering av index, analys av frågestatistik och beaktande av analysslutsatserna vid uppdatering av databasscheman, vilket leder till betydande extra arbetskostnader.

Uppfyllelse av dessa villkor gör det möjligt att, vid användning av ROLAP-system, uppnå indikatorer som liknar MOLAP-system när det gäller åtkomsttid, samt överträffa i minnesbesparingar.

Hybrid OLAP-system är en kombination av verktyg som implementerar en relationell och multidimensionell datamodell. Detta gör att du kan dramatiskt minska kostnaden för resurser för att skapa och underhålla en sådan modell, svarstiden på förfrågningar.

Detta tillvägagångssätt drar fördel av fördelarna med de två första tillvägagångssätten och kompenserar för deras nackdelar. Denna princip är implementerad i de mest utvecklade mjukvaruprodukterna för detta ändamål.

Användningen av hybridarkitektur i OLAP-system är det lämpligaste sättet att lösa de problem som är förknippade med användningen av mjukvaruverktyg i multivariat analys.

Mönsterdetekteringsläget är baserat på intelligent databehandling. Huvuduppgiften här är att identifiera mönster i de processer som studeras, inbördes samband och interaktioner mellan olika faktorer, att söka efter stora "ovanliga" avvikelser, att förutse förloppet av olika väsentliga processer. Detta område tillhör datautvinning.

Introduktion

I vår tid kan nästan ingen organisation klara sig utan databashanteringssystem, särskilt bland de som traditionellt är inriktade på interaktion med kunder. Banker, försäkringsbolag, flygbolag och andra transportföretag, snabbköpskedjor, telekommunikations- och marknadsföringsföretag, serviceorganisationer och andra - alla samlar och lagrar gigabyte med data om kunder, produkter och tjänster i sina databaser. Värdet av sådan information är utom tvivel. Sådana databaser kallas operationella eller transaktionella eftersom de kännetecknas av ett stort antal små transaktioner, eller läs-skrivoperationer. Datorsystem som registrerar transaktioner och faktiskt får tillgång till transaktionsdatabaserna kallas vanligtvis OLTP-system (On-Line Transactional Processing) eller redovisningssystem.

Bokföringssystem är avstämda och optimerade för att utföra maximalt antal transaktioner under korta tidsperioder. Typiskt är de enskilda operationerna mycket små och inte relaterade till varandra. Varje datapost som kännetecknar interaktionen med en kund (ett samtal till support, en kontanttransaktion, en katalogbeställning, ett besök på företagets webbplats etc.) kan dock användas för att få kvalitativt ny information, nämligen för att skapa rapporter och analysera företagets verksamhet. ...

Uppsättningen av analytiska funktioner i redovisningssystem är vanligtvis mycket begränsad. De scheman som används i OLTP-applikationer gör det svårt att skapa även enkla rapporter, eftersom data ofta är spridda över många tabeller och komplexa sammanfogningar måste utföras för att aggregera dem. Vanligtvis är försök att skapa komplexa rapporter beräkningsintensiva och resulterar i prestandaförsämring.

Dessutom lagrar redovisningssystemen ständigt föränderlig data. När transaktioner samlas in ändras summan mycket snabbt, så två analyser som tas med flera minuters intervall kan ge olika resultat. Oftast kommer analysen att utföras i slutet av rapporteringsperioden, annars kan bilden förvrängas. Dessutom kan data som krävs för analys lagras i flera system.

Vissa analyser kräver strukturella förändringar som är oacceptabla i den nuvarande verksamhetsmiljön. Du måste till exempel ta reda på vad som händer om företaget har nya produkter. Sådan forskning kan inte utföras på levande bas. Effektiv analys utförs därför sällan direkt i redovisningssystemet.

Beslutsstödssystem har vanligtvis medel för att förse användaren med aggregerade data för olika prover från den initiala uppsättningen i en form som är bekväm för perception och analys. Vanligtvis bildar sådana aggregerade funktioner en flerdimensionell (och därför icke-relationell) datauppsättning (ofta kallad en hyperkub eller metakub), vars axlar innehåller parametrar och cellerna - den aggregerade data som är beroende av dem - och sådan data kan även lagras i relationstabeller. Längs varje axel kan data organiseras i en hierarki som representerar olika detaljnivåer. Tack vare denna datamodell kan användare formulera komplexa frågor, generera rapporter och hämta delmängder av data.

Det är just detta som orsakade intresset för beslutsstödssystem, som har blivit det huvudsakliga tillämpningsområdet för OLAP (On-Line Analytical Processing, on-line analytical processing, on-line data analysis), som förvandlar "malmen" av OLTP system till en färdig "produkt" som chefer och analytiker direkt kan använda. Denna metod tillåter analytiker, chefer och chefer att "komma till hjärtat" av den ackumulerade informationen genom snabb och konsekvent tillgång till ett brett utbud av informationsvyer.

Syftet med kursarbetet är att granska OLAP-tekniken.

multidimensionell analytisk databehandling

Huvudsak

1 Förstå OLAP

OLAP-konceptet bygger på principen om flerdimensionell datapresentation. 1993 myntades termen OLAP av Edgar Codd. Efter att ha övervägt bristerna i den relationella modellen, påpekade han först och främst omöjligheten "att kombinera, se och analysera data utifrån flera dimensioners synvinkel, det vill säga på det mest förståeliga sättet för företagsanalytiker", och definierade allmänna krav för OLAP-system som utökar funktionaliteten hos relations-DBMS och inkluderar multidimensionell analys som en av dess egenskaper.

I ett stort antal publikationer betecknar förkortningen OLAP inte bara en flerdimensionell vy av data, utan också lagringen av själva datan i en flerdimensionell databas. Generellt sett är detta inte sant, eftersom Codd själv konstaterar att "Relationella databaser var, är och kommer att vara den mest lämpliga tekniken för att lagra företagsdata. Behovet finns inte av en ny databasteknik, utan snarare av analysverktyg som kompletterar de funktioner hos befintliga DBMS och det är tillräckligt flexibelt för att förutse och automatisera de olika typerna av gruvdrift som är inneboende i OLAP." Denna förvirring leder till motsättningar som "OLAP eller ROLAP", vilket inte är helt korrekt, eftersom ROLAP (relationell OLAP) på begreppsnivå stöder all funktionalitet som definieras av termen OLAP. Det verkar mer att föredra att använda specialtermen MOLAP för OLAP baserat på flerdimensionell DBMS. Enligt Codd är en multidimensionell konceptuell syn ett multipelperspektiv som består av flera oberoende dimensioner längs vilka specifika uppsättningar av data kan analyseras. Samtidig analys över flera dimensioner definieras som multivariat analys. Varje dimension inkluderar riktningar för datakonsolidering, bestående av en serie på varandra följande nivåer av aggregering, där varje högre nivå motsvarar en högre grad av dataaggregering för motsvarande dimension. Så, mätning.

Utövaren kan bestämmas av konsolideringsriktningen, bestående av generaliseringsnivåerna "företag - avdelning - avdelning - anställd". Dimensionen Tid kan till och med innehålla två konsolideringsriktningar - år - kvartal - månad - dag och vecka - dag, eftersom tidsräkning efter månad och vecka är inkompatibel. I detta fall blir det möjligt att godtyckligt välja den önskade informationsnivån för var och en av mätningarna. Nedborrningsoperationen motsvarar förflyttningen från de högre stadierna av konsolidering till de lägre; tvärtom innebär en upprullningsoperation att gå från lägre nivåer till högre.

Codd definierade 12 regler som en mjukvaruprodukt av OLAP-klass måste uppfylla.

1.2 Krav på analytiska bearbetningsverktyg online

Flerdimensionell konceptuell vy. Den konceptuella representationen av datamodellen i en OLAP-produkt bör vara flerdimensionell till sin natur, det vill säga den ska tillåta analytiker att utföra intuitiva "slice and dice", rotera och pivotera operationer av konsolideringsriktningar. Genomskinlighet Användaren ska inte vara medveten om vilka specifika medel som används för att lagra och bearbeta data, hur uppgifterna är organiserade och varifrån de kommer.

Tillgänglighet. Analytikern ska kunna utföra analyser inom ramen för ett gemensamt konceptuellt ramverk, men samtidigt kan data förbli under kontroll av det kvarvarande arvet från DBMS, samtidigt som de är knutna till den generella analytiska modellen. Det vill säga, OLAP-verktygssatsen måste lägga sitt logiska schema över fysiska datamängder och utföra alla de transformationer som krävs för att ge en enda, konsekvent och holistisk bild av användaren på information.

Konsekvent rapporteringsprestanda Eftersom antalet dimensioner och databasstorlekar ökar bör analytiker inte uppleva någon prestandaförsämring. Hållbar prestanda är avgörande för att upprätthålla användarvänlighet och frihet från den komplexitet som krävs för att föra OLAP till slutanvändaren.

Klient - serverarkitektur (Client-Server Architecture). Det mesta av data som kräver operationell analytisk bearbetning lagras i stordatorsystem och hämtas från persondatorer. Därför är ett av kraven förmågan hos OLAP-produkter att fungera i en klient-servermiljö. Huvudtanken här är att serverkomponenten i OLAP-verktyget ska vara smart nog och ha förmågan att bygga ett allmänt konceptuellt schema baserat på generalisering och konsolidering av olika logiska och fysiska scheman i företagsdatabaser för att ge en transparent effekt.

Generisk dimensionalitet. Alla datamått måste vara lika. Ytterligare egenskaper kan tillhandahållas för individuella dimensioner, men eftersom de alla är symmetriska, kan denna extra funktionalitet tillhandahållas för alla dimensioner. Den underliggande datastrukturen, formlerna och rapportformaten bör inte förlita sig på någon enskild dimension.

Dynamisk gles matrishantering. OLAP-verktyget ska kunna hantera glesa matriser optimalt. Åtkomsthastigheten bör bibehållas oavsett var datacellerna befinner sig och vara konstant för modeller med olika antal dimensioner och olika datasparsitet.

Stöd för fleranvändarläge (Multi-User Support). Ofta behöver flera analytiker arbeta med samma analytiska modell samtidigt eller skapa olika modeller baserade på samma företagsdata. OLAP-verktyget måste ge dem samtidig åtkomst, dataintegritet och skydd.

Obegränsad tvärdimensionell operation. Att beräkna och manipulera data över valfritt antal dimensioner bör inte förbjuda eller begränsa någon relation mellan dataceller. Transformationer som kräver godtycklig definition måste specificeras i ett funktionellt komplett formelspråk.

Intuitiv datamanipulation. Omorientering av konsolideringsriktningar, detaljering av data i kolumner och rader, aggregering och andra manipulationer som är inneboende i strukturen av konsolideringsriktningarnas struktur bör utföras i det mest bekväma, naturliga och bekväma användargränssnittet.

Flexibel rapporteringsmekanism (Flexible Reporting). Olika sätt att visualisera data bör stödjas, det vill säga rapporter bör presenteras i alla möjliga riktningar.

Obegränsade dimensioner och aggregationsnivåer. Det rekommenderas starkt att anta minst femton, och helst tjugo, dimensioner i den analytiska modellen i varje seriöst OLAP-verktyg.

2 Komponenter i OLAP-system

2.1 Server. Kund. Internet

OLAP låter dig utföra snabb och effektiv analys av stora mängder data. Data lagras i en flerdimensionell form som närmast återspeglar det naturliga tillståndet för verklig affärsdata. Dessutom ger OLAP användare möjlighet att hämta sammanfattningsdata snabbare och enklare. Med dess hjälp kan de borra ner i innehållet i dessa uppgifter om det behövs för att få mer detaljerad information.

Ett OLAP-system består av många komponenter. På den högsta presentationsnivån innehåller systemet en datakälla, en OLAP-server och en klient. En datakälla är en källa från vilken data tas för analys. Data från källan överförs eller kopieras till OLAP-servern, där den organiseras och förbereds för snabbare efterföljande generering av svar på frågor. Klienten är användargränssnittet till OLAP-servern. Detta avsnitt av artikeln beskriver funktionerna för varje komponent och betydelsen av hela systemet som helhet. Källor. Källan i OLAP-system är servern som tillhandahåller data för analys. Beroende på omfattningen av OLAP-produkten kan källan vara ett Data Warehouse, en ärvd databas som innehåller allmänna data, en uppsättning tabeller som kombinerar finansiell data eller någon kombination av ovanstående. Förmågan hos en OLAP-produkt att arbeta med data från olika källor är mycket viktig. Att kräva ett enda format, eller en enda databas, där all originaldata lagras, är inte lämpligt för databasadministratörer. Dessutom minskar detta tillvägagångssätt flexibiliteten och kraften hos OLAP-produkten. Både administratörer och användare tror att OLAP-produkter som extraherar data inte bara från olika utan också från flera källor är mer flexibla och användbara än de med strängare krav.

Server. OLAP-servern är den tillämpade delen av OLAP-systemet. Denna komponent gör allt arbete (beroende på systemmodell), och lagrar i sig all information till vilken aktiv åtkomst ges. Serverarkitektur styrs av olika koncept. I synnerhet är den huvudsakliga funktionella egenskapen hos en OLAP-produkt användningen av en multidimensionell (MMDB, MDDB) eller relationsdatabas (RDB, RDB) för datalagring. Aggregerad / Föraggregerad data

Snabb implementering av frågor är absolut nödvändig för OLAP. Detta är en av grundprinciperna för OLAP - förmågan att intuitivt manipulera data kräver snabb hämtning av information. Generellt gäller att ju fler beräkningar som krävs för att få en bit information, desto långsammare blir responsen. Därför, för att spara lite tid för implementeringen av frågor, utsätts de informationsbitar som vanligtvis nås oftast, men som samtidigt kräver beräkning, för preliminär aggregering. Det vill säga de räknas och lagras sedan i databasen som ny data. Ett exempel på en datatyp som kan beräknas i förväg är sammanfattande data – till exempel försäljningssiffror per månad, kvartal eller år – för vilka de faktiska uppgifterna som anges är dagliga siffror.

Olika leverantörer har olika urvalsmetoder för parametrar som kräver föraggregation och ett antal förberäknade värden. Aggregeringsmetoden påverkar både databasen och exekveringstiden för frågor. Om fler värden beräknas, ökar sannolikheten för att användaren kommer att begära ett redan beräknat värde, och därför blir svarstiden kortare, eftersom det inte finns något behov av att be om det initiala värdet för beräkningen. Men om beräkning av alla möjliga värden inte är den bästa lösningen - i det här fallet kommer storleken på databasen att öka avsevärt, vilket kommer att göra den ohanterlig och aggregeringstiden blir för lång. Dessutom, när numeriska värden läggs till i databasen, eller om de ändras, bör denna information återspeglas i förberäknade värden som beror på de nya uppgifterna. Uppdateringen av databasen kan således också ta lång tid vid ett stort antal förberäknade värden. Eftersom databasen vanligtvis är offline under aggregering är det önskvärt att aggregeringstiden inte är för lång.

Kund. Klienten är det som används för att representera och manipulera data i databasen. Klienten kan vara ganska enkel - i form av en tabell, som inkluderar sådana OLAP-funktioner som till exempel datarotation (pivotering) och datafördjupning (borrning), och det kan vara en specialiserad, men lika enkel rapportvisare eller vara lika kraftfull som en skräddarsydd applikation designad för komplex datamanipulation. Internet är en ny form av klient. Dessutom bär den stämpeln av ny teknik; många Internetlösningar skiljer sig avsevärt i sina möjligheter i allmänhet och i kvaliteten på OLAP-lösningar i synnerhet. Det här avsnittet diskuterar de olika funktionella egenskaperna för varje klienttyp.

Även om servern är ryggraden i en OLAP-lösning, är klienten lika viktig. Servern kan ge en solid grund för att underlätta datamanipulation, men om klienten är komplex eller inte särskilt funktionell kommer användaren inte att kunna dra full nytta av en kraftfull server. Kunden är så viktig att många leverantörer fokuserar sina ansträngningar enbart på kundutveckling. Allt som ingår i dessa applikationer är en standard titt på gränssnittet, fördefinierade funktioner och struktur, samt snabba lösningar för mer eller mindre standardsituationer. Till exempel är finansieringspaket populära. Förbyggda finansiella applikationer kommer att tillåta proffs att använda välbekanta finansiella instrument utan att behöva designa en databasstruktur eller vanliga formulär och rapporter. Frågeverktyg/rapportgenerator. Ett frågeverktyg eller rapportgenerator ger enkel åtkomst till OLAP-data. De har ett lättanvänt grafiskt gränssnitt och tillåter användare att skapa rapporter genom att dra och släppa objekt i rapporten. Medan den traditionella rapportgeneratorn ger användaren möjligheten att snabbt producera formaterade rapporter, genererar OLAP-kapabla rapportgeneratorer uppdaterade rapporter. Slutprodukten är en rapport som har möjlighet att gå ner till datanivå, rotera (pivot) rapporter, stödja hierarkier mm Tillägg (tillägg) av kalkylblad.

Idag, inom många branscher, utförs olika former av analys av företagsdata med hjälp av kalkylblad. På ett sätt är det en idealisk rapporterings- och datavisare. En analytiker kan skapa makron som arbetar med data i en vald riktning, och en mall kan utformas så att formler beräknar de korrekta värdena när data skrivs in, vilket eliminerar behovet av att göra om enkla beräkningar.

Allt detta resulterar dock i en "platt" rapport, vilket gör att när den väl är skapad är det svårt att se det på olika sätt. Till exempel visar ett diagram information över en tidsperiod, till exempel en månad. Och om man vill se siffrorna för dagen (i motsats till uppgifterna för månaden), kommer det att bli nödvändigt att skapa ett helt nytt diagram. Det finns nya datamängder som ska definieras, nya etiketter som ska läggas till i diagrammet och många andra enkla men tråkiga ändringar som ska göras. Dessutom finns det ett antal områden där misstag kan göras, vilket generellt minskar tillförlitligheten. När OLAP läggs till i en tabell blir det möjligt att skapa ett enda diagram och sedan utsätta det för olika manipulationer för att förse användaren med nödvändig information, utan att belasta sig själv med att skapa alla möjliga vyer. Internet som kund. Internet är en ny medlem i OLAP-klientfamiljen. Det finns många fördelar med att generera OLAP-rapporter över Internet. Det mest betydande är frånvaron av behovet av specialiserad programvara för att komma åt information. Detta sparar företaget mycket tid och pengar.

Varje internetprodukt är specifik. Vissa gör det lättare att skapa webbsidor, men har mindre flexibilitet. Andra låter dig skapa vyer av dina data och sedan spara dem som statiska HTML-filer. Allt detta gör det möjligt att se data över Internet, men inget mer. Det är omöjligt att aktivt manipulera data med deras hjälp.

Det finns en annan typ av produkt, interaktiv och dynamisk, som förvandlar sådana produkter till fullfjädrade verktyg. Användare kan borra ner i data, pivotera, begränsa dimensioner med mera. Innan man väljer ett internetimplementeringsverktyg är det viktigt att förstå vilken funktionalitet som krävs av en webblösning och sedan bestämma vilken produkt som bäst implementerar den funktionen.

Ansökningar. Applikationer är en typ av klient som använder OLAP-databaser. De är identiska med frågeverktygen och rapportgeneratorerna som beskrivs ovan, men de lägger också till mer funktionalitet till produkten. Applikationen är generellt sett mer kraftfull än frågeverktyget.

Utveckling. Vanligtvis tillhandahåller OLAP-leverantörer en utvecklingsmiljö där användare kan skapa sina egna anpassade applikationer. Utvecklingsmiljön som helhet är ett grafiskt gränssnitt som stödjer objektorienterad applikationsutveckling. Dessutom tillhandahåller de flesta leverantörer ett API som kan användas för att integrera OLAP-databaser med andra applikationer.

2.2 OLAP-klienter

OLAP-klienter med en inbäddad OLAP-maskin installeras på användarnas datorer. De kräver ingen server för beräkning, och de har ingen administration. Dessa klienter tillåter användaren att ställa in sina befintliga databaser; som regel skapar detta en ordbok som döljer den fysiska strukturen av data bakom dess ämnesbeskrivning, förståelig för en specialist. OLAP-klienten kör sedan godtyckliga frågor och visar resultaten i en OLAP-tabell. I denna tabell kan användaren i sin tur manipulera data och få hundratals olika rapporter på skärmen eller på papper. OLAP-klienter som är designade för att fungera med RDBMS låter dig analysera data som redan är tillgänglig i ett företag, till exempel lagrad i en OLTP-databas. Deras andra syfte kan dock vara att snabbt och billigt skapa datalager eller datamarts – i det här fallet behöver organisationens programmerare bara skapa samlingar av stjärntabeller i relationsdatabaser och dataladdningsprocedurer. Den mest tidskrävande delen av arbetet - att skriva gränssnitt med många alternativ för anpassade frågor och rapporter - implementeras i OLAP-klienten på bara några timmar. Slutanvändaren tar däremot cirka 30 minuter på sig att bemästra ett sådant program. OLAP-klienter levereras av databasutvecklarna själva, både multidimensionella och relationella. Dessa är SAS Corporate Reporter, som nästan är en referensprodukt när det gäller bekvämlighet och skönhet, Oracle Discoverer, en uppsättning MS Pivot Services och Pivot Table-program, etc. Många program som utformats för att fungera med MS OLAP Services levereras som en del av OLAP-kampanj utförd av Microsoft Corporation. Vanligtvis är de förbättrade versioner av pivottabellen och är designade för användning i MS Office eller en webbläsare. Det här är produkter från Matryx, Knosys, etc., som har vunnit enorm popularitet i väst på grund av sin enkelhet, låga kostnad och effektivitet.

3 Klassificering av OLAP-produkter

3.1 Flerdimensionell OLAP

För närvarande finns det ett stort antal produkter på marknaden som tillhandahåller OLAP-funktionalitet i en eller annan grad. Genom att tillhandahålla en flerdimensionell konceptuell vy från användargränssnittet till källdatabasen delas alla OLAP-produkter in i tre klasser, liknande källdatabastypen.

1. De tidigaste analytiska bearbetningssystemen online (till exempel Essbase från Arbor Software, Oracle Express Server från Oracle) tillhörde MOLAP-klassen, det vill säga de kunde endast arbeta med sina egna flerdimensionella databaser. De är baserade på egenutvecklade flerdimensionella DBMS-teknologier och är de dyraste. Dessa system tillhandahåller en fullständig cykel av OLAP-bearbetning. De inkluderar antingen, förutom serverkomponenten, sitt eget integrerade klientgränssnitt eller använder externa kalkylprogram för att kommunicera med användaren. För att underhålla sådana system krävs en särskild personal med anställda för att installera, underhålla systemet och bilda datarepresentationer för slutanvändare.

2. System för on-line analytisk bearbetning av relationsdata (ROLAP) gör det möjligt att representera data lagrad i en relationsdatabas i en flerdimensionell form, vilket ger omvandlingen av information till en flerdimensionell modell genom ett mellanliggande metadatalager. Denna klass inkluderar DSS Suite från MicroStrategy, MetaCube från Informix, DecisionSuite från Information Advantage och andra. Programvarupaketet InfoVisor, utvecklat i Ryssland, vid Ivanovo State Power Engineering University, är också ett system av denna klass. ROLAP-system är väl lämpade för att arbeta med stora lagerutrymmen. Liksom MOLAP-system kräver de betydande IT-underhåll och är flera användare.

3. Slutligen är hybridsystem (Hybrid OLAP, HOLAP) utformade för att kombinera fördelarna och minimera nackdelarna med de tidigare klasserna. Denna klass inkluderar Speedwares Media / MR. Enligt utvecklarna kombinerar den den analytiska flexibiliteten och lyhördheten hos MOLAP med den ständiga tillgången till riktig data som är inneboende i ROLAP.

Utöver dessa verktyg finns det en annan klass - skrivbordsfrågor och rapporteringsverktyg, kompletterade med OLAP-funktioner eller integrerade med externa verktyg som utför sådana funktioner. Dessa välutvecklade system hämtar data från ursprungliga källor, transformerar dem och placerar dem i en dynamisk flerdimensionell databas som körs på slutanvändarens klientstation. Huvudrepresentanterna för denna klass är BusinessObjects från företaget med samma namn, BrioQuery från Brio Technology och PowerPlay från Cognos. En översikt över vissa OLAP-produkter finns i bilagan.

I specialiserade DBMS baserade på multidimensionell datarepresentation organiseras data inte i form av relationstabeller, utan i form av ordnade flerdimensionella arrayer:

1) hyperkuber (alla celler som lagras i databasen måste ha samma dimension, det vill säga vara i den mest kompletta basen av mätningar) eller

2) polykuber (varje variabel lagras med sin egen uppsättning mätningar, och alla associerade bearbetningssvårigheter flyttas till systemets interna mekanismer).

Användningen av flerdimensionella databaser i on-line analytiska bearbetningssystem har följande fördelar.

1. Vid användning av ett flerdimensionellt DBMS går datasökning och hämtning mycket snabbare än med en multidimensionell konceptuell vy av en relationsdatabas, eftersom en flerdimensionell databas är denormaliserad, innehåller föraggregerade indikatorer och ger optimerad åtkomst till de begärda cellerna.

2. Flerdimensionell DBMS klarar enkelt av uppgifterna att inkludera en mängd olika inbyggda funktioner i informationsmodellen, medan de objektivt existerande begränsningarna för SQL-språket gör implementeringen av dessa uppgifter på basis av relations-DBMS ganska svår och ibland omöjlig.

Å andra sidan finns det betydande begränsningar.

1. Flerdimensionell DBMS tillåter inte arbete med stora databaser. Dessutom, på grund av denormalisering och tidigare utförd aggregering, motsvarar mängden data i en flerdimensionell databas som regel (enligt Codd) 2,5-100 gånger mindre än volymen av den ursprungliga detaljerade datan.

2. Flerdimensionella DBMS i jämförelse med relationella använder externt minne mycket ineffektivt. I den överväldigande majoriteten av fallen är informationshyperkuben mycket sparsam, och eftersom data lagras i en ordnad form kan odefinierade värden endast tas bort genom att välja den optimala sorteringsordningen som gör det möjligt att organisera data i största möjliga sammanhängande grupper . Men även i detta fall är problemet bara delvis löst. Dessutom kommer den sorteringsordning som är optimal för att lagra glesa data sannolikt att skilja sig från den ordning som oftast används i frågor. Därför, i verkliga system, måste du hitta en kompromiss mellan prestanda och redundans för diskutrymme som upptas av databasen.

Därför är användningen av flerdimensionell DBMS endast motiverad under följande förhållanden.

1. Volymen av initiala data för analys är inte för stor (inte mer än flera gigabyte), det vill säga nivån på dataaggregering är ganska hög.

2. Uppsättningen av informationsdimensioner är stabil (eftersom varje förändring i deras struktur nästan alltid kräver en fullständig omstrukturering av hyperkuben).

3. Systemets svarstid på ad hoc-förfrågningar är den mest kritiska parametern.

4. Omfattande användning av komplexa inbyggda funktioner krävs för att utföra tvärdimensionella beräkningar på celler i en hyperkub, inklusive förmågan att skriva anpassade funktioner.

Direkt användning av relationsdatabaser i online analytiska bearbetningssystem har följande fördelar.

1. I de flesta fall implementeras företagsdatalager med hjälp av relations-DBMS, och ROLAP-verktyg låter dig analysera direkt på dem. Samtidigt är lagringsstorleken inte en så kritisk parameter som i fallet med MOLAP.

2. När det gäller en variabel dimension av problemet, när förändringar i mätstrukturen måste göras ganska ofta, är ROLAP-system med en dynamisk representation av dimensionen den optimala lösningen, eftersom sådana modifieringar i dem inte kräver fysisk omorganisation av databasen.

3. Relationellt DBMS ger en betydligt högre nivå av dataskydd och goda möjligheter att differentiera åtkomsträttigheter.

Den största nackdelen med ROLAP jämfört med flerdimensionell DBMS är lägre prestanda. Relationssystem kräver omfattande databasschema och indexjustering för att uppnå prestanda jämförbar med MOLAP, vilket innebär mycket ansträngning från DBA:s sida. Endast genom att använda stjärnscheman kan prestandan hos välinställda relationssystem ligga nära prestandan hos system baserade på flerdimensionella databaser.

Beskrivningen av stjärnschemat och rekommendationer för dess användning är helt ägnade åt arbetet. Dess idé är att det finns tabeller för varje dimension, och alla fakta placeras i en tabell, indexerad av en multipelnyckel som består av nycklar för individuella dimensioner (bilaga A). Varje stråle i stjärnschemat definierar, i Codds terminologi, riktningen för datakonsolidering längs motsvarande dimension.

I komplexa problem med flernivådimensioner är det vettigt att vända sig till förlängningarna av stjärnschemat - konstellationsschemat och snöflingeschemat. I dessa fall skapas separata faktatabeller för möjliga kombinationer av sammanfattande nivåer av olika dimensioner (bilaga B). Detta möjliggör bättre prestanda, men leder ofta till dataredundans och betydande komplikationer i strukturen av databasen, som innehåller ett stort antal faktatabeller.

Ökningen av antalet faktatabeller i databasen kan bero inte bara på mångfalden av nivåer av olika dimensioner, utan också från det faktum att fakta i allmänhet har olika uppsättningar av dimensioner. När man abstraherar från individuella mätningar bör användaren få en projicering av den mest kompletta hyperkuben, och inte alltid värdena på indikatorerna i den bör vara resultatet av elementär summering. Således, med ett stort antal oberoende dimensioner, är det nödvändigt att upprätthålla många faktatabeller som motsvarar varje möjlig kombination av dimensioner som valts i frågan, vilket också leder till slösaktig användning av externt minne, en ökning av tiden för att ladda data till stjärnschemadatabas från externa källor och administrationskomplexitet.

Utvidgningar av SQL-språket (operatörer GROUP BY CUBE "," GROUP BY ROLLUP "och" GROUP BY GROUPING SET ") löser delvis detta problem; dessutom föreslås en mekanism för att hitta en kompromiss mellan redundans och prestanda, som rekommenderar att man skapar faktatabeller inte för alla möjliga kombinationer av dimensioner, utan bara för de vars cellvärden inte kan erhållas med efterföljande aggregering av mer kompletta faktatabeller (bilaga B).

I alla fall, om den flerdimensionella modellen är implementerad som en relationsdatabas, bör du skapa långa och "smala" faktatabeller och relativt små och "breda" dimensionstabeller. Faktatabeller innehåller de numeriska värdena för cellerna i hyperkuben, och resten av tabellerna definierar den flerdimensionella dimensionsbasen som innehåller dem. En del av informationen kan erhållas genom att använda dynamisk aggregering av data distribuerad över icke-stjärnnormaliserade strukturer, även om man bör komma ihåg att frågor som involverar aggregering med en mycket normaliserad databasstruktur kan vara ganska långsamma.

Genom att fokusera på representationen av flerdimensionell information med hjälp av stjärnformade relationsmodeller kan du bli av med problemet med att optimera lagringen av glesa matriser, vilket är akut för flerdimensionella DBMS (där problemet med sparsitet löses genom ett speciellt val av schema) . Även om en hel post används för att lagra varje cell, som, förutom värdena själva, inkluderar sekundära nycklar - referenser till dimensionstabeller, är obefintliga värden helt enkelt inte inkluderade i faktatabellen.

Slutsats

Efter att ha övervägt frågorna om drift och tillämpning av OLAP-teknik står företag inför frågor, vars svar gör det möjligt att välja den produkt som bäst möter användarens behov.

Det här är följande frågor:

Var kommer uppgifterna ifrån? – Datan som ska analyseras kan finnas på olika platser. Det är möjligt att OLAP-databasen tar emot dem från ett företagsdatalager eller från ett OLTP-system. Om OLAP-produkten redan har möjlighet att komma åt en datakälla reduceras processerna för kategorisering och datarensning.

Vilken typ av manipulationer utför användaren med datan? -
När användaren väl har kommit åt databasen och börjat utföra analys är det viktigt att han kan manipulera data på lämpligt sätt. Beroende på användarens behov kan du upptäcka att du behöver en kraftfull rapportgenerator eller förmågan att skapa och vara värd för dynamiska webbsidor. Det kan dock vara att föredra för användaren att ha till sitt förfogande ett sätt att enkelt och snabbt skapa sina egna applikationer.

Vad är den totala mängden data? - Detta är den viktigaste faktorn när man definierar en OLAP-databas. Relationella OLAP-produkter kan hantera stora mängder data bättre än flerdimensionella. Om datamängden inte kräver användning av en relationsdatabas, kan den flerdimensionella produkten användas med lika stor framgång.

Vem är användaren? - När du definierar en OLAP-systemklient är användarens kompetensnivå viktig. Vissa användare kommer att tycka att det är bekvämare att integrera OLAP med ett kalkylblad, medan andra föredrar en specialiserad applikation. Beroende på användarens kvalifikationer avgörs också frågan om att genomföra utbildning. Ett stort företag kanske vill betala för användarutbildning, ett mindre företag kanske inte. Klienten ska vara sådan att användarna känner sig trygga och kan använda den effektivt.

Idag har de flesta av världens företag övergått till att använda OLAP som den underliggande tekniken för att tillhandahålla information till beslutsfattare. Därför är den grundläggande frågan som ska ställas inte om kalkylblad ska fortsätta att användas som den primära plattformen för rapportering, budgetering och prognoser. Företag måste fråga sig själva om de är beredda att förlora konkurrensfördelar genom att använda felaktig, irrelevant och ofullständig information innan de mognar och överväger alternativ teknik.

Sammanfattningsvis bör det också noteras att OLAP-teknikernas analytiska förmåga ökar användbarheten av data som lagras i företagets informationslager, vilket gör att företaget kan interagera mer effektivt med sina kunder.

Ordlista

Begrepp Definition
1 BI-verktyg Verktyg och teknik som används för att komma åt information. Inkluderar OLAP-teknik, datautvinning och komplex analys; slutanvändarverktyg och ad-hoc-verktyg för att bygga frågeställningar, instrumentpaneler för företagsövervakning och generatorer för företagsrapportering.
2 Online analytisk bearbetning, OLAP En teknik för analytisk bearbetning av information i realtid, inklusive förberedelse och dynamisk publicering av rapporter och dokument.
3 Skiva och tärna En term som används för att beskriva den sofistikerade dataanalysfunktionaliteten som tillhandahålls av OLAP-verktyg. Hämta data från en flerdimensionell kub med specificerade värden och specificerad relativ position för dimensioner.
4 Data Pivot Processen att rotera en datatabell, det vill säga konvertera kolumner till rader och vice versa.
5 Beräknad medlem Ett dimensionselement vars värde bestäms av värdena för andra element (till exempel matematiska eller logiska tillämpningar). Det beräknade objektet kan vara en del av OLAP-servern eller beskrivas av användaren under en interaktiv session. En beräknad post är vilken post som helst som inte matas in, utan beräknas.
6 Globala affärsmodeller En typ av datalager som ger tillgång till information som är distribuerad över olika system i företaget och som står under kontroll av olika avdelningar eller avdelningar med olika databaser och datamodeller. Denna typ av Data Warehouse är svår att bygga på grund av behovet av att kombinera insatser från användare från olika avdelningar för att utveckla en gemensam datamodell för Warehouse.
7 Data Mining Tekniker som använder mjukvaruverktyg avsedda för en användare som i regel inte kan säga i förväg exakt vad han letar efter, utan bara kan ange vissa mönster och sökriktningar.
8 Klient-server Teknologiskt tillvägagångssätt, som består i att dela upp processen i separata funktioner. Servern utför flera funktioner - kommunikationshantering, databasunderhåll etc. Klienten utför individuella användarfunktioner - tillhandahåller lämpliga gränssnitt, utför navigering mellan skärmar, tillhandahåller hjälpfunktioner osv.
9 Flerdimensionell databas, MDBS och MDBMS En kraftfull databas som låter användare analysera stora mängder data. En databas med en speciell lagringsorganisation - kuber, som ger höghastighetsarbete med data lagrad som en samling av fakta, dimensioner och förberäknade aggregat.
10 Borra ner En detaljerad datautvinningsmetod som används för att analysera den aggregerade datanivån. Nivåerna för "fördjupning" beror på granulariteten hos data i [lagring.
11 Centrallager

1. En databas som innehåller data som samlats in från en organisations operativsystem. Har en struktur som är bekväm för dataanalys. Designad för att stödja beslutsfattande och skapa ett enhetligt informationsutrymme för företaget.

2. Ett sätt att automatisera, som omfattar alla informationssystem som hanteras från ett ställe.

1 Golitsina O.L., Maksimov N.V., Popov I.I. Databaser: Handledning. - M .: FORUM: INFRA-M, 2003 .-- 352 sid.

2 Datum K. Introduktion till databassystem. - M .: Nauka, 2005 - 246 sid.

3 Elmanova N.V., Fedorov A.A. Introduktion till Microsoft OLAP-teknik. - M.: Dialog-MEPhI, 2004 .-- 312 sid.

4 Karpova T.S. Databaser: modeller, utveckling, implementering. - SPb .: Peter, 2006 .-- 304 sid.

5 Korovkin S. D., Levenets I. A., Ratmanova I. D., Starykh V. A., Shchavelev L. V. Lösning på problemet med komplex operativ analys av information i datalager // DBMS. - 2005. - Nr 5-6. - 47-51 sid.

6 Krechetov N., Ivanov P. Produkter för datautvinning ComputerWeek-Moscow. - 2003. - Nr 14-15. - 32-39 sid.

7 Przhiyalkovsky V.V. Komplex analys av stora data: nya perspektiv på datorisering // DBMS. - 2006. - Nr 4. - 71-83 sid.

8 Sakharov A.A. Konceptet med konstruktion och implementering av informationssystem fokuserade på dataanalys // DBMS. - 2004. - Nr 4. - 55-70 sid.

9 Ullman J. Grunderna i databassystem. - M .: Finans och statistik, 2003. - 312 sid.

10 Hubbard J. Datorstödd design av databaser. - M .: Mir, 2007 .-- 294 sid.


Korovkin S.D., Levenets I.A., Ratmanova I.D., Starykh V.A., Shchavelev L.V. Lösning på problemet med komplex operativ analys av information i datalager // DBMS. - 2005. - Nr 5-6. - 47-51 sid.

Ullman J. Grunderna i databassystem. - M .: Finans och statistik, 2003. - 312 sid.

Barsegyan A.A., Kupriyanov M.S. Dataanalysteknologier: DataMining, VisualMining, TextMining, Olap. - SPb .: BHV-Petersburg, 2007 .-- 532 sid.

Elmanova N.V., Fedorov A.A. Introduktion till Microsoft OLAP-teknik. - M.: Dialog-MEPhI, 2004 .-- 312 sid.

Datum K. Introduktion till databassystem. - M .: Nauka, 2005 - 246 sid.

Golitsina O.L., Maksimov N.V., Popov I.I. Databaser: Handledning. - M .: FORUM: INFRA-M, 2003 .-- 352s.

Sakharov A.A. Konceptet med konstruktion och implementering av informationssystem fokuserat på dataanalys // DBMS. - 2004. - Nr 4. - 55-70 sid.

Przhiyalkovsky V.V. Komplex analys av stora data: nya perspektiv på datorisering // DBMS. - 2006. - Nr 4. - 71-83 sid.

Syftet med rapporten

Denna rapport kommer att fokusera på en av kategorierna av intelligenta tekniker som är ett bekvämt analysverktyg - OLAP-teknik.

Syftet med rapporten: att avslöja och lyfta fram 2 frågor: 1) begreppet OLAP och deras tillämpade värde i ekonomisk förvaltning; 2) implementering av OLAP-funktionalitet i mjukvarulösningar: skillnader, möjligheter, fördelar, nackdelar.

Jag vill genast notera att OLAP är ett universellt verktyg som kan användas inom alla tillämpade områden, inte bara inom ekonomi (som det kan förstås av rapportens titel), vilket kräver dataanalys med olika metoder.

Finanshantering

Ekonomistyrning är ett område där analys är viktigare än något annat. Varje finansiellt och förvaltningsbeslut uppstår som ett resultat av vissa analytiska procedurer. Idag får ekonomisk förvaltning en viktig roll för att ett företag ska fungera framgångsrikt. Trots att ekonomisk förvaltning är en hjälpprocess i företaget, kräver den särskild uppmärksamhet, eftersom felaktiga ekonomiska och förvaltningsbeslut kan leda till stora förluster.

Ekonomistyrningen syftar till att ge företaget ekonomiska resurser i de volymer som krävs, vid rätt tidpunkt och på rätt plats för att få maximal effekt av användningen genom optimal distribution.

Det är kanske svårt att fastställa nivån på "maximal effektivitet av resursanvändningen", men i alla fall,

CFO bör alltid veta:

  • hur mycket ekonomiska resurser finns det?
  • var kommer medlen ifrån och i vilka belopp?
  • var ska man investera mer effektivt och varför?
  • och vid vilka tidpunkter måste allt detta göras?
  • hur mycket behövs för att säkerställa företagets normala drift?

För att få rimliga svar på dessa frågor behöver du ha, analysera och veta hur du analyserar ett tillräckligt stort antal resultatindikatorer. Dessutom täcker FI ett stort antal områden: analys av kassaflöden (kassaflöden), analys av tillgångar och skulder, analys av lönsamhet, marginalanalys, analys av lönsamhet, sortimentsanalys.

Kunskap

Därför är nyckelfaktorn för effektiviteten av den ekonomiska förvaltningsprocessen tillgången på kunskap:

  • Personlig kunskap inom ämnesområdet (man kan säga teoretisk och metodisk), inklusive erfarenhet, intuition av finansiär/ekonomichef
  • Allmän (företags) kunskap eller systematiserad information om fakta om finansiella transaktioner i företaget (d.v.s. information om företagets tidigare, nuvarande och framtida tillstånd, presenterad i olika indikatorer och mätningar)

Om den första ligger i handlingsområdet för denna finansiär (eller HR-direktören som anställde denna anställd), bör den andra målmedvetet skapas på företaget genom gemensamma ansträngningar från anställda inom finansiella tjänster och informationstjänster.

Vad är nu

Men nu är en paradoxal situation typisk för företag: det finns information, det finns mycket av det, för mycket. Men det är i ett kaotiskt tillstånd: ostrukturerat, inkonsekvent, spritt, inte alltid tillförlitligt och ofta felaktigt, det är nästan omöjligt att hitta och få det. En lång och ofta värdelös generering av finansiella rapporter utförs, vilket är obekvämt för finansiell analys, svårt att förstå, eftersom det inte skapas för intern förvaltning, utan för presentation för externa tillsynsmyndigheter.

Enligt resultaten från en undersökning gjord av företaget Reuters bland 1 300 internationella chefer säger 38 % av de tillfrågade att de lägger ner mycket tid på att försöka hitta den information de behöver. Det visar sig att en högt kvalificerad specialist spenderar sin högt betalda tid inte på dataanalys, utan på att samla in, söka och organisera den information som är nödvändig för denna analys. Samtidigt upplever chefer en stor belastning av data som ofta är irrelevant, vilket återigen minskar deras effektivitet. Orsaken till denna situation är ett överskott av information och bristande kunskap.

Vad ska man göra

Information bör omvandlas till kunskap. För moderna företag är värdefull information, dess systematiska förvärv, syntes, utbyte, användning en slags valuta, men för att ta emot den är det nödvändigt att hantera information, som alla affärsprocesser.

Nyckeln till informationshantering är att leverera rätt information på rätt sätt till intressenter inom organisationen vid en viss tidpunkt. Målet med en sådan styrning är att hjälpa människor att arbeta bättre tillsammans med hjälp av ökande mängder information.

Informationsteknologier fungerar i detta fall som ett sätt genom vilket det skulle vara möjligt att systematisera information på företaget, ge vissa användare tillgång till den och ge dem verktyg för att omvandla denna information till kunskap.

Grundläggande begrepp för OLAP-teknik

OLAP-teknologi (från engelska On-Line Analytical Processing) är inte namnet på en specifik produkt, utan på en hel teknik för operationell analys av flerdimensionell data som ackumuleras i lagringen. För att förstå essensen av OLAP är det nödvändigt att överväga den traditionella processen att erhålla information för beslutsfattande.

Traditionellt beslutsstödssystem

Här kan det naturligtvis också finnas många alternativ: komplett informationskaos eller den mest typiska situationen när det finns operativa system på företaget, med hjälp av vilka fakta om vissa operationer registreras och lagras i databaser. För att hämta data från databaser för analytiska ändamål har ett system med frågor för vissa dataprover byggts upp.

Men det här sättet för beslutsstöd saknar flexibilitet och har många nackdelar:

  • använder en försumbar mängd data som kan vara användbar för beslutsfattande
  • ibland skapas komplexa flersidiga rapporter, varav 1-2 rader faktiskt används (resten är bara för säkerhets skull) - informationsöverbelastning
  • långsam reaktion av processen på förändringar: om en ny representation av data behövs, måste begäran formellt beskrivas och kodas av programmeraren, först därefter exekveras. Väntetid: timmar, dagar. Kanske behövs en lösning nu, omedelbart. Men efter att ha fått ny information kommer en ny fråga att uppstå (förtydligande)

Om frågerapporter presenteras i ett endimensionellt format är affärsproblem vanligtvis flerdimensionella och mångfacetterade. Om du behöver få en tydlig bild av företagets verksamhet, då är det nödvändigt att analysera datan i olika aspekter.

Många företag skapar utmärkta relationsdatabaser, som helst sönderdelar berg av oanvänd information, som i sig inte ger en snabb eller tillräckligt kompetent reaktion på marknadshändelser. JA – relationsdatabaser var, är och kommer att vara den mest lämpliga tekniken för att lagra företagsdata. Detta är inte en ny databasteknik, utan snarare en analysverktygssats som kompletterar befintlig DBMS-funktionalitet och är tillräckligt flexibel för att rymma och automatisera de olika typerna av gruvdrift som är inneboende i OLAP.

Förstå OLAP

Vad ger OLAP?

  • Avancerade verktyg för åtkomst till datalagring
  • Dynamisk interaktiv datamanipulation (rotation, konsolidering eller drill down)
  • Tydlig visuell visning av data
  • Snabb - realtidsanalys
  • Multidimensionell datapresentation - simultan analys av flera indikatorer över flera dimensioner

För att få effekt av användningen av OLAP-tekniker måste du: 1) förstå kärnan i själva teknologierna och deras kapacitet; 2) definiera tydligt vilka processer som behöver analyseras, vilka indikatorer de kommer att karakteriseras i och i vilka dimensioner det är lämpligt att se dem, det vill säga skapa en analysmodell.

De grundläggande koncepten som används av OLAP-tekniker är följande:

Flerdimensionalitet

För att förstå multidimensionaliteten hos datan måste du först presentera en tabell som visar till exempel resultatet av Enterprise Costs per ekonomiskt element och affärsenhet.

Dessa data presenteras i två dimensioner:

  • artikel
  • affärsenhet

Den här tabellen är inte informativ, eftersom den visar försäljning för en viss tidsperiod. För olika tidsperioder måste analytiker jämföra flera tabeller (för varje tidsperiod):

Figuren visar en tredje dimension, Tid, utöver de två första. (Artikel, affärsenhet)

Ett annat sätt att visa flerdimensionell data är att representera den i form av en kub:

OLAP-kuber tillåter analytiker att få data på olika segment för att få svar på de frågor som företaget ställer:

  • Vilka är de kritiska kostnaderna i vilka affärsenheter?
  • Hur förändras affärsenhetskostnaderna över tiden?
  • Hur förändras kostnadsposterna över tid?

Svar på sådana frågor är nödvändiga för att fatta ledningsbeslut: att minska vissa kostnadsposter, påverka deras struktur, identifiera orsakerna till förändringar i kostnader över tid, avvikelser från planen och deras eliminering - optimering av deras struktur.

I det här exemplet beaktas endast 3 dimensioner. Det är svårt att avbilda mer än 3 dimensioner, men det fungerar på samma sätt som med 3 dimensioner.

Vanligtvis låter OLAP-applikationer dig få data om 3 eller fler dimensioner, till exempel kan du lägga till ytterligare en dimension - Plan-Faktisk, Kostnadskategori: direkt, indirekt, efter order, per månader. Ytterligare dimensioner gör att du kan få fler analytiska segment och ge svar på frågor med flera villkor.

Hierarki

OLAP tillåter också analytiker att organisera varje dimension i en hierarki av grupper och undergrupper och summor som representerar ett mått över hela organisationen – det mest logiska sättet att analysera en verksamhet.

Till exempel är det tillrådligt att gruppera kostnader hierarkiskt:

OLAP tillåter analytiker att hämta data från ett övergripande sammanfattande mått (på den översta nivån) och sedan gå ner till botten och nästa nivå, och på så sätt upptäcka den exakta orsaken till ändringen i måttet.

Genom att tillåta analytiker att använda flera dimensioner i en datakub, med möjlighet till hierarkiskt uppbyggda dimensioner, ger OLAP en bild av verksamheten som inte komprimeras av datalagerstrukturen.

Ändra analysriktningar i en kub (datarotation)

Som regel arbetar de med följande begrepp: dimensioner specificerade i kolumner, rader (det kan finnas flera av dem), resten bildar skivor, innehållet i tabellen bildas av dimensioner (försäljning, kostnader, kontanter)

Vanligtvis låter OLAP dig ändra orienteringen av dimensionerna på en kub och därigenom presentera data i olika vyer.

Visningen av kubdata beror på:

  • dimensionsorientering: vilka dimensioner som anges i rader, kolumner, skivor;
  • grupper av indikatorer markerade i rader, kolumner, skivor.
  • Att ändra dimensioner ligger i användarens handlingsfält.

Således låter OLAP dig utföra olika typer av analyser och förstå deras relation till deras resultat.

  • Avvikelseanalys - en analys av genomförandet av planen, som kompletteras med en faktoranalys av orsakerna till avvikelser genom att detaljera indikatorer.
  • Beroendeanalys: OLAP låter dig identifiera olika beroenden mellan olika förändringar, till exempel när öl togs bort från sortimentet under de första två månaderna upptäcktes en nedgång i mörtförsäljningen.
  • Jämförelse (jämförande analys). Jämförelse av resultaten av förändringar i indikatorn över tid, för en given produktgrupp, i olika regioner osv.
  • Analys av dynamiken gör att vi kan identifiera vissa trender i förändringen av indikatorer över tiden.

Skyndsamhet: vi kan säga att OLAP är baserad på psykologins lagar: förmågan att bearbeta informationsförfrågningar i "realtid" - i takt med processen för analytisk förståelse av data av användaren.

Om du kan läsa cirka 200 poster per sekund från en relationsdatabas och skriva 20, så kan en bra OLAP-server, med hjälp av beräknade rader och kolumner, konsolidera 20 000-30 000 celler (motsvarande en post i en relationsdatabas) per sekund.

Synlighet: Det bör betonas att OLAP tillhandahåller en avancerad grafisk presentation av data för slutanvändaren. Den mänskliga hjärnan kan uppfatta och analysera information som presenteras i form av geometriska bilder, i en volym som är flera storleksordningar större än informationen som presenteras i alfanumerisk form. Exempel: Anta att du behöver hitta ett bekant ansikte på ett av hundra fotografier. Jag tror att denna process kommer att ta dig mindre än en minut. Föreställ dig nu att du istället för fotografier kommer att erbjudas hundra verbala beskrivningar av samma personer. Jag tror att du inte alls kommer att kunna lösa det föreslagna problemet.

Enkelhet: Huvuddragen hos dessa teknologier är att de är fokuserade på användningen inte av en IT-specialist, inte av en expertstatistiker, utan av en professionell inom det tillämpade området - chefen för kreditavdelningen, chefen för budgetavdelningen, och slutligen regissören. De är avsedda för analytikern att kommunicera med problemet, inte med datorn..

Trots de stora kapaciteterna hos OLAP (dessutom är idén relativt gammal - 60-talet), i själva verket finns dess användning praktiskt taget inte i våra företag. Varför?

  • det finns ingen information eller möjligheterna är inte klara
  • vana att tänka tvådimensionellt
  • prisbarriär
  • överdriven tillverkningsbarhet av artiklar som ägnas åt OLAP: okända termer skrämmer av - OLAP, "gräva och skära data", "ad hoc-frågor", "identifiera signifikanta samband"

Vårt tillvägagångssätt och västerländska förhållningssätt till OLAP-applikation

Dessutom har vi också en specifik förståelse för användbarheten av OLAP även när vi förstår dess tekniska kapacitet.

Våra och ryska författare av olika material om OLAP uttrycker följande åsikt med avseende på användbarheten av OLAP: majoriteten uppfattar OLAP som ett verktyg som låter dig expandera och kollapsa data enkelt och bekvämt, utföra manipulationer som kommer till analytikerns huvud under analys. Ju fler "skivor" och "snitt" av data en analytiker ser, desto fler idéer har han, som i sin tur kräver fler och fler "skivor" för verifiering. Det är inte rätt.

Den västerländska förståelsen av användbarheten av OLAP bygger på en metodologisk analysmodell, som måste läggas fast vid utformningen av OLAP-lösningar. Analytikern ska inte leka med OLAP-kuben och planlöst ändra dess dimensioner och detaljnivåer, dataorientering, grafisk visning av data (och det krävs verkligen!), utan tydligt förstå vilka vyer han behöver, i vilken sekvens och varför (naturligtvis) , element " upptäckter "det kan finnas, men detta är inte en grundläggande del av användbarheten av OLAP).

Tillämpad användning av OLAP

  • Budget
  • Flöde av medel

Ett av de mest bördiga användningsområdena för OLAP-teknik. Det är inte för inte som inget modernt budgeteringssystem anses vara komplett utan närvaron av OLAP-verktyg för budgetanalys i dess sammansättning. De flesta budgetrapporter byggs enkelt utifrån OLAP-system. Samtidigt svarar rapporterna på ett mycket brett spektrum av frågor: analys av strukturen för utgifter och inkomster, jämförelse av utgifter för vissa poster i olika avdelningar, analys av dynamik och trender i utgifter för vissa poster, analys av kostnad och vinst .

OLAP låter dig analysera in- och utflöden av kontanter i samband med affärstransaktioner, motparter, valutor och tid för att optimera deras flöden.

  • Ekonomi- och förvaltningsrapportering (med analyser som ledningen behöver)
  • Marknadsföring
  • Balanced Scorecard
  • Lönsamhetsanalys

Om relevant information finns tillgänglig kan du hitta en annan OLAP-teknikapplikation.

OLAP företagsprofil

Det här avsnittet kommer att tala om OLAP som en mjukvarulösning.

Allmänna krav för OLAP-produkter

Det finns många sätt att implementera OLAP-applikationer, då borde ingen speciell teknik ha krävts, eller ens rekommenderats. Under olika förhållanden och omständigheter kan det ena tillvägagångssättet vara att föredra framför det andra. Implementeringstekniken inkluderar många olika egenutvecklade idéer som leverantörer är så stolta över: varianter av klient-server-arkitektur, tidsserieanalys, objektorientering, lagringsoptimering, parallella processer, etc. Men dessa teknologier kan inte vara en del av definitionen av OLAP.

Det finns egenskaper som måste observeras i alla OLAP-produkter (om det är en OLAP-produkt), vilket är den idealiska tekniken. Det här är 5 nyckeldefinitioner som kännetecknar OLAP (det så kallade FASMI-testet): Snabb analys av delad multidimensionell information.

  • Snabbt(SNABB) - betyder att systemet ska kunna ge de flesta svar till användare inom cirka fem sekunder. Även om systemet varnar för att processen kommer att ta betydligt längre tid kan användarna bli distraherade och tappa tankarna och kvaliteten på analysen blir lidande. Denna hastighet är inte lätt att uppnå med stora datamängder, särskilt om speciella on-the-fly-beräkningar krävs. Leverantörer tillgriper en mängd olika metoder för att uppnå detta mål, inklusive specialiserade former av datalagring, omfattande förberäkningar eller skärpta hårdvarukrav. Det finns dock för närvarande inga helt optimerade lösningar. Vid första anblicken kan det tyckas förvånande att när man tar emot en rapport på en minut, vilket för inte så länge sedan tog dagar, blir användaren mycket snabbt uttråkad medan han väntar, och projektet visar sig vara mycket mindre framgångsrikt än i fallet med en omedelbar respons, även till priset av mindre detaljerad analys.
  • Delad innebär att systemet gör det möjligt att uppfylla alla dataskyddskrav och implementera distribuerad och samtidig åtkomst till data för olika nivåer av användare. Systemet måste kunna hantera flera dataändringar på ett snabbt och säkert sätt. Detta är en stor svaghet i många OLAP-produkter, som tenderar att anta att alla OLAP-applikationer är skrivskyddade och ger förenklat skydd.
  • Flerdimensionellär ett nyckelkrav. Om du var tvungen att definiera OLAP i ett ord, skulle du välja det. Systemet bör ge en flerdimensionell konceptuell bild av data, inklusive fullt stöd för hierarkier och flera hierarkier, eftersom detta avgör det mest logiska sättet att analysera verksamheten. Det finns inget minsta antal dimensioner som ska bearbetas, eftersom det också beror på applikationen, och de flesta OLAP-produkter har tillräckligt med dimensioner för de marknader de riktar sig till. Återigen, vi specificerar inte vilken underliggande databasteknologi som ska användas om användaren får en verkligt flerdimensionell konceptuell representation av informationen. Denna funktion är kärnan i OLAP
  • Information. Nödvändig information ska inhämtas där den behövs, oavsett volym och lagringsplats. Mycket beror dock på applikationen. Kraften hos olika produkter mäts i termer av hur mycket input de kan bearbeta, men inte hur många gigabyte de kan lagra. Kraften i produkterna varierar kraftigt – de största OLAP-produkterna klarar minst tusen gånger mer data än de minsta. Det finns många faktorer att ta hänsyn till i detta avseende, inklusive dataduplicering, RAM-minne som krävs, diskutrymmesutnyttjande, prestanda, datalagringsintegration och mer.
  • Analys innebär att systemet kan hantera vilken logisk och statistisk analys som helst som är specifik för en given applikation, och säkerställer att den sparas i en form som är tillgänglig för slutanvändaren. Användaren ska kunna definiera nya anpassade beräkningar som en del av analysen utan behov av programmering. Det vill säga att all nödvändig analysfunktionalitet måste tillhandahållas på ett intuitivt sätt till slutanvändarna. Analysverktyg kan inkludera specifika procedurer, såsom tidsserieanalys, kostnadsfördelning, valutaöverföringar, målsökning etc. Sådana möjligheter varierar kraftigt mellan produkter, beroende på målinriktning.

Med andra ord är dessa 5 nyckeldefinitioner de mål som OLAP-produkter är designade för att uppnå.

OLAP tekniska aspekter

OLAP-systemet innehåller vissa komponenter. Det finns olika system för deras arbete som en viss produkt kan implementera.

Komponenter i OLAP-system (vad består ett OLAP-system av?)

Vanligtvis innehåller ett OLAP-system följande komponenter:

  • Datakälla
    Källan från vilken data för analys hämtas (datalager, databas med operativa redovisningssystem, en uppsättning tabeller, kombinationer av ovanstående).
  • OLAP-server
    Data från källan överförs eller kopieras till OLAP-servern, där den organiseras och förbereds för snabbare efterföljande generering av svar på frågor.
  • OLAP-klient
    Användargränssnittet till OLAP-servern, där användaren arbetar

Det bör noteras att inte alla komponenter krävs. Det finns OLAP-skrivbordssystem som låter dig analysera data som lagras direkt på användarens dator och som inte kräver en OLAP-server.

Vilket element som krävs är dock datakällan: tillgången på data är en viktig fråga. Om de är, i någon form, som en Excel-tabell, i redovisningssystemets databas, i form av strukturerade rapporter från grenar, kommer IT-specialisten att kunna integrera med OLAP-systemet direkt eller med en mellanliggande transformation. För detta har OLAP-systemen specialverktyg. Om dessa data inte är tillgängliga, eller om de är otillräckligt fullständiga och av otillräcklig kvalitet, hjälper OLAP inte. Det vill säga, OLAP är bara ett tillägg över data, och om det inte finns något blir det en värdelös sak.

De flesta data för OLAP-applikationer har sitt ursprung i andra system. Men i vissa applikationer (till exempel för planering eller budgetering) kan data genereras direkt i OLAP-applikationer. När data kommer från andra applikationer är det vanligtvis nödvändigt att uppgifterna lagras i en separat, duplicerad form för OLAP-applikationen. Därför är det lämpligt att skapa datalager.

Det bör noteras att termen OLAP är oupplösligt kopplad till termen Data Warehouse. Ett datalager är en domänspecifik, tidsbunden och oföränderlig insamling av data för att stödja ledningens beslutsfattande. Data i lagret kommer från operativa system (OLTP-system), som är designade för att automatisera affärsprocesser, lagret kan fyllas på med hjälp av externa källor, till exempel statistiska rapporter.

Trots det faktum att de innehåller avsiktligt redundant information, som redan finns i databaserna eller filerna i operativsystemen, är datalagring nödvändiga eftersom:

  • datafragmentering, lagring i olika DBMS-format;
  • förbättrad datahämtningsprestanda
  • om i företaget all data lagras på en central databasserver (vilket är extremt sällsynt) kommer analytikern förmodligen inte att förstå deras komplexa, ibland förvirrande strukturer
  • komplexa analytiska frågor till operativ information saktar ner företagets nuvarande arbete, blockerar tabeller under lång tid och lägger beslag på serverresurser
  • förmågan att rensa och stämma av data
  • det är omöjligt eller mycket svårt att analysera data från operativa system direkt;

Förvarets uppgift är att tillhandahålla råvaran för analys på ett ställe och i en enkel och begriplig struktur. Det vill säga begreppet Data Warehouse är inte ett begrepp för dataanalys, snarare är det ett koncept för att förbereda data för analys. Det innebär implementering av en enda integrerad datakälla.

OLAP-produkter: Arkitekturer

När du använder OLAP-produkter är två frågor viktiga: hur och var ha kvar och att bearbeta data. OLAP-arkitekturer särskiljs beroende på hur dessa två processer implementeras. Det finns 3 sätt att lagra data för OLAP och 3 sätt att behandla dessa data. Många tillverkare erbjuder flera alternativ, vissa försöker bevisa att deras tillvägagångssätt är det enskilt mest försiktiga. Detta är naturligtvis absurt. Men väldigt få produkter kan fungera effektivt i mer än ett läge.

OLAP datalagringsalternativ

Med lagring avses i detta sammanhang innehållet i data i ett ständigt uppdaterat tillstånd.

  • Relationsdatabaser: Detta är det typiska valet om företaget lagrar referenser i en RDB. I de flesta fall bör data lagras i en denormaliserad struktur (stjärnschema är det mest acceptabla). En normaliserad databas är inte acceptabel på grund av den mycket låga frågeprestanda vid generering av aggregerade värden för OLAP (ofta lagras summan i aggregerade tabeller).
  • Databasfiler på klientdatorn (kiosker eller datamarts): Denna data kan fördistribueras eller genereras på begäran på klientdatorer.

Flerdimensionella databaser: Antar att data lagras i en flerdimensionell databas på en server. Det kan inkludera data hämtade och sammanfattade från andra system och relationsdatabaser, slutanvändarfiler etc. I de flesta fall lagras flerdimensionella databaser på disk, men vissa produkter tillåter även användning av RAM, vilket beräknar de mest använda data på flyga". I ett mycket litet antal produkter baserade på flerdimensionella databaser är flera dataredigeringar möjliga, många produkter tillåter enstaka redigeringar men flera läsningar av data, medan andra är begränsade till endast läsning.

Dessa tre lagringsplatser har varierande lagringskapacitet och är ordnade i minskande kapacitetsordning. De har också olika frågeprestandaegenskaper: relationsdatabaser är mycket långsammare än de två senaste.

Alternativ för OLAP-databehandling

Det finns 3 av samma databehandlingsalternativ:

  • Använda SQL: det här alternativet används naturligtvis när du lagrar data i en RDB. SQL tillåter dock inte flerdimensionella beräkningar i en enda fråga, så komplexa SQL-frågor krävs för att inte uppnå något annat än normal flerdimensionell funktionalitet. Detta hindrar dock inte utvecklare från att försöka. I de flesta fall utför de ett begränsat antal relevanta SQL-beräkningar, med resultat som kan erhållas från flerdimensionell databehandling eller från klientmaskinen. Det är också möjligt att använda RAM, som kan lagra data med mer än en begäran: detta förbättrade svaret dramatiskt.
  • Flerdimensionell bearbetning på klientsidan: OLAP-klientprodukten gör beräkningarna på egen hand, men denna bearbetning är endast tillgänglig om användarna har relativt kraftfulla datorer.

Flerdimensionell bearbetning på serversidan: Detta är en populär plats för flerdimensionell beräkning i klient/server OLAP-applikationer och används i många produkter. Prestanda är vanligtvis bra eftersom det mesta av beräkningen redan har gjorts. Detta kräver dock mycket diskutrymme.

OLAP-arkitekturmatris

Genom att kombinera lagrings-/bearbetningsalternativ kan du följaktligen få en matris av OLAP-systemarkitekturer. Följaktligen kan det teoretiskt finnas 9 kombinationer av dessa metoder. Men eftersom 3 av dem saknar sunt förnuft, finns det i verkligheten bara 6 alternativ för att lagra och bearbeta OLAP-data.

Flerdimensionella förvaringsmöjligheter
data

Varianter
flerdimensionell
databehandling

Relationsdatabas

Flerdimensionell databas på serversidan

Klientdator

Cartesis storlek

Flerdimensionell serverbehandling

Crystal Holos (ROLAP-läge)

IBM DB2 OLAP Server

CA EUREKA: Strategi

Informix MetaCube

Speedware Media / MR

Microsoft Analysis Services

Oracle Express (ROLAP-läge)

Pilotanalysserver

Applicera iTM1

Kristall holos

Comshare-beslut

Hyperion Essbase

Oracle Express

Speedware Media / M

Microsoft Analysis Services

PowerPlay Enterprise Server

Pilotanalysserver

Applicera iTM1

Flerdimensionell bearbetning på klientdatorn

Oracle Discoverer

Informix MetaCube

Dimensionell insikt

Hyperion Enterprise

Cognos PowerPlay

Personlig Express

iTM1 Perspektiv

Eftersom det är lagring som avgör bearbetningen är det vanligt att gruppera efter lagringsalternativ, det vill säga:

  • ROLAP-produkter inom sektorerna 1, 2, 3
  • Desktop OLAP - i sektor 6

MOLAP-produkter - i sektorerna 4 och 5

HOLAP-produkter (tillåter både flerdimensionell och relationell datalagring) - i 2 och 4 (i kursiv stil)

OLAP produktkategorier

Det finns mer än 40 OLAP-leverantörer, även om alla av dem inte kan betraktas som konkurrenter, eftersom deras kapacitet är mycket olika och i själva verket arbetar de inom olika marknadssegment. De kan grupperas i 4 grundläggande kategorier, som skiljer sig beroende på begreppen: komplex funktionalitet - enkel funktionalitet, prestanda - diskutrymme. Det är bekvämt att avbilda kategorierna i form av en kvadrat eftersom det tydligt visar förhållandet mellan dem. Ett särdrag för var och en av kategorierna presenteras på sin sida, och likheterna med andra - på de intilliggande sidorna är därför kategorierna på motsatta sidor fundamentalt olika.

Egenheter

Fördelar

nackdelar

Representanter

Tillämpade OLAP

Kompletta applikationer, rika på funktionalitet. Nästan alla kräver en flerdimensionell databas, även om vissa fungerar med en relationsdatabas också. Många av denna kategori av applikationer är specialiserade, till exempel försäljning, tillverkning, bank, budgetering, finansiell konsolidering, försäljningsanalys

Förmåga att integrera med olika applikationer

Hög funktionalitet

Hög nivå av flexibilitet och skalbarhet

Applikationskomplexitet (behov av användarutbildning)

Högt pris

Hyperion Solutions

Kristallbeslut

Informationsbyggare

Produkten är baserad på en icke-relationell datastruktur som ger flerdimensionell lagring, bearbetning och presentation av data. Data i analysprocessen väljs uteslutande från en flerdimensionell struktur. Trots den höga nivån av öppenhet övertalar leverantörer kunderna att köpa sin egen verktygslåda.

Hög prestanda (snabba summeringsberäkningar och olika flerdimensionella transformationer för alla dimensioner). Den genomsnittliga svarstiden på en ad hoc analytisk fråga när man använder en flerdimensionell databas är vanligtvis 1-2 storleksordningar mindre än i fallet med en RDB

Hög grad av öppenhet: ett stort antal produkter med vilka integration är möjlig

De klarar enkelt av uppgifterna att inkludera olika inbyggda funktioner i informationsmodellen, utföra specialiserad analys av användaren, etc.

Behovet av ett stort diskutrymme för lagring av data (på grund av redundansen av data som lagras). Detta är en extremt ineffektiv användning av minne - på grund av denormalisering och tidigare utförd aggregering motsvarar mängden data i en flerdimensionell databas 2,5-100 gånger mindre än volymen av den ursprungliga detaljerade datan. MOLAP tillåter i alla fall inte arbete med stora databaser. Den verkliga gränsen är en bas på 10-25 gigabyte

Potentiell databasexplosion - oväntad, skarp, oproportionerlig ökning av dess volym

Brist på flexibilitet när det är nödvändigt att modifiera datastrukturer. Varje förändring i dimensionsstrukturen kräver nästan alltid en fullständig omstrukturering av hyperkuben.

För flerdimensionella databaser finns det för närvarande inga enhetliga standarder för gränssnittet, språk för att beskriva och manipulera data

Hyperion (Essbase)

DOLAP (OLAP för dator)

Kundens OLAP-produkter som är enkla nog att implementera och har låg kostnad per plats

Vi talar om sådan analytisk bearbetning, där hyperkuber är små, deras dimension är liten, behoven är blygsamma och för sådan analytisk bearbetning räcker det med en personlig maskin på skrivbordet.

Målet för tillverkare på denna marknad är att automatisera hundratals och tusentals arbetsplatser, men användarna måste göra en ganska enkel analys. Köpare uppmanas ofta att köpa fler jobb än nödvändigt

Bra databasintegration: flerdimensionell, relationell

Möjligheten att göra komplexa inköp, vilket minskar kostnaderna för implementeringsprojekt

Användarvänlighet för applikationer

Mycket begränsad funktionalitet (inte jämförbar i detta avseende med specialiserade produkter)

Mycket begränsad effekt (små datavolymer, få mätningar)

Cognos (PowerPlay)

Affärsobjekt

Kristallbeslut

Detta är den minsta sektorn på marknaden.

Detaljdata finns kvar där de ursprungligen var - i en relationsdatabas; vissa aggregat lagras i samma databas i speciellt skapade tjänstetabeller

Kan hantera mycket stora mängder data (ekonomisk lagring)

Ger ett driftläge för flera användare, inklusive redigeringsläge, inte bara läsning

Högre nivå av dataskydd och goda möjligheter till differentiering av åtkomsträttigheter

Frekventa ändringar av mätstrukturen är möjliga (kräver ingen fysisk omorganisation av databasen)

Dålig prestanda, avsevärt bättre än flerdimensionellt när det gäller svarshastighet (svar på komplexa frågor mäts i minuter eller till och med timmar snarare än sekunder). De är mer användarvänliga rapportbyggare än interaktiva analysverktyg

Produkternas komplexitet. Kräver betydande IT-servicekostnader. Relationssystem kräver noggrann databasschema och indexjustering för att uppnå prestanda jämförbar med MOLAP, vilket innebär mycket ansträngning från DBA:s sida.

Kostsamt att genomföra

SQL-begränsningar förblir en realitet, vilket förhindrar att många inbyggda funktioner som enkelt tillhandahålls i system baserade på multidimensionell datarepresentation från att implementeras i ett RDBMS.

Informationsfördel

Informix (MetaCube)

Det bör noteras att konsumenter av hybridprodukter som tillåter val av ROLAP- och MOLAP-läge, såsom Microsoft Analysis Services, OracleExpress, Crystal Holos, IBM DB2 OLAPServer, nästan alltid väljer MOLAP-läge.

Var och en av de presenterade kategorierna har sina egna styrkor och svagheter, det finns inget optimalt val. Valet påverkar 3 viktiga aspekter: 1) prestation; 2) diskutrymme för datalagring; 3) kapaciteten, funktionaliteten och särskilt skalbarheten hos OLAP-lösningen. Samtidigt är det nödvändigt att ta hänsyn till volymerna av bearbetade data, teknikens kraft, användarnas behov och leta efter en kompromiss mellan hastighet och redundans av diskutrymme som upptas av databasen, enkel och mångsidig.

Klassificering av datalager i enlighet med storleken på måldatabasen

Nackdelar med OLAP

Liksom all OLAP-teknik har den också sina nackdelar: höga krav på hårdvara, utbildning och kunskap om administrativ personal och slutanvändare, höga kostnader för genomförandet av implementeringsprojektet (både ekonomiskt och tidsmässigt, intellektuellt).

Att välja en OLAP-produkt

Att välja rätt OLAP-produkt är svårt, men mycket viktigt om du vill att ditt projekt inte ska misslyckas.

Som du kan se ligger produktskillnaderna inom många områden: funktionella, arkitektoniska, tekniska. Vissa produkter är ganska begränsade i anpassning. Vissa är designade för specialiserade ämnesområden: marknadsföring, försäljning, ekonomi. Det finns produkter för allmänna ändamål, som inte är avsedda för applikationsanvändning, som bör vara tillräckligt flexibla. Som regel är sådana produkter billigare än specialiserade, men det finns fler implementeringskostnader. Utbudet av OLAP-produkter är mycket brett - från de enklaste verktygen för att bygga pivottabeller och diagram som ingår i kontorsprodukter, till dataanalys och sökning efter mönster, vars kostnad är tiotusentals dollar.

Som med alla fält kan det inte finnas några definitiva riktlinjer för valet av verktyg i OLAP-området. Du kan bara fokusera på ett antal nyckelpunkter och matcha mjukvarufunktionerna som erbjuds till organisationens behov. En sak är viktig: om du inte tänker på hur du ska använda OLAP-verktyg riskerar du att få en kraftig huvudvärk.

I urvalsprocessen är det nödvändigt att överväga två frågor:

  • bedöma företagets behov och kapacitet
  • bedöma det befintliga utbudet på marknaden är utvecklingstrender också viktiga

Sedan kan allt detta jämföras och i själva verket göra ett val.

Behöver granskning

Du kan inte göra ett rationellt val av en produkt utan att förstå vad den ska användas till. Många företag vill ha den "bästa produkten" utan en klar förståelse för hur den ska användas.

För att projektet ska kunna genomföras framgångsrikt måste CFO åtminstone korrekt formulera sina önskemål och krav till chefen och automationstjänstespecialisterna. Många problem uppstår på grund av otillräcklig beredskap och information för att välja OLAP, IT-specialister och slutanvändare upplever kommunikationssvårigheter bara för att de manipulerar olika begrepp och termer i ett samtal och framför motstridiga preferenser. Du behöver konsekvens i syfte inom företaget.

Flera faktorer har redan blivit uppenbara efter att ha läst översikten över OLAP-produktkategorier, nämligen:

Tekniska aspekter

  • Datakällor: företagsdatalager, OLTP-system, tabellfiler, relationsdatabaser. Möjlighet att länka OLAP-verktyg med alla DBMS som används i organisationen. Som praxis visar är integrationen av olika produkter i ett stabilt operativsystem en av de viktigaste frågorna, och dess lösning kan i vissa fall vara förknippad med stora problem. Det är nödvändigt att förstå hur enkelt och tillförlitligt det är att integrera OLAP-verktyg med befintliga DBMS i organisationen. Det är också viktigt att utvärdera möjligheterna till integration inte bara med datakällor utan även med andra applikationer som du kan behöva exportera data till: e-post, kontorsapplikationer
  • Variabiliteten av data som beaktas
  • Serverplattform: NT, Unix, AS / 400, Linux - men insistera inte på att OLAP-specifika produkter körs på tvivelaktiga eller döende plattformar som du fortfarande använder
  • Klientsidan och webbläsarstandarder
  • Utplacerad arkitektur: LAN och PC-modem, höghastighetsklient/server, intranät, extranät, Internet
  • Internationella funktioner: stöd för flera valutor, flerspråkig operation, datadelning, lokalisering, licensiering, Windows-uppdatering

Mängder ingående information som är tillgänglig och som kommer att dyka upp i framtiden

Medlemmar

  • Tillämpningsområde: analys av försäljning/marknadsföring, budgetering/planering, analys av resultatindikatorer, analys av redovisningsrapporter, kvalitativ analys, ekonomiskt läge, bildande av analytiskt material (rapporter)
  • Antalet användare och deras plats, krav på åtskillnad av åtkomsträttigheter till data och funktioner, sekretess (sekretess) för information
  • Användarvy: företagsledning, ekonomi, marknadsföring, HR, försäljning, tillverkning, etc.
  • Användarupplevelse. Användarkompetensnivå. Överväg att ge utbildning. Det är mycket viktigt att OLAP-klientapplikationen är sådan att användarna känner sig trygga och kan använda den effektivt.

Nyckelfunktioner: behov av återskrivning av data, distribuerad beräkning, komplexa valutaomvandlingar, behov av att skriva ut rapporter, kalkylbladsgränssnitt, komplexitet i tillämpningslogik, nödvändig dimension, typer av analys: statistisk, målsökning, vad-om-analys

Genomförande

  • Vem ska implementera och driva: externa konsulter, intern IT eller slutanvändare
  • Budget: mjukvara, hårdvara, tjänster, dataöverföring. Kom ihåg att OLAP-produktlicenser bara är en liten bråkdel av den totala projektkostnaden. Implementerings- och hårdvarukostnaderna kan vara högre än licensavgifterna, och de långsiktiga kostnaderna för support, underhåll och administration är nästan säkert betydligt högre. Och om du fattade fel beslut att köpa fel produkt bara för att den är billigare, kan du i slutändan få en högre total projektkostnad på grund av högre kostnader för underhåll, administration och/eller hårdvara, samtidigt som du sannolikt kommer att få lägre affärsfördelar . När du uppskattar totala kostnader, se till att ställa följande frågor: Hur stort är urvalet av källor för implementering, utbildning och support? Är den potentiella allmänna aktien (anställda, entreprenörer, konsulter) benägna att växa eller minska? Hur brett kan din arbetslivserfarenhet användas?

Trots det faktum att kostnaden för analytiska system även i dag är ganska hög, och metoderna och teknikerna för implementering av sådana system fortfarande är på det stadium av deras bildande, även idag, överstiger den ekonomiska effekten som tillhandahålls av dem betydligt effekten av traditionella operativa system.

Effekten av korrekt organisation, strategisk och operativ planering av affärsutveckling är svår att uppskatta i siffror i förväg, men det är uppenbart att det kan överstiga kostnaderna för att implementera sådana system med tiotals eller till och med hundratals gånger. Man ska dock inte missta sig. Effekten tillhandahålls inte av systemet i sig, utan av människorna som arbetar med det. Därför är deklarationer av typen: "systemet med datalager och OLAP-tekniker hjälper chefen att fatta rätt beslut" inte helt korrekta. Moderna analytiska system är inga artificiella intelligenssystem och de kan varken hjälpa eller hindra beslutsfattande. Deras mål är att förse chefen med all information som behövs för att fatta ett beslut i lämplig form i tid. Och vilken information som kommer att begäras och vilket beslut som kommer att fattas på grundval av den beror bara på den specifika person som använder den.

En sak återstår att säga, dessa system kan hjälpa till att lösa många affärsproblem och kan ha långtgående positiva effekter. Det återstår bara att vänta vem som blir den första att inse fördelarna med detta tillvägagångssätt och kommer att ligga före de andra.

Begreppet multivariat dataanalys är nära besläktat med operationsanalys, som utförs med hjälp av OLAP-system.

OLAP (On-Line Analytical Processing) är en teknik för on-line analytisk databehandling som använder metoder och verktyg för att samla in, lagra och analysera flerdimensionell data för att stödja beslutsprocesser.

Huvudsyftet med OLAP-system är att stödja analytiska aktiviteter, godtyckliga (termen ad-hoc används ofta) förfrågningar från analytikeranvändare. Syftet med OLAP-analys är att testa nya hypoteser.

I ursprunget till OLAP-teknologin är grundaren av det relationella tillvägagångssättet E. Codd. 1993 publicerade han en artikel med titeln "OLAP for Analytic Users: How It Should Be". Det här dokumentet beskriver de grundläggande koncepten för analytisk bearbetning online och identifierar följande 12 krav som måste uppfyllas av produkter som tillåter analytisk bearbetning online. Tokmakov G.P. Databas. Databaskoncept, relationsdatamodell, SQL-språk. S. 51

Nedan listas 12 regler som beskrivs av Codd som definierar OLAP.

1. Multidimensionalitet - OLAP-system på konceptuell nivå bör representera data i form av en multidimensionell modell, vilket förenklar processerna för analys och uppfattning av information.

2. Transparens - OLAP-systemet måste dölja för användaren den verkliga implementeringen av den flerdimensionella modellen, sättet att organisera, källor, bearbetning och lagringsmöjligheter.

3. Tillgänglighet - OLAP-systemet bör ge användaren en enda, konsekvent och komplett datamodell, som ger tillgång till data oavsett hur och var den lagras.

4. Konsekvent prestanda vid utveckling av rapporter - OLAP-systems prestanda bör inte försämras avsevärt med en ökning av antalet dimensioner som analyseras.

5. Klient-server-arkitektur - OLAP-systemet måste kunna fungera i en klient-server-miljö, eftersom merparten av den data som idag behöver utsättas för analytisk bearbetning online lagras på ett distribuerat sätt. Huvudtanken här är att serverkomponenten i OLAP-verktyget ska vara tillräckligt intelligent och tillåta att bygga ett allmänt konceptuellt schema baserat på generalisering och konsolidering av olika logiska och fysiska scheman i företagsdatabaser för att säkerställa effekten av transparens.

6. Lika dimensioner - OLAP-systemet måste stödja en flerdimensionell modell där alla dimensioner är lika. Vid behov kan ytterligare egenskaper tillhandahållas för individuella dimensioner, men en sådan möjlighet måste tillhandahållas för alla dimensioner.

7. Dynamisk hantering av glesa matriser - OLAP-systemet ska ge optimal bearbetning av glesa matriser. Åtkomsthastigheten bör bibehållas oavsett var datacellerna befinner sig och vara konstant för modeller med olika antal dimensioner och olika grader av datagleshet.

8. Stöd för fleranvändarläge - OLAP-systemet bör ge möjligheten att arbeta flera användare tillsammans med en analytisk modell eller skapa olika modeller för dem från en enda data. I det här fallet är både läsning och skrivning av data möjligt, därför måste systemet säkerställa deras integritet och säkerhet.

9. Obegränsade korsoperationer - OLAP-systemet måste säkerställa bevarandet av funktionella relationer som beskrivs med hjälp av ett visst formellt språk mellan cellerna i hyperkuben när de utför alla operationer av skiva, rotation, konsolidering eller detaljering. Systemet bör självständigt (automatiskt) utföra omvandlingen av de etablerade relationerna utan att användaren behöver omdefiniera dem.

10. Intuitiv datamanipulation - Ett OLAP-system bör tillhandahålla ett sätt att utföra segmenterings-, rotations-, konsoliderings- och drill-down-operationer på en hyperkub utan att användaren behöver göra en massa gränssnittsåtgärder. De mätningar som definieras i den analytiska modellen måste innehålla all nödvändig information för att utföra ovanstående operationer.

11. Flexibla möjligheter att ta emot rapporter - OLAP-systemet bör stödja olika sätt för datavisualisering, dvs. rapporterna bör presenteras i alla möjliga riktningar. Rapporteringsverktyg bör presentera syntetiserad data eller information som härrör från datamodellen i alla möjliga riktningar. Det betyder att rader, kolumner eller sidor måste visa från 0 till N dimensioner samtidigt, där N är antalet dimensioner i hela analysmodellen. Dessutom måste varje innehållsdimension som visas i en enda post, kolumn eller sida kunna visa vilken delmängd som helst av elementen (värdena) som finns i dimensionen, i valfri ordning.

12. Obegränsad dimension och antal aggregationsnivåer - En studie av det möjliga antalet nödvändiga dimensioner som krävs i en analytisk modell har visat att upp till 19 dimensioner kan användas samtidigt. Därav den starka rekommendationen att analysverktyget samtidigt kan ge minst 15, och helst 20 mätningar. Dessutom bör var och en av de allmänna dimensionerna inte begränsas av antalet användaranalytiska användardefinierade aggregeringsnivåer och konsolideringsvägar.

Ytterligare Codd-regler.

Uppsättningen av dessa krav, som fungerade som de facto-definitionen av OLAP, orsakar ganska ofta olika klagomål, till exempel är reglerna 1, 2, 3, 6 krav och reglerna 10, 11 är oformella önskemål. Tokmakov G.P. Databas. Databaskoncept, relationsdatamodell, SQL-språk. S. 68 Således tillåter de listade 12 kraven i Codd inte att exakt definiera OLAP. 1995 lade Codd till följande sex regler till listan:

13. Batchextraktion kontra tolkning - Ett OLAP-system bör ge tillgång till både inhemska och externa data lika effektivt.

14. Stöd för alla OLAP-analysmodeller — Ett OLAP-system måste stödja alla fyra dataanalysmodeller som definierats av Codd: kategorisk, tolkande, spekulativ och stereotyp.

15. Behandling av onormaliserade data - OLAP-systemet måste integreras med onormaliserade datakällor. Dataändringar som görs i OLAP-miljön bör inte ändra data som lagras i de ursprungliga externa systemen.

16. Spara OLAP-resultat: lagra dem separat från originaldata - ett OLAP-system som arbetar i läs-skrivläge bör spara resultaten separat efter att ha modifierat originaldata. Med andra ord är säkerheten för originaldata säkerställd.

17. Eliminera saknade värden - OLAP-systemet måste, när data presenteras för användaren, kassera alla saknade värden. Med andra ord, saknade värden måste skilja sig från nollvärden.

18. Hantera saknade värden - OLAP-systemet bör ignorera alla saknade värden oavsett källa. Denna funktion är associerad med den 17:e regeln.

Dessutom delade Codd upp alla 18 regler i följande fyra grupper och kallade dem funktioner. Dessa grupper hette B, S, R och D.

Nyckelfunktioner (B) inkluderar följande regler:

Flerdimensionell konceptuell representation av data (regel 1);

Intuitiv datamanipulation (regel 10);

Tillgänglighet (regel 3);

Batchextraktion kontra tolkning (regel 13);

Stöd för alla OLAP-analysmodeller (regel 14);

Klient-server-arkitektur (regel 5);

Öppenhet (regel 2);

Stöd för flera spelare (regel 8)

Specialfunktioner (S):

Behandling av onormaliserade data (regel 15);

Spara OLAP-resultat: hålla dem åtskilda från originaldata (regel 16);

Eliminering av saknade värden (regel 17);

Hantering av saknade värden (regel 18). Rapporteringsfunktioner (R):

Flexibilitet vid generering av rapporter (regel 11);

Standardrapporteringsresultat (regel 4);

Automatisk konfiguration av fysiskt lager (modifierad originalregel 7).

Mätkontroll (D):

Universalitet av mätningar (regel 6);

Obegränsat antal dimensioner och aggregeringsnivåer (regel 12);

Obegränsade operationer mellan dimensioner (regel 9).







2021 gtavrl.ru.