Konventionella oltp -system som kommer. OLTP -teknikverktyg


OLTP- och OLAP -system

I föregående underavsnitt noterades att för en adekvat representation ämnesområde För att underlätta utvecklingen och underhållet av databasen bör relationerna reduceras till den tredje normala formen (det finns former av normalisering och högre order, men i praktiken används de ganska sällan), det vill säga starkt normaliserade. Svagt normaliserade relationer har emellertid också sina fördelar, vars huvudsakliga är att om databasen huvudsakligen nås med frågor och datamodifieringar och tillägg utförs mycket sällan, görs deras val mycket snabbare. Detta förklaras av det faktum att i svagt normaliserade relationer har deras anslutning redan gjorts, och ingen processortid slösas på detta. Det finns två systemklasser för vilka starkt och svagt normaliserade relationer är mer lämpade.

Starkt normaliserade datamodeller är väl lämpade för OLTP -applikationer - På - Linje Transaktion Bearbetning (OLTP) - applikationer operativ behandling transaktioner. Typiska exempel på OLTP -applikationer är system lagerbokföring, biljettbeställningar, operativa banksystem och andra. Huvudfunktion liknande systemär att göra ett stort antal korta transaktioner. Transaktionerna i sig är ganska enkla, men problemet är att det finns många sådana transaktioner, de utförs samtidigt, och om fel uppstår måste transaktionen rulla tillbaka och återföra systemet till det tillstånd där det var innan transaktionen började. Nästan alla databasfrågor i OLTP -applikationer består av infoga, uppdatera och ta bort kommandon. Urvalsfrågor är främst utformade för att ge användarna ett urval av data från olika typer av kataloger. Således är de flesta förfrågningarna kända i förväg i stadiet av systemdesign. Avgörande för OLTP -applikationer är hastigheten och tillförlitligheten för korta datauppdateringar. Ju högre datanormalisering i OLTP -applikationer desto snabbare och mer tillförlitlig. Avvikelser från denna regel kan inträffa när det redan i utvecklingsstadiet är känt några ofta förekommande frågor som kräver anslutning av relationer och hur applikationer fungerar beror på vilken hastighet de utförs.

En annan typ av applikationer är OLAP -applikationer - På - Linje Analitiskt Bearbetning (OLAP) - applikationer för analytisk databehandling online. Detta är en generaliserad term som kännetecknar principerna för att bygga beslutsunderstödssystem - Beslutsstödsystem (DSS), datalager - Datavarehus, dataminingssystem - Data Mining. Sådana system är utformade för att hitta beroenden mellan data, för att utföra dynamisk analys enligt principen "vad händer om ..." och liknande uppgifter. OLAP -applikationer fungerar med stora mängder data som samlats in i företaget eller hämtats från andra källor. Sådana system kännetecknas av följande funktioner:

    tillägg av ny data till systemet sker relativt sällan i stora block, till exempel en gång i månaden eller kvartalet; data som läggs till systemet raderas som regel aldrig;
    innan laddning går data igenom olika förberedande procedurer som är associerade med att konvertera dem till vissa format och liknande; förfrågningar till systemet är ad hoc och ganska komplexa; hastigheten på frågekörningen är viktig, men inte kritisk.

Databaser för OLAP -applikationer representeras vanligtvis som en eller flera hyperkubar, vars dimensioner är referensdata och värdena för dessa data lagras i cellerna i själva hyperkuben. Fysiskt kan en hyperkub byggas baserat på en speciell flerdimensionell datamodell - Flerdimensionell OLAP (MOLAP) eller representeras med medel relationsmodell data - Relationellt OLAP (ROLAP).

I OLAP-system som använder en relationsdatamodell är det lämpligt att lagra data i form av svagt normaliserade relationer som innehåller förberäknad grundläggande sammanfattningsdata. Redundans av data och problemen som är förknippade med det är inte fruktansvärda här, eftersom deras uppdatering sker ganska sällan och tillsammans med datauppdateringen beräknas totalen om.

Egenskaperna och arbetsuppgifterna som effektivt löses med varje teknik illustreras av följande jämförelsetabell:

Karakteristisk

OLTP

OLAP

Syftet med systemet

Registrering, onlinesökning och bearbetning av transaktioner, reglerad analys

Arbeta med historiska data, analytisk bearbetning, prognoser, modellering

Lagrade data

Operativt, detaljerat

Täcker en lång tid, aggregerad

Data typ

Strukturerad

Olika

"Ålder" av data

Nuvarande (flera månader)

Historiskt (genom åren) och projicerat

Uppdateringsfrekvens för data

Hög, i små "portioner"

Små, stora "portioner"

Data aggregeringsnivå

Detaljerad information

Mestadels aggregerad data

Rådande verksamhet

Datainmatning, sökning, uppdatering

Dataanalys

Hur data används

Förutsägbar

Oförutsägbar

På transaktionsnivå

På nivån för hela databasen

Typ av aktivitet

Operativt, taktiskt

Analytiskt, strategiskt

Prioriteringar

Flexibilitet
Användarens autonomi

Ett stort antal ledande anställda

Relativt litet antal chefer

Jämförelse av OLTP och OLAP

Karakteristisk

OLTP

OLAP

Typ av förfrågningar

Många enkla transaktioner

Komplexa transaktioner

Lagrade data

Operativt, detaljerat

Täcker en lång tid, aggregerad

Typ av aktivitet

Operativt, taktiskt

Analytiskt, strategiskt

Data typ

Strukturerad

Olika

Systemegenskaper

Redovisningssystemet(OLTP)

OLAP

Användarinteraktion

På transaktionsnivå

På nivån för hela databasen

Data som används när en användare kommer åt systemet

Separata poster

Spela in grupper

Respons tid

Sekunder

Från några sekunder till några minuter

Maskinvaruresursutnyttjande

Stabil

Dynamisk

Typ av data

Mestadels primärt (mest låg nivå detaljer)

Mestadels derivat (sammanfattande värden)

Typen av databasåtkomst

Fördefinierade eller statiska åtkomstvägar och dataförhållanden

Odefinierade eller dynamiska åtkomstvägar och datarelationer

Datavolatilitet

Hög (data uppdateras för varje transaktion)

Låg (data uppdateras sällan under en fråga)

Prioriteringar

Hög prestanda Hög tillgänglighet

Flexibilitet
Användarens autonomi

Idag, bland verktygen som erbjuds av informationsteknologimarknaden, är OLTP- och OLAP -teknik mest ansvariga för bearbetning och visualisering av data för att fatta ledningsbeslut. OLTP -tekniken är inriktad på online databehandling, medan mer modern OLAP -teknik är inriktad på interaktiv dataanalys. De system som utvecklats på grundval av dem gör det möjligt att uppnå förståelse för processerna som sker vid kontrollobjektet med hjälp av snabb åtkomst till olika dataskivor (representationer av innehållet i databaser organiserade på ett sådant sätt att de reflekterar olika aspekter företagets verksamhet). I synnerhet genom att tillhandahålla grafiska representationer av data kan OLAP göra bearbetningsresultat datalungor för uppfattning.

OLTP (Online Transaction Processing) - transaktionsbehandling i realtid. Ett sätt att organisera en databas, där systemet fungerar med små transaktioner, men med ett stort flöde, och samtidigt kräver klienten maximalt snabb tid svar.

V moderna DBMS serialisering av transaktioner organiseras genom låsmekanismen, d.v.s. under transaktionens längd låser DBMS databasen eller en del av den som transaktionen kommer åt, låset kvarstår tills transaktionen begås. Om i processen parallell bearbetning en annan transaktion gör ett försök att komma åt de låsta uppgifterna, sedan avbryts behandlingen av transaktionen och återupptas först efter genomförd transaktion som låste data och låset släpptes. Ju mindre det blockerade objektet är, desto större är databasens effektivitet. En transaktion som uppdaterar data på flera värdar kallas DISTRIBUERAD. Om en transaktion fungerar med en databas som ligger på en nod, kallas den LOCAL. Ur användarens synvinkel bör lokala och distribuerade transaktioner behandlas på samma sätt, d.v.s. DBMS bör organisera processen för att utföra distributionen av en transaktion så att alla lokala transaktioner som ingår i den synkroniseras på alla noder som påverkas av dem distribuerat system... I detta fall bör en distribuerad transaktion endast utföras när alla dess ingående lokala transaktioner har begåtts, och om minst en av de lokala transaktionerna avbryts bör hela den distribuerade transaktionen också avbrytas. För att implementera dessa krav i praktiken använder DBMS en tvåstegsmekanism för transaktionsåtaganden.

1. Databaseservern som utför en distribuerad transaktion skickar kommandot "Förbered för att begå" till alla nätverksnoder som är registrerade för att utföra transaktioner. Om minst en av servrarna inte ger ett beredskapssvar, rullar den distribuerade databasservern tillbaka den lokala transaktionen på alla noder.

2. Alla lokala DBMS är redo att göra åtaganden, dvs. servern behandlar den distribuerade transaktionen, avslutar sitt åtagande genom att skicka kommandot för att begå transaktionen till alla lokala servrar.

OLAP (online analytisk behandling) är en informationsteknologi som inkluderar sammanställning och dynamisk publicering av rapporter och dokument. Används av analytiker för att snabb behandling komplexa frågor till databasen. Tjänar för upprättande av affärsrapporter om försäljning, marknadsföring, för ledningsändamål, den s.k. datamining- data mining (en metod för att analysera information i en databas för att hitta avvikelser och trender utan att ta reda på det semantisk mening uppgifter).

OLAP tar en ögonblicksbild av en relationsdatabas och strukturerar den till en rumslig modell för frågor. Den påstådda behandlingstiden för frågor i OLAP är cirka 0,1% av liknande frågor i en relationsdatabas.

En OLAP -struktur som skapas från driftdata kallas en OLAP -kub. En kub skapas från sammanfogning av tabeller med ett stjärnschema eller snöflinga. I mitten av stjärnschemat finns en faktatabell som innehåller de viktigaste fakta som efterfrågas. Flera dimensionstabeller är kopplade till faktatabellen. Dessa tabeller visar hur aggregerade relationsdata kan analyseras. Antalet möjliga aggregeringar bestäms av antalet sätt på vilka originaldata kan visas hierarkiskt.

Till exempel kan alla kunder grupperas efter stad eller landsregion (väst, öst, norr, etc.), så 50 städer, 8 regioner och 2 länder utgör 3 hierarkinivåer med 60 medlemmar. Kunder kan också vara enade i förhållande till produkter; om det finns 250 produkter i 2 kategorier, 3 produktgrupper och 3 produktionsenheter, blir antalet enheter 16 560. När du lägger till mått i diagrammet, kommer antalet möjliga alternativ når snabbt tiotals miljoner eller mer.

En OLAP -kub innehåller grundläggande data och information om dimensioner (aggregat). Kuben innehåller eventuellt all information som kan krävas för att besvara eventuella frågor. På grund av det stora antalet aggregat sker ofta en fullständig beräkning endast för vissa mätningar, medan för resten görs "på begäran".

Svårigheten med att använda OLAP ligger i att skapa frågor, välja underliggande data och designa ett schema, med det resultat att de flesta moderna OLAP -produkter kommer med stor mängd förkonfigurerade förfrågningar. Ett annat problem är i de underliggande uppgifterna. De måste vara fullständiga och konsekventa.

Den första produkten som körde OLAP -frågor var Express (från IRI). Termen OLAP själv myntades dock av Edgar Codd, "fadern till relationsdatabaser". Och Codds arbete finansierades av Arbor, företaget som släppte sin egen OLAP -produkt, Essbase (senare förvärvat av Hyperion, som förvärvades av Oracle 2007) - ett år tidigare.

Andra välkända OLAP-produkter inkluderar Microsoft Analysis Services (tidigare OLAP Services, del SQL Server), Oracle OLAP Option, DB2 OLAP Server från IBM (faktiskt EssBase med tillägg från IBM), SAP BW, SAS OLAP Server, Brio -produkter, BusinessObjects, Cognos, MicroStrategy och andra tillverkare.

Den bästa OLAP -applikation finns i affärsplaneringsprodukter och datalager.

OLAP använder en flerdimensionell vy av aggregerad data för att tillhandahålla snabb åtkomst till strategiskt viktig information för en fördjupad analys. OLAP -program måste ha följande grundläggande egenskaper:

OLAP -fördelar:

  • öka produktiviteten hos produktionspersonal, utvecklare applikationsprogram... Tidig tillgång till strategisk information.
  • ger användarna tillräcklig möjlighet att göra egna förändringar in i kretsen.
  • OLAP-applikationer förlitar sig på datalager och OLTP-system för att ta emot uppdaterad data från dem, vilket gör att du kan behålla kontrollen över integriteten hos företagsdata.
  • minska belastningen på OLTP -system och datalager.
OLAP OLTP
Datalagret måste innehålla både intern företagsdata och extern data den huvudsakliga informationskällan som kommer in i den operativa databasen är företagets verksamhet, och för analys av data, deltagande av Externa källor information (t.ex. statistiska rapporter)
Volymen av analytiska databaser är minst en storleksordning större än volymen av operativa. För att kunna utföra tillförlitlig analys och prognoser i datalagret måste du ha information om företagets verksamhet och marknadens tillstånd i flera år För operativ behandling krävs data i några få senaste månaderna
Datalagret bör innehålla enhetligt presenterad och överenskommen information som bäst matchar innehållet i operativa databaser. En komponent behövs för att extrahera och "rengöra" information från olika källor. Många stora företag har samtidigt flera operativa IS med egna databaser (av historiska skäl). Operativa databaser kan innehålla semantiskt likvärdig information som presenteras i olika format, med en annan indikation på tidpunkten för mottagandet, ibland till och med motsägelsefull
Uppsättningen av frågor mot en analytisk databas är omöjlig att förutsäga. datalager finns för att svara på förfrågningar från ad hoc -analytiker. Du kan bara räkna med att förfrågningar inte kommer för ofta och innebär stora mängder information. Storleken på den analytiska databasen stimulerar användningen av frågor med aggregat (summa, minimum, max, genomsnitt, etc.) Databehandlingssystem skapas för att lösa specifika problem. Information från databasen väljs ofta och i små portioner. Vanligtvis är uppsättningen av frågor till den operativa databasen känd redan under konstruktionen.
Med låg variation i analytiska databaser (endast vid laddning av data) visar det sig att ordningen av arrays är rimlig, mer snabba metoder indexering för massprovtagning, lagring av föraggregerad data Databehandlingssystem är till sin natur mycket flyktiga, vilket beaktas i det använda DBMS (normaliserad databasstruktur, strängar lagras slumpmässigt, B-träd för indexering, transaktioner)
Analytisk databasinformation är så kritisk för ett företag att en stor granulering av skydd krävs (individuell åtkomsträtt till vissa rader och / eller tabellkolumner) För databehandlingssystem är informationsskydd på bordsnivå vanligtvis tillräckligt

Målen för OLTP -systemet är snabb insamling och den mest optimala placeringen av information i databasen, samt att säkerställa dess fullständighet, relevans och konsekvens. Sådana system är dock inte utformade för den mest effektiva, snabba och mångfacetterade analysen.

Naturligtvis är det möjligt att bygga rapporter om de insamlade uppgifterna, men detta kräver antingen att en affärsanalytiker ständigt interagerar med en IT -specialist, eller specialutbildning inom programmering och datorer.

Hur ser den traditionella beslutsprocessen ut Ryskt företag använder sig av informationssystem byggt på OLTP -teknik?

Chefen ger uppgiften till specialist på informationsavdelningen i enlighet med hans förståelse av frågan. Specialisten på informationsavdelningen, som har genomfört uppgiften på sitt eget sätt, bygger en förfrågan operativsystemet, tar emot en elektronisk rapport och gör det till chefens uppmärksamhet. Detta acceptansmönster är kritiskt viktiga beslut har följande betydande brister:

  • en obetydlig mängd data används;
  • processen tar länge sedan, eftersom utarbetandet av förfrågningar och tolkningen av en elektronisk rapport är ganska besvärliga operationer, medan chefen kan behöva fatta ett beslut omedelbart;
  • en upprepning av cykeln krävs om det är nödvändigt att klargöra data eller överväga data i ett annat sammanhang, samt om ytterligare frågor uppstår. Dessutom måste denna långsamma cykel upprepas och i regel mer än en gång, medan ännu mer tid läggs på dataanalys;
  • påverkas negativt av skillnaden i yrkesutbildning och IT -specialistens och chefens arbetsområden. De tänker ofta i olika kategorier och förstår därför inte varandra;
  • den negativa effekten utövas av en sådan faktor som komplexiteten hos elektroniska rapporter för uppfattning. Chefen har inte tid att välja intresset från rapporten, särskilt eftersom det kan vara för många av dem. Det är klart att arbetet med dataförberedelse oftast faller på specialisterna på informationsavdelningar. Som ett resultat distraheras en kompetent specialist av det rutinmässiga och ineffektiva arbetet med att göra tabeller, diagram, etc., vilket naturligtvis inte bidrar till att förbättra hans kvalifikationer.

Det finns bara en väg ut ur denna situation, och den formulerades av Bill Gates i form av uttrycket: "Information till hands." Den första informationen bör vara tillgänglig för dess direkta konsument - analytikern. Den är direkt tillgänglig. Och informationsavdelningens anställdas uppgift är att skapa ett system för insamling, ackumulering, lagring, skydd av information och säkerställande av dess tillgänglighet för analytiker.

Världsindustrin har länge varit bekant med detta problem, och i nästan 30 år har det funnits OLAP -teknik, som är utformad just för att affärsanalytiker ska kunna arbeta med ackumulerad data och direkt delta i deras analys. Sådana analyssystem är motsatsen till OLTP -system i den meningen att de eliminerar informationsredundans ("vik" information). Samtidigt är det uppenbart att det är redundansen av primär information som avgör analysens effektivitet. DSS, som kombinerar dessa tekniker, gör det möjligt att lösa ett antal uppgifter:

  • Analytiska uppgifter: beräkning av angivna indikatorer och statistiska egenskaper hos affärsprocesser baserat på historisk information som finns i datalager.
  • Datavisualisering: presenterar all tillgänglig information i en användarvänlig grafisk och tabellform.
  • Skaffa ny kunskap: bestämma relation och ömsesidigt beroende av affärsprocesser baserat på befintlig information(testa statistiska hypoteser, kluster, hitta associationer och tidsmönster).
  • Simuleringsproblem: matematisk modellering av komplexa systems beteende under en godtycklig tid. Med andra ord, det här är uppgifter relaterade till behovet av att svara på frågan: "Vad händer om ...?"
  • Syntes av kontroll: bestämning av tillåtna kontrollåtgärder som säkerställer uppnåendet av ett givet mål.
  • Optimeringsuppgifter: integration av simulering, hantering, optimering och statistiska metoder för modellering och prognoser.

Företagschefer använder verktyg OLAP -teknik, även utan särskild utbildning, kan självständigt och snabbt ta emot all information som behövs för att undersöka affärsmönster och i de flesta olika kombinationer och ögonblicksbilder av affärsanalyser. Affärsanalytikern har förmågan att se framför sig en lista över dimensioner och indikatorer på affärssystemet. Med så mycket enkelt gränssnitt en analytiker kan bygga alla rapporter, bygga om dimensioner (säg, göra tvärbord - lägg över en dimension på en annan). Dessutom får han möjlighet att skapa sina funktioner utifrån befintliga indikatorer, att utföra en "vad om" -analys - för att få ett resultat genom att ange beroenden för eventuella indikatorer för affärsfunktioner eller en affärsfunktion på indikatorer. Dessutom överskrider det maximala svaret för en rapport inte 5 sekunder.

Visste du, vad är falskheten i begreppet "fysiskt vakuum"?

Fysiskt vakuum - begreppet relativistisk kvantfysik, förstås det där som det lägsta (mark) energitillståndet i det kvantiserade fältet, som har noll momentum, vinkelmoment och andra kvantnummer. Relativistiska teoretiker kallar ett fysiskt vakuum ett utrymme helt saknat materia, fyllt med ett omätbart och därför bara ett imaginärt fält. Ett sådant tillstånd, enligt relativister, är inte en absolut tomhet, utan ett utrymme fyllt med några fantom (virtuella) partiklar. Relativistisk kvantefältteori hävdar att, i enlighet med Heisenbergs osäkerhetsprincip, virtuella, det vill säga uppenbara (för vem?), Föds hela tiden partiklar och försvinner i det fysiska vakuumet: så kallade nollpunktsfältoscillationer uppstår. Per definition har virtuella partiklar i det fysiska vakuumet, och därför i sig själva, inte en referensram, eftersom annars Einsteins relativitetsteori, som relativitetsteorin bygger på, skulle kränkas (det vill säga ett absolut system av mätning med referens från partiklar i ett fysiskt vakuum skulle bli möjligt, vilket i sin tur otvetydigt motbevisar relativitetsprincipen, som SRT är byggd på). Således är det fysiska vakuumet och dess partiklar inte element i den fysiska världen, utan bara element i relativitetsteorin som inte existerar i den verkliga världen, utan bara i relativistiska formler, som bryter mot kausalitetsprincipen (uppstår och försvinner utan anledning ), objektivitetsprincipen (virtuella partiklar kan övervägas, beroende på teoretikerns önskan, antingen existerande eller inte existerande), principen om faktisk mätbarhet (inte observerbar, har inte sin egen IRS).

När denna eller den fysikern använder begreppet "fysiskt vakuum", förstår han antingen inte absurditeten i denna term, eller är otrevlig, en dold eller tydlig anhängare av relativistisk ideologi.

Det enklaste sättet att förstå det absurda i detta koncept är att hänvisa till ursprunget till dess ursprung. Det föddes av Paul Dirac på 1930 -talet, när det blev klart att förnekandet av etern i dess rena form, som den stora matematikern, men den medelmåttiga fysikern gjorde, inte längre var möjlig. Alltför många fakta motsäger detta.

För att försvara relativismen introducerade Paul Dirac det afysiska och ologiska begreppet negativ energi, och sedan förekomsten av ett "hav" av två energier som kompenserar varandra i ett vakuum - positivt och negativt, samt ett "hav" av partiklar som kompenserar varje andra - virtuella (det vill säga uppenbara) elektroner och positroner i ett vakuum.

Det finns några systemklasser för vilka starkt eller svagt normaliserade datamodeller är mer lämpliga.

Starkt normaliserade datamodeller är väl lämpade för sk OLTP -applikationer(Online transaktionsbehandling (OLTP)-operativ behandling av transaktioner ). Typiska exempel på OLTP -applikationer är system för lagerkontroll, biljettbeställningssystem, banksystem som utför pengaröverföring etc.

Huvudfunktionen för sådana system är att utföra ett stort antal korta transaktioner. Själva transaktionerna ser relativt enkla ut, till exempel "ta ut pengarna från konto A, lägg till detta belopp på konto B".

Problemet är att det för det första finns många transaktioner, för det andra utförs de samtidigt (flera tusen samtidiga användare kan anslutas till systemet), och för det tredje, om ett fel uppstår, måste transaktionen återställas helt och returnera systemet till staten som var före transaktionens början (det borde inte finnas en situation då pengar togs ut från konto A, men inte krediterades konto B). Nästan alla databasfrågor i OLTP -applikationer består av infoga, uppdatera och ta bort kommandon. Således är hastigheten och tillförlitligheten för korta datauppdateringar avgörande för OLTP -applikationer. Ju högre datanormalisering i ett OLTP -program, desto snabbare och mer tillförlitlig är det som regel.

En annan typ av applikation är den sk OLAP -applikationer(Online analysbehandling(OLAP) -operativ analytisk databehandling ). Detta är en generaliserad term som beskriver byggnadsprinciperna beslutsstödssystem (Beslutsstödssystem-DSS),datalager(Datalager),dataminingssystem (Data mining). Sådana system är utformade för att hitta beroenden mellan data (till exempel kan du försöka bestämma hur försäljningsvolymen av varor är relaterad till egenskaper potentiella köpare), för analysen "tänk om ...".

OLAP -applikationer fungerar med stora mängder data som redan är ackumulerade i OLTP -applikationer, tagna från dem kalkylblad eller från andra datakällor. Sådana system kännetecknas av följande funktioner:

Ny data läggs till systemet relativt sällan i stora block (till exempel laddas kvartalsförsäljningsdata från en OLTP -applikation en gång i kvartalet).

Data som läggs till i systemet raderas vanligtvis aldrig.

Innan laddning går data igenom olika procedurer"rengöring" i samband med att ett system kan ta emot data från många källor som har olika format representationer för samma begrepp kan uppgifterna vara felaktiga, felaktiga.

Förfrågningar till systemet är ad hoc och vanligtvis ganska komplexa.

Fråghastigheten är viktig, men inte kritisk.

OLAP -applikationsdata representeras vanligtvis som en eller flera hyperkubar, vars dimensioner är referensdata, och själva datan lagras i cellerna i själva hyperkuben. Till exempel kan du bygga en hyperkub, vars dimensioner är: tid (i kvartal, år), produkttyp och företagsavdelning och försäljningsvolymer lagras i celler. En sådan hyperkub kommer att innehålla försäljningsdata olika typer varor efter kvartal och division. Baserat på dessa data är det möjligt att svara på frågor som "vilken avdelning har den bästa försäljningen under innevarande år?"

För att återgå till problemet med normalisering av data kan vi säga att i OLAP-system som använder relationsdatamodellen (ROLAP) är det lämpligt att lagra data i form av svagt normaliserade relationer som innehåller förberäknade grundläggande sammanfattande data. Stor redundans och problemen i samband med det är inte hemska här, tk. uppdatering sker endast vid tidpunkten för laddning av en ny del av data. I detta fall sker både tillägg av nya data och omräkning av totalen.

  • < Назад
  • Framåt>

Egenskaper hos ett OLTP -system Stor mängd information Ofta olika databaser för olika avdelningar Normaliserat schema, ingen överlappning av information Intensiv dataändring Transaktionell driftsätt Transaktioner innebär en liten mängd data Bearbetning av aktuell data - en ögonblicksbild Många kunder Låg responstid - a några sekunder Egenskaper OLAP -system Stor mängd information Synkroniserad information från olika databaser med hjälp av vanliga klassificerare Onormaliserat databasschema med dubbletter Data ändras sällan, förändring sker genom batch-laddning Komplexa ad-hoc-frågor utförs över en stor mängd data med en bred användning av grupper och aggregerade funktioner... Tidsberoende analys Fåtalande användare - analytiker och chefer Längre tid svar (men fortfarande acceptabelt) - några minuter






Codd -regler för relationsdatabaser 1. Informationsregel. 2. Regeln om garanterad tillgång. 3. Stödregel för ogiltiga värden. 4. Regel för en dynamisk katalog baserad på relationsmodellen. 5. Regeln för en uttömmande datasublanguage. 6. Regel för uppdatering av vyer. 7. Regeln om att lägga till, uppdatera och ta bort. 8. Regel för oberoende av fysiska data. 9. Regeln om oberoende av logiska data. 10. Regeln om oberoende av integritetsvillkor. 11. Fördelningsregel för distribution. 12. Regeln om unikhet.


Torskregler för OLAP 1. Konceptuell flerdimensionell vy. 2. Öppenhet. 3. Tillgänglighet. 4. Konsekvent produktivitet vid utveckling av rapporter. 5. Klient-server-arkitektur. 6. Allmän multidimensionalitet. 7. Dynamisk hantering av glesa matriser. 8. Stöd för flera användare. 9. Obegränsad delning. 10. Intuitiv datamanipulering. 11. Flexibla rapporteringsalternativ. 12. Obegränsad dimension och antal aggregeringsnivåer.


OLAP -implementering OLAP -typer - MOLAP -servrar (flerdimensionella OLAP) - både detaljerad data och aggregat lagras i en flerdimensionell databas. ROLAP (Relational OLAP) - detaljerad data lagras i en relationsdatabas; aggregat lagras i samma databas i special skapade servicetabeller. HOLAP (Hybrid OLAP) - detaljerad data lagras i en relationsdatabas och aggregat lagras i en flerdimensionell databas.








Funktioner i ROLAP - stjärnscheman 1. En faktatabell, som är starkt denormaliserad 2. Tabeller med flera dimensioner, som också är deormaliserade 3. Faktatabellens huvudnyckel är sammansatt och har en kolumn för varje dimension 4. Aggregerade data lagras tillsammans med de ursprungliga nackdelarna Om aggregat lagras tillsammans med originaldata, är det i dimensionerna nödvändigt att använda ytterligare parameter- hierarki nivå











Lagringsstruktur i ORACLE DBMS SQL -klient MOLAP Java -klient API JDBC OCI ODBC OLE DB CWM eller CWM2 OLAP -lagring (BLOB i relationell tabell) Stjärnschema Metadataregistrering Flerdimensionell kärna (process i ORACLE -kärnan) OLAP DML SQL -gränssnitt till OLAP (DBMS_AW, OLAP_TABLE, ...) Flerdimensionella metadata







2021 gtavrl.ru.