Data Warehouse

Vad det är och varför det är viktigt

Ett datalager (eller enterprise data warehouse) lagrar stora mängder data som samlas in och integreras från flera olika källor. Eftersom företag är beroende av sådan data för sina analyser och rapporter måste den vara konsekvent formaterad och ständigt tillgänglig. Dessa är två egenskaper som definierar datalager och förklarar varför de är så viktiga.

Datalager: Historia

På 70- och 80-talen började data användas allt oftare och företag behövde ett enkelt sätt att lagra och komma åt sin information. Datavetaren Bill Inmon, som anses vara uppfinnaren till datalager och som myntade begreppet, började ta fram konceptet redan på 70-talet. År 1992 publicerade han boken “Building the Data Warehouse”, vilken anses vara den första källa som beskriver hur man kan jobba med datalager. Hans förklarar i sin bok hur en “top down”-process fungerar. Först tasett centralt arkiv för data fram, sedan skapas datatorg, vilka innehåller specifika delmängder av data inom arkivet.

Ralph Kimball, är en annan dataexpert som publicerade boken “The Data Warehouse Toolkit” i mitten av 90-talet. Han hade en något annorlunda strategi för datalagring - nämligen “bottom up”. Här är konceptet att först utveckla datatorg varpå dessa integreras för att skapa ett datalager.

Datalager är fortfarande relevanta idag, och fortsätter att utvecklas allt eftersom branschen förändras och anpassas till molntjänster och realtidsanalyser. Ett verktyg som liknar datalager är datasjöar, som utvecklats med tekniker som Apache Hadoop. Datasjöar används oftast när man har strömmande data som ska lagras utan att först bearbetas den eller att databasscheman skapas.

Hantera data bortom dina gränser

Hur kan du få relevanta insikter från de enorma mängder data som lagras i din databas? Matthew Magne, en expert inom datahantering, berättar hur du kan strömma, städa och profilera data i din datasjö, för att sedan extrahera information i realtid.

Varför är datalager så viktiga?

Data är avgörande för företag som vill fatta välinformerade beslut. Så det är givet att datalager är viktiga eftersom de lagrar all data. Datalager (Data warehouses) kan:

  • Lagra stora mängder data i en central databas - i standardiserade format.
  • Integrera och standardisera data från många olika källor, så att den är klar för analys samt rapportering.
  • Hantera register eftersom det kan lagra månader eller till och med år av data.
  • Håll data säker genom lagring på en enda plats. Åtkomst kan då ges till användare som endast behöver specifik information.
  • Göra det möjligt att snabbt komma åt data för att fatta affärsbeslut.

Datalager idag

Ett datalager kan innebära skillnaden mellan informerade beslut – eller datakaos. Lär dig hur datalager påverkar världen vi lever i.

Modernisering av datalager

Datalager är fortfarande relevanta när det kommer till big data och analys, men ofta behöver de moderniseras. Ta reda på vad du behöver göra och varför det är viktigt att modernisera.

Läs sammanfattningen

Webcast

Hadoop, förklarad

Vad är möjligt med Hadoop – och hur kan det vara stöd till företagets datalager? Lär dig hur du kan ge stöd till samt utöka datalagret och dess ekosystem.

Läs sammanfattningen

Landskapet för dataintegration

Säg nej till en ad hoc-strategi när det kommer till dataintegration. Hitta istället en mer hållbar lösning som kan hantera en mängd olika integrationslösningar.

Läs sammanfattningen

Dataintegration Déjà Vu

Lär dig hur dataintegration har utvecklats under åren. Ta reda på vad som händer i framtiden och hur du kan fortsätta att ha en modern integrationshantering.

Läs sammanfattningen

Datalager jmf. med andra lagringssystem

Datalagring är en vanlig lösning för lagring av data, men det är inte den enda lösningen. Här är hur datalagret förhåller sig till liknande typer av teknik.

Datalager

Lagrar en stor mängd företagsdata som omfattar flera ämnesområden.
Kan vara svårt att bygga upp.
Omfattande storlek.
Data är strukturerad och redo att användas för analys eller rapportering.

Datatorg

Lagrar en mindre mängd data som ofta täcker ett enda ämnesområde och används av en funktion, såsom marknadsföring eller försäljning.
Snabbare och enklare att bygga än ett datalager.
Begränsat minne.
Data är strukturerad och redo att användas för analys eller rapportering.

Datasjö

Lagrar en stor mängd rådata.
Data bevaras i sitt ursprungsformat tills den används.
Gör det möjligt för användare att ställa frågor till mindre komplexa, mer relevanta och mer flexibla datamängder.

Så fungerar det

Ett datalager börjar med data som samlas in från både interna och externa källor. Data lagras vanligtvis i ett datalager genom en process som involverar extrahering, transformation och laddning (ETL). Information extraheras från källan, omvandlas till hög kvalitet och laddas sedan in i ett lager. Företag utför denna process regelbundet för att hålla sin data uppdaterad så de är redo att ta nästa steg.

När en organisation ska använda data för analys eller rapportering skiftar fokus från datalager till BI-verktyg. Tekniker som använder visuell analys och explorering ser till att företag får insikter från sin data.