Data Warehouse
Vad det är och varför det är viktigt
Ett datalager (eller enterprise data warehouse) lagrar stora mängder data som samlas in och integreras från flera olika källor. Eftersom företag är beroende av sådan data för sina analyser och rapporter måste den vara konsekvent formaterad och ständigt tillgänglig. Dessa är två egenskaper som definierar datalager och förklarar varför de är så viktiga.
Datalager: Historia
På 70- och 80-talen började data användas allt oftare och företag behövde ett enkelt sätt att lagra och komma åt sin information. Datavetaren Bill Inmon, som anses vara uppfinnaren till datalager och som myntade begreppet, började ta fram konceptet redan på 70-talet. År 1992 publicerade han boken “Building the Data Warehouse”, vilken anses vara den första källa som beskriver hur man kan jobba med datalager. Hans förklarar i sin bok hur en “top down”-process fungerar. Först tasett centralt arkiv för data fram, sedan skapas datatorg, vilka innehåller specifika delmängder av data inom arkivet.
Ralph Kimball, är en annan dataexpert som publicerade boken “The Data Warehouse Toolkit” i mitten av 90-talet. Han hade en något annorlunda strategi för datalagring - nämligen “bottom up”. Här är konceptet att först utveckla datatorg varpå dessa integreras för att skapa ett datalager.
Datalager är fortfarande relevanta idag, och fortsätter att utvecklas allt eftersom branschen förändras och anpassas till molntjänster och realtidsanalyser. Ett verktyg som liknar datalager är datasjöar, som utvecklats med tekniker som Apache Hadoop. Datasjöar används oftast när man har strömmande data som ska lagras utan att först bearbetas den eller att databasscheman skapas.
Hantera data bortom dina gränser
Hur kan du få relevanta insikter från de enorma mängder data som lagras i din databas? Matthew Magne, en expert inom datahantering, berättar hur du kan strömma, städa och profilera data i din datasjö, för att sedan extrahera information i realtid.
Varför är datalager så viktiga?
Data är avgörande för företag som vill fatta välinformerade beslut. Så det är givet att datalager är viktiga eftersom de lagrar all data. Datalager (Data warehouses) kan:
- Lagra stora mängder data i en central databas - i standardiserade format.
- Integrera och standardisera data från många olika källor, så att den är klar för analys samt rapportering.
- Hantera register eftersom det kan lagra månader eller till och med år av data.
- Håll data säker genom lagring på en enda plats. Åtkomst kan då ges till användare som endast behöver specifik information.
- Göra det möjligt att snabbt komma åt data för att fatta affärsbeslut.
Datalager idag
Ett datalager kan innebära skillnaden mellan informerade beslut – eller datakaos. Lär dig hur datalager påverkar världen vi lever i.
Modernisering av datalager
Datalager är fortfarande relevanta när det kommer till big data och analys, men ofta behöver de moderniseras. Ta reda på vad du behöver göra och varför det är viktigt att modernisera.
Hadoop, förklarad
Vad är möjligt med Hadoop – och hur kan det vara stöd till företagets datalager? Lär dig hur du kan ge stöd till samt utöka datalagret och dess ekosystem.
Landskapet för dataintegration
Säg nej till en ad hoc-strategi när det kommer till dataintegration. Hitta istället en mer hållbar lösning som kan hantera en mängd olika integrationslösningar.
Dataintegration Déjà Vu
Lär dig hur dataintegration har utvecklats under åren. Ta reda på vad som händer i framtiden och hur du kan fortsätta att ha en modern integrationshantering.
Datalager jmf. med andra lagringssystem
Datalagring är en vanlig lösning för lagring av data, men det är inte den enda lösningen. Här är hur datalagret förhåller sig till liknande typer av teknik.
Datalager
Lagrar en stor mängd företagsdata som omfattar flera ämnesområden.
|
Kan vara svårt att bygga upp.
|
Omfattande storlek.
|
Data är strukturerad och redo att användas för analys eller rapportering.
|
Datatorg
Lagrar en mindre mängd data som ofta täcker ett enda ämnesområde och används av en funktion, såsom marknadsföring eller försäljning.
|
Snabbare och enklare att bygga än ett datalager.
|
Begränsat minne.
|
Data är strukturerad och redo att användas för analys eller rapportering.
|
Datasjö
Lagrar en stor mängd rådata.
|
Data bevaras i sitt ursprungsformat tills den används.
|
Gör det möjligt för användare att ställa frågor till mindre komplexa, mer relevanta och mer flexibla datamängder.
|
Läs om fler branscher som använder metoden
Så fungerar det
Ett datalager börjar med data som samlas in från både interna och externa källor. Data lagras vanligtvis i ett datalager genom en process som involverar extrahering, transformation och laddning (ETL). Information extraheras från källan, omvandlas till hög kvalitet och laddas sedan in i ett lager. Företag utför denna process regelbundet för att hålla sin data uppdaterad så de är redo att ta nästa steg.
När en organisation ska använda data för analys eller rapportering skiftar fokus från datalager till BI-verktyg. Tekniker som använder visuell analys och explorering ser till att företag får insikter från sin data.
Läs mer om ämnet
- Data quality management: What you need to knowData quality isn’t simply good or bad. Data quality management puts quality in context to improve fitness of the data you use for analysis and decision-making.
- The importance of data quality: A sustainable approachBad data wrecks countless business ventures. Here’s a data quality plan to help you get it right.
- Key questions to kick off your data analytics projectsThere’s no single blueprint for starting a data analytics project. Technology expert Phil Simon suggests these 10 questions as a guide.
- What is a data lake & why does it matter?As containers for multiple collections of data in one convenient location, data lakes allow for self-service access, exploration and visualization. In turn, businesses can see and respond to new information faster.