Data Mining

Vad det är och därför är det viktigt

Data mining är processen för att hitta avvikelser, mönster och korrelationer i stora mängder data för att förutsäga resultat. Med hjälp av ett brett spektrum tekniker kan du använda denna information för att öka intäkter, minska kostnader, förbättra kundrelationer, reducera risker i affärer med mera.

Data Mining historia och senaste utvecklingen

Processen för att leta igenom data för att upptäcka dolda kopplingar och förutsäga framtida trender har en lång historia. Efter att tidigare ha benämnts “skapa kunskap från databaser" myntades termen "datautvinning" på 1990-talet. Dess grund består av tre sammanflätade vetenskapliga discipliner: statistik (numeriska studier av datakopplingar), artificiell intelligens (människoliknande intelligens i programvara och/eller maskiner) och maskininlärning (algoritmer som kan lära av data för att göra förutsägelser). Det som var gammalt blir nytt igen, eftersom tekniker för datautvinning fortsätter att utvecklas för att hålla jämna steg med den närmast obegränsade potentialen hos big data och billig datorkraft.

Under det senaste decenniet har framsteg inom processorkraft och snabbhet gjort det möjligt för oss att lämna manuella, tråkiga och tidskrävande metoder för analys för snabbare, enklare och mer automatiserade. Ju mer komplexa datamängder som samlas in, desto större potential finns det att hitta relevanta insikter. Detaljhandeln, banker, verkstadsföretag, telekomoperatörer och försäkringsbolag använder sig idag av datautvinning. Med tekniken finner de relationer mellan allt från prisoptimering, kampanjer och demografier vilka påverkar deras affärsmodeller, intäkter och kundrelationer.

 

Varför är data mining viktigt?

Så varför är data mining viktigt? Du har kanske sett de häpnadsväckande siffrorna som visar att mängden data som produceras i världen fördubblas vartannat år. Mängden ostrukturerad data utgör 90 procent av det digitala universumet. Men mer information ger inte nödvändigtvis mer kunskap.

Med data mining kan du:

  • Sålla igenom kaotiskt och repetitivt brus som finns i dina data.
  • Förstå vad som är relevant och använda den informationen på ett bra sätt för att förutspå sannolika utfall.
  • Kunna fatta informerade beslut snabbare

Läs mer om tekniker för datautvinning i rapporten “Datautvinning från A till Ö”, Rapporten beskriver hur organisationer kan använda sig av prediktiv analys och datautvinning för använda data för att hitta nya insikter.  

Data Mining idag

Data mining utgör en hörnsten för analys, och hjälper dig att utveckla modeller som kan avslöja kopplingar och mönster i miljontals eller miljarder dataposter. Lär dig hur datautvinning bidrar till att forma världen.

White Paper

Data mining i olje- och gasindustrin

Läs om hur datautvinning, prediktiv modellering och realtidsanalys används i olje- och gasindustrin. Rapporten beskriver de tillvägagångssätt, arbetsflöden och tekniker som används.

Läs sammanfattning

Skärningspunkten mellan big data & data mining

Jared Dean har skrivit en bok om datautvinning. Han förklarar hur du maximerar din analysfunktion med hjälp av högpresterande datorsystem och avancerad analys.

Läs sammanfattning

gartner-logo

Den magiska kvadranten för datavetenskapliga plattformar

SAS är det företag som under sina åtta år haft platsen längst som ledare i “Gartner Magic Quadrant for Data Science and Machine Learning Platforms”.

Läs rapporten

Tung läsning: Avancerad prediktiv nätverksanalys

Lär dig mer om hur du kan optimera nätverk genom att använda prediktiv analys för att utvärdera nätverksprestanda – samt finjustera kapacitet och få möjlighet att göra riktad marknadsföring.

Läs hela rapporten

 

Programvara för data mining

Programvara från SAS använder beprövade men banbrytande algoritmer som skapats för att hjälpa dig att lösa de största utmaningarna.

Läs mer om datautvinningsprogram från SAS

Vilka använder det?

Data mining är kärnan i analysarbetet inom en mängd olika branscher och verksamheter.

Telekom, media & teknik

På en överbelastad marknad där konkurrensen är hård går det att dra stor nytta av dina konsumentdata. Telekom-, medie- och teknikföretag kan använda analytiska modeller för att skapa värde från sina berg av kunddata. Det hjälper dem att förutsäga kundbeteenden och att göra riktade och relevanta kampanjer.

Försäkring

Med analytiskt kunnande kan försäkringsbolag lösa komplexa problem som rör bedrägerier, regelefterlevnad, riskhantering och kundlivscyklar. Företag har använt datautvinningsteknik för att prissätta sina produkter mer effektivt och hitta nya sätt att erbjuda konkurrenskraftiga produkter till sin befintliga kundbas.

Utbildning

Med en enhetlig och datastödd vy av elevers framsteg kan lärare förutsäga elevernas prestationer innan de ens har satt sin fot i klassrummet. Det blir möjligt att utveckla interventionsstrategier för att guida dem rätt. Data mining hjälper lärare att komma åt studentdata, förutsäga prestationsnivåer och hitta elever eller grupper av studenter som behöver stöd.

Tillverkning

Det är viktigt att anpassa leveransplaner till prognoser om efterfrågan, likaså att tidigt upptäcka problem, kvalitetssäkra och beräkna nödvändiga investeringar i sitt varumärkeskapital. Tillverkare får verktyg för att förutsäga slitage på produktionstillgångar och förutse underhåll, vilket kan maximera drifttiden och hålla igång produktionen.

Banker

Automatiserade algoritmer hjälper banker att förstå sin kundbas och de miljarder transaktioner som är kärnan i det finansiella systemet. Datautvinning hjälper finansiella tjänsteföretag att få en bättre bild av marknadsrisker, upptäcka bedrägerier snabbare, , hantera regleringskrav och få optimal avkastning på sina investeringar i marknadsföring.

Detaljhandel

I stora kunddatabaser finns dolda kundinsikter som kan hjälpa dig att förbättra kundrelationer, optimera marknadsföringskampanjer och prognostisera försäljning. Genom mer exakta datamodeller kan detaljhandelsföretag erbjuda mer riktade kampanjer – och hitta det erbjudande som fungerar bäst på kunden.

När (data mining och) prediktiv analys görs rätt är analyser inte ett sätt att förutsäga en slutpunkt. Snarare blir analyser och önskade utfall ett sätt att arbeta med analytiska insikter. För att göra ett bättre jobb med att analysera vad som verkligen behöver analyseras och förutsäga vad vi verkligen vill förutsäga.

Michael Schrage har skrivit Prediktiv analys i praktiken som är en Harvard Business Review Insight Center-rapport

 

Programvara för data minging

SAS programvara för datautvinning använder beprövade, banbrytande algoritmer som är utformade för att hjälpa dig att lösa dina största utmaningar.

Läs mer om datautvinningsprogram från SAS

Så fungerar det

Data mining består av en mängd olika metoder eller tekniker som används för olika analytiska funktioner som tillgodoser en mängd organisatoriska behov, ställer olika typer av frågor till data och använder olika nivåer av mänsklig inmatning eller regler för att komma fram till beslut.

 

Deskriptiv modellering: Tar fram delade likheter eller grupperingar i historiska data för att fastställa orsaker till framgång eller misslyckanden, till exempel genom att kategorisera kunder efter produktpreferenser eller sentiment. Exempel på tekniker som används:

Klustring
Gruppera liknande poster tillsammans
Identifiera avvikelser
Identifiera avvikande värden i flera dimensioner.
Inlärning av associationsregel
Identifiera relationer mellan dataposter.
Huvudkomponentanalys
Identifiera relationer mellan variabler.
Gruppering av tillhörighet
Gruppering av personer med gemensamma intressen eller liknande mål (t.ex. människor som köper X köper ofta Y och eventuellt Z).

 

Prediktiv modellering: Prediktiv modellering: Den här typen av modellering går djupare för att klassificera händelser i framtiden eller bedöma okända resultat – till exempel genom att använda kreditbedömning för att avgöra en individs sannolikhet att återbetala ett lån. Prediktiv modellering hjälper också till att avslöja insikter för saker som kundtapp, kampanjeffekter eller kreditförluster. Bland exempel på metoder finns:

Regression
Ett mått på styrkan i förhållande mellan en beroende variabel och en serie oberoende variabler.
Neurala nätverk
Datorprogram som identifierar mönster, gör förutsägelser och lär sig.
Beslutsträd
Trädformade diagram där varje gren representerar en trolig förekomst eller händelse.
Stödvektormaskin
Övervakade inlärningsmodeller med tillhörande inlärningsalgoritmer.


Preskriptiv modellering
: Med den snabba ökningen av ostrukturerad data från webb, kommentarsfält, böcker, e-post, PDF-filer, ljud och andra textkällor har textutvinning växt fram som en relaterad disciplin till datautvinning. Det behövs förmåga att framgångsrikt tolka, filtrera och omvandla ostrukturerad data för att inkludera den i prediktiva modeller för förbättrade möjligheter att göra förutsägelser.

I slutändan bör du inte titta på data mining som en separat, fristående entitet eftersom förbearbetning (data förberedelse, datautforskning) och efterbearbetning (modellvalidering, poängsättning, bedömning av modellers prestanda) är lika viktiga. Preskriptiv modellering tittar på interna och externa variabler och begränsningar för att rekommendera en eller flera handlingsalternativ – till exempel att bestämma det bästa marknadsföringserbjudandet att skicka till olika kunder. Exempel på tekniker är:

Prediktiv analys med regler
Utveckla “if/then”-regler från mönster och förutsäga utfall.
Optimering av marknadsföring
Simulera den mest fördelaktiga mediemixen i realtid för högsta möjliga ROI.