Dataudvinding

Hvad det er, og hvorfor det betyder noget

Dataudvinding er processen med at finde uregelmæssigheder, mønstre og sammenhænge i store datasæt for at forudsige resultater. Ved hjælp af en bred vifte af teknikker kan du bruge disse oplysninger til at øge indtægterne, reducere omkostningerne, forbedre kunderelationerne, reducere risici og meget mere.


Dataudvinding - historie og aktuelle fremskridt

Processen med at grave i data for at opdage skjulte sammenhænge og forudsige fremtidige tendenser har en lang historie. Begrebet "dataudvinding", der også kaldes "knowledge discovery in databases", blev først opfundet i 1990'erne. Men dets fundament består af tre sammenflettede videnskabelige discipliner: statistik (den numeriske undersøgelse af dataforhold), kunstig intelligens (menneskelignende intelligens, der demonstreres af software og/eller maskiner) og machine learning (algoritmer, der kan lære af data for at lave forudsigelser). Hvad der var gammelt, er nyt igen, da dataudvindingsteknologien hele tiden udvikler sig for at holde trit med det ubegrænsede potentiale i big data og tilgængelig computerkraft.

 

Hvorfor er dataudvinding vigtigt?

Så hvorfor er dataudvinding vigtigt? Du har set de svimlende tal - mængden af data, der produceres, fordobles hvert andet år. Ustrukturerede data alene udgør 90 procent af det digitale univers. Men mere information betyder ikke nødvendigvis mere viden.

Dataudvinding giver dig mulighed for at:

  • Sortere i al den kaotiske og repetitive støj i dine data.
  • Forstå, hvad der er relevant, og derefter gøre nyttig brug af disse oplysninger til at vurdere sandsynlige resultater.
  • Øg tempoet for at træffe informerede beslutninger.

Lær mere om dataudvindingsteknikker i Data Mining From A to Z, en artikel, der viser, hvordan organisationer kan bruge prognostisk analyse og dataudvinding til at afsløre nye indsigter fra data.

Data mining allows you to:

  • Sift through all the chaotic and repetitive noise in your data.
  • Understand what is relevant and then make good use of that information to assess likely outcomes.
  • Accelerate the pace of making informed decisions.
  • Uncover new insights from data through the use of predictive analytics.

Data Mining in Today's World

Data mining is a cornerstone of analytics, helping you develop the models that can uncover connections within millions or billions of records. Learn how data mining is shaping the world we live in.

The machine learning landscape

This white paper for novice and intermediate data scientists explores four major styles of machine learning and how they're used. Read about different methodologies, how machine learning and data mining work together to create models, and when it's most efficient to use deep learning. You'll also learn about popular algorithms and considerations such as interpretability and automation.

Data-driven decisions foster well-being, economic growth

The city of Jakarta faced data challenges due to a legacy public records system and more than 50 service applications across various departments. With a solution that included data mining and other analytics technologies, Jakarta established a one-stop digital platform and “super app” that gives citizens easy access to multiple government services. 

Lessons in change from a data mining professor

Short attention spans make it hard to keep students engaged. Cali M. Davis, Assistant Professor at Troy University, decided to experiment when learning to build models and solve problems with SAS Viya. She taught two classes – one for an older data mining tool and one for software with dashboards and visualizations. Can you guess which was more popular?

 

Software til dataudvinding

dataudvindingssoftware fra SAS anvender dokumenterede, banebrydende algoritmer, der er designet til at hjælpe dig med at løse de største udfordringer.

Få mere at vide om dataudvindingssoftware fra SAS

 

Software til dataudvinding

dataudvindingssoftware fra SAS anvender dokumenterede, banebrydende algoritmer, der er designet til at hjælpe dig med at løse de største udfordringer.

Få mere at vide om dataudvindingssoftware fra SAS

Hvem bruger det?

dataudvinding er kernen i analyseindsatsen på tværs af en række brancher og discipliner.

Telecom, Media & Technology

In an overloaded market where competition is tight, the answers are often within your consumer data. Telecom, media and technology companies can use analytic models to make sense of mountains of customers data, helping them predict customer behavior and offer highly targeted and relevant campaigns.

Telekommunikation, medier og teknologi

På et overbelastet marked, hvor konkurrencen er hård, findes svarene ofte i dine forbrugerdata. Telecom-, medie- og teknologivirksomheder kan bruge analytiske modeller til at finde mening i bjerge af kundedata, hvilket hjælper dem med at forudsige kundeadfærd og tilbyde meget målrettede og relevante kampagner.

Insurance

With analytic know-how, insurance companies can solve complex problems concerning fraud, compliance, risk management and customer attrition. Companies have used data mining techniques to price products more effectively across business lines and find new ways to offer competitive products to their existing customer base.

Education

With unified, data-driven views of student progress, educators can predict student performance before they set foot in the classroom – and develop intervention strategies to keep them on course. Data mining helps educators access student data, predict achievement levels and pinpoint students or groups of students in need of extra attention.

Forsikring

Med analytisk knowhow kan forsikringsselskaber løse komplekse problemer med svindel, compliance, risikostyring og kundeafgang. Virksomheder har brugt dataudvindingsteknikker til at prissætte produkter mere effektivt på tværs af forretningsområder og finde nye måder at tilbyde konkurrencedygtige produkter til deres eksisterende kundebase.

Manufacturing

Aligning supply plans with demand forecasts is essential, as is early detection of problems, quality assurance and investment in brand equity. Manufacturers can predict wear of production assets and anticipate maintenance, which can maximize uptime and keep the production line on schedule.

Uddannelse

Med et samlet, datadrevet overblik over elevernes fremskridt kan undervisere forudsige elevernes præstationer, før de sætter fod i klasseværelset - og udvikle strategier til at holde dem på rette kurs. Dataudvinding hjælper undervisere med at få adgang til elevdata, forudsige præstationsniveauer og udpege elever eller grupper af elever, der har brug for ekstra opmærksomhed.

Banking

Automated algorithms help banks understand their customer base as well as the billions of transactions at the heart of the financial system. Data mining helps financial services companies get a better view of market risks, quickly detect and prevent fraud, manage regulatory compliance obligations and get optimal returns on their marketing investments.

Retail

Large customer databases hold hidden customer insight that can help you improve relationships, optimize marketing campaigns and forecast sales. Through more accurate data models and marketing analytics, retail companies can offer more targeted campaigns – and find the offer that makes the biggest impact on the customer.

Produktion

Det er vigtigt at tilpasse forsyningsplaner til efterspørgselsprognoser, ligesom tidlig opdagelse af problemer, kvalitetssikring og investering i varemærkeværdi er afgørende. Producenter kan forudsige slid på produktionsaktiver og forudse vedligeholdelse, hvilket kan maksimere oppetiden og holde produktionslinjen på skemaet.

Banksektoren

Automatiserede algoritmer hjælper bankerne med at forstå deres kundebase samt de milliarder af transaktioner, der er kernen i det finansielle system. Dataudvinding hjælper finansielle virksomheder med at få et bedre overblik over markedsrisici, opdage svindel hurtigere, håndtere lovmæssige forpligtelser og få optimalt afkast af deres marketinginvesteringer.

Detailhandel

Store kundedatabaser indeholder skjult kundeindsigt som kan hjælpe dig med at forbedre relationer, optimere marketingkampagner og forudsige salg. Gennem mere præcise datamodeller kan detailvirksomheder tilbyde mere målrettede kampagner - og vælge det tilbud, der gør størst indtryk på kunden.

 

Software til dataudvinding

Dataudvindingssoftware fra SAS bruger dokumenterede, banebrydende algoritmer, der er designet til at hjælpe dig med at løse dine største udfordringer.

Få mere at vide om dataudvindingssoftware fra SAS

Sådan fungerer det

Dataudvinding, som en sammensat disciplin, repræsenterer en række metoder eller teknikker, der bruges i forskellige analytiske kapaciteter, der imødekommer en række organisatoriske behov, stiller forskellige typer spørgsmål og bruger forskellige niveauer af menneskeligt input eller regler for at nå frem til en beslutning.

 

Deskriptiv modellering: Den afdækker fælles ligheder eller grupperinger i historiske data for at bestemme årsagerne til succes eller fiasko, såsom at kategorisere kunder efter produktpræferencer eller følelser. Eksempler på teknikker omfatter:

Klyngedannelse
Gruppering af lignende poster under ét.
Registrering af afvigelser
Identifikation af multidimensionelle afvigelser.
Indlæring af associationsregler
Registrering af sammenhænge mellem registreringer.
Analyse af hovedkomponenter
Påvisning af relationer mellem variabler.
Gruppering af tilhørsforhold
Gruppering af mennesker med fælles interesser eller lignende motiver (f.eks. folk, der køber X, køber ofte Y og muligvis Z).

 

Prognostisk modellering: Denne modellering går mere i dybden med at klassificere begivenheder i fremtiden eller estimere ukendte resultater - for eksempel ved at bruge kreditvurdering til at bestemme en persons sandsynlighed for at tilbagebetale et lån. Prognostisk modellering hjælper også med at identificere indsigter i ting som kundeafgang, kampagnerespons eller kreditmisligholdelse. Eksempler på teknikker omfatter:

Regression
En måling af styrken af forholdet mellem en afhængig variabel og en række uafhængige variabler.
Neurale netværk
Computerprogrammer, der registrerer mønstre, laver forudsigelser og tager ved lære.
Beslutningstræer
Træformede diagrammer, hvor hver gren repræsenterer en sandsynlig begivenhed.
Støttevektormaskiner
Superviserede læringsmodeller med tilhørende læringsalgoritmer.


Præskriptiv modellering
: I takt med væksten i ustrukturerede data fra nettet, kommentarfelter, bøger, e-mail, PDF-filer, lyd og andre tekstkilder er anvendelsen af tekstudvinding som en beslægtet disciplin til dataudvinding også vokset markant. Du har brug for evnen til at analysere, filtrere og transformere ustrukturerede data for at kunne inkludere dem i prognostiske modeller for at forbedre forudsigelsesnøjagtigheden.

I sidste ende bør du ikke se på dataudvinding som en separat, selvstændig enhed, fordi præ-processering (dataforberedelse, dataudforskning) og post-processering (modelvalidering, scoring, overvågning af modelperformance) er lige så vigtige. Præskriptiv modellering ser på interne og eksterne variabler og begrænsninger for at anbefale et eller flere handlingsforløb - for eksempel at bestemme det bedste marketingtilbud, der skal sendes til hver kunde. Eksempler på teknikker omfatter:

Prognostisk analyse plus regler
Udvikling af hvis/så-regler ud fra mønstre og forudsigelse af resultater.
Optimering af markedsføring
Det mest fordelagtige mediemix simuleres i realtid for at opnå den højest mulige ROI.