Prognostisk analyse
Hvad det er, og hvorfor det betyder noget
Prognostisk analyse er brugen af data, statistiske algoritmer og maskinlæringsteknikker til at identificere sandsynligheden for fremtidige resultater baseret på historiske data. Målet er at gå fra at vide, hvad der er sket, til at give den bedste vurdering af, hvad der vil ske i fremtiden.
Prognostisk analyse - historie og aktuelle fremskridt
Selvom prognostisk analyse har eksisteret i årtier, er det en teknologi, hvor tiden er ved at være moden. Flere og flere organisationer vender sig mod prognostisk analyse for at øge deres bundlinje og konkurrencefordel. Hvorfor netop nu?
- Voksende mængder og typer af data og større interesse for at bruge data til at skabe værdifuld indsigt.
- Hurtigere og billigere computere.
- Software, der er lettere at bruge.
- Hårdere økonomiske betingelser og et behov for konkurrencemæssig differentiering.
Med den stigende udbredelse af interaktiv og brugervenlig software er prognostisk analyse ikke længere kun forbeholdt matematikere og statistikere. Forretningsanalytikere og brancheeksperter bruger også disse teknologier.
Hvorfor er prognostisk analyse vigtig?
Virksomheder anvender prognostisk analyse til at løse vanskelige problemer og afdække nye muligheder. Almindelige anvendelsesområder omfatter:
Opdagelse af svindel. Ved at kombinere flere analysemetoder kan man blive bedre til at opdage mønstre, identificere kriminel adfærd og forhindre svindel. Da cybersikkerhed bliver et voksende problem, gennemgår high-performance adfærdsanalyse alle handlinger på et netværk i realtid for at spotte abnormiteter, der kan indikere svindel, zero-day-sårbarheder og avancerede vedvarende trusler.
Optimering af marketingkampagner. Prognostisk analyse bruges til at forudsige kundernes reaktioner eller køb samt til at fremme mulighederne for gensalg. Prognostiske modeller hjælper virksomheder med at tiltrække, fastholde og udbygge deres mest rentable kunder.
Forbedring af driften.Mange virksomheder bruger prognostiske modeller til at forudsige lagerbeholdninger og styre ressourcer. Flyselskaber bruger prognostiske analyser til at fastsætte billetpriser. Hoteller forsøger at forudsige antallet af gæster for en given nat for at maksimere belægningen og øge indtægterne. Prognostisk analyse gør det muligt for organisationer at fungere mere effektivt.
Reducering af risiko. Kreditscorer bruges til at vurdere en købers sandsynlighed for misligholdelse af køb og er et velkendt eksempel på prognostisk analyse. En kreditscore er et tal, der genereres af en prognostisk model, som inkorporerer alle data, der er relevante for en persons kreditværdighed. Andre risikorelaterede anvendelsesområder omfatter forsikringskrav og inkasso.
Prognostisk analyse i dag
Med prognostisk analyse kan du gå videre fra at lære, hvad der skete og hvorfor, til at få indsigt i fremtiden. Lær, hvordan prognostisk analyse former den verden, vi lever i.
Mangler du færdigheder i prognostisk analyse?
At forvandle rå tal til værdifuld indsigt kræver hjælp fra fagfolk, der er dygtige til AI, maskinlæring og dataanalyse. Men talent er en mangelvare. Se strategier med henblik på at løse dette dilemma.
Brug prognostisk analyse til noget fornuftigt
Spekulerer du på, hvad du kan lære ved at kigge på tendenser og komme med forudsigelser ud fra din organisations data? Læs om syv organisationer, der bruger analyser til at få kundeindsigt, træffe bedre beslutninger og skabe vækst i deres virksomheder.
Sådan forudsiger du det ukontrollerbare
Naturkatastrofer er kommet for at blive. Men vi kan minimere deres ødelæggelser ved at forudsige og forberede os på begivenheder såsom oversvømmelser. Læs, hvordan organisationer bruger AI og prognostisk analyse til at gøre verden mere sikker.
Gør driftstiden bedre med analyser
Laboratorier har ikke råd til nedetid, når de sender resultater til læger, sundhedspersonale og forskere. Se, hvordan Siemens Healthineers brugte SAS til at udvikle en prognostisk vedligeholdelsesløsning, der forbedrede systemets driftstid med 36 %.
Prognostisk analyse
Dataudvinding fra SAS anvender gennemtestede, banebrydende algoritmer, der er designet til at hjælpe dig med at løse dine største analytiske udfordringer.
Hvem bruger det?
Alle brancher kan bruge prognostisk analyse til at reducere risici, optimere driften og øge omsætningen. Her er et par eksempler.
Banker og finansielle tjenester
Med enorme mængder data og penge på spil har finanssektoren længe benyttet sig af prognostiske analyser til at opdage og reducere svindel, måle kreditrisiko, maksimere mulighederne for krydssalg/opsalg og fastholde værdifulde kunder. Commonwealth Bank bruger analyser til at forudsige sandsynligheden for svindelaktivitet for en given transaktion, før den bliver godkendt - inden for 40 millisekunder efter, at transaktionen er påbegyndt.
Detailhandlen
Siden den nu berygtede undersøgelse, der viste, at mænd, der køber bleer, ofte køber øl på samme tid, bruger detailbutikker i hele verden prognostiske analyser til vareplanlægning og prisoptimering, for at analysere effektiviteten af salgsfremmende begivenheder og for at afgøre, hvilke tilbud der er mest hensigtsmæssige for forbrugerne. Staples fik kundeindsigt ved at analysere kundernes adfærd, hvilket gav et komplet billede af deres kunder og en ROI på 137 %.
Olie, gas og forsyningsvirksomheder
Uanset om det handler om at forudse udstyrsfejl og fremtidige ressourcebehov, mindske sikkerheds- og pålidelighedsrisici eller forbedre den overordnede ydeevne, har energibranchen taget prognostisk analyse til sig med stor entusiasme. Salt River Project er det næststørste offentlige elselskab i USA og en af Arizonas største vandleverandører. Analyser af maskinsensordata forudsiger, hvornår elproducerende turbiner har brug for vedligeholdelse.
Forvaltninger og den offentlige sektor
Forvaltninger har været nøgleaktører i udviklingen af computerteknologier. US Census Bureau har analyseret data for at forstå befolkningstendenser i årtier. I dag bruger forvaltningerne prognostiske analyser ligesom mange andre brancher - til at forbedre service og ydeevne, opdage og forhindre svindel og bedre forstå forbrugernes adfærd. De bruger også prognostisk analyse til at forbedre cybersikkerheden.
Sundhedssektoren
Ud over at identificere svindel med skadesanmeldelser tager sundhedssektoren skridtet videre for at identificere de patienter, der er mest udsatte for kroniske sygdomme, og finde ud af, hvilke indgreb der er bedst. Express Scripts, et stort selskab, der leverer apoteksydelser, bruger analyser til at identificere dem, der ikke følger de ordinerede behandlinger, hvilket resulterer i en besparelse på 1.500 til 9.000 dollars pr. patient.
Produktion
For producenter er det meget vigtigt at identificere faktorer, der fører til nedsat kvalitet og produktionsfejl, samt at optimere reservedele, serviceressourcer og distribution. Lenovo er blot en af de producenter, der har brugt prognostisk analyse til bedre at forstå reklamationssager - et initiativ, der førte til en reduktion i reklamationsomkostningerne på 10 til 15 procent.
Få mere at vide om brancher, der bruger denne teknologi
- Landbrug
- Bankvæsen
- Kapitalmarkeder
- Forbrugsvarer
- Kasinoer
- Sundhedspleje
- Højere uddannelse
- Hoteller
- Forsikring
- Biovidenskab
- Produktion
- Olie og gas
- P-12 Uddannelse
- Offentlig sektor
- Detailhandel
- Små og mellemstore virksomheder
- Sportsanalyse
- Rejser og transport
- Telekommunikation, medier og teknologi
- Forsyningsvirksomheder
At få magi ind i magien
Sportsanalyse er et hot område, blandt andet takket være Nate Silver og turneringsforudsigelser. NBA's Orlando Magic bruger prognostisk analyse fra SAS til at forbedre indtjeningen og fastlægge startopstillinger. Erhvervsbrugere på tværs af Orlando Magics organisation har adgang til information med det samme. Magic kan nu visuelt udforske de nyeste data, helt ned til spillet og placeringen.
Prognostisk tekstanalyse
Omkring 90 procent af alle data er ustrukturerede. Udnytter du mulighederne i prognostisk analyse til at få indsigt i alle disse data?
Sådan fungerer det
Prognosemodeller bruger allerede kendte resultater til at udvikle (eller træne) en model, der kan bruges til at forudsige værdier for andre eller nye data. Modelarbejdet giver resultater i form af forudsigelser, der repræsenterer en sandsynlighed for målvariablen (f.eks. omsætning) baseret på estimeret betydning fra et sæt inputvariabler.
Dette er forskelligt fra beskrivende modeller, der hjælper dig med at forstå, hvad der skete, eller diagnostiske modeller, der hjælper dig med at forstå nøglerelationer og afgøre, hvorfor noget skete. Hele bøger er dedikeret til analytiske metoder og teknikker. Komplette læseplaner på universiteter går i dybden med dette emne. Men til at begynde med er her et par grundlæggende ting.
Der findes to typer af prognosemodeller. Klassifikationsmodeller forudsiger klassetilhørsforhold. For eksempel forsøger man at klassificere, om en person sandsynligvis vil forlade virksomheden, om han vil svare på en henvendelse, om han er en god eller dårlig kreditrisiko osv. Normalt er modelresultaterne i form af 0 eller 1, hvor 1 er den begivenhed, du sigter mod. Regressionsmodeller forudsiger et tal - f.eks. hvor meget omsætning en kunde vil generere i løbet af det næste år, eller hvor mange måneder der går, før en komponent på en maskine går i stykker.
Tre af de mest anvendte prognostiske modelleringsteknikker er beslutningstræer, regression og neurale netværk.
Regression (lineær og logistisk) er en af de mest populære metoder inden for statistik. Regressionsanalyse estimerer relationer mellem variabler. Den er beregnet til kontinuerlige data, som kan antages at følge en normalfordeling, og den finder vigtige mønstre i store datasæt og bruges ofte til at bestemme, hvor meget specifikke faktorer, som f.eks. prisen, påvirker bevægelsen af et aktiv. Med regressionsanalyse ønsker vi at forudsige et tal, kaldet responsen eller Y-variablen. Ved lineær regression bruges én uafhængig variabel til at forklare og/eller forudsige udfaldet af Y. Ved multipel regression bruges to eller flere uafhængige variabler til at forudsige udfaldet. Med logistisk regression forudsiges ukendte variabler af en diskret variabel baseret på kendte værdier af andre variabler. Responsvariablen er kategorisk, hvilket betyder, at den kun kan antage et begrænset antal værdier. Ved binær logistisk regression har en responsvariabel kun to værdier, f.eks. 0 eller 1. I multipel logistisk regression kan en responsvariabel have flere niveauer, f.eks. lav, middel og høj, eller 1, 2 og 3.
Beslutningstræer er klassifikationsmodeller, der opdeler data i delmængder baseret på kategorier af inputvariabler. Det hjælper dig med at forstå en persons vej til beslutninger. Et beslutningstræ ligner et træ, hvor hver gren repræsenterer et valg mellem et antal alternativer, og hvert blad repræsenterer en klassifikation eller beslutning. Denne type model ser på data og forsøger at finde den ene variabel, der opdeler data i logiske grupper, hvoraf de fleste er forskellige. Beslutningstræer er populære, fordi de er lette at forstå og fortolke. De håndterer også manglende værdier godt og er nyttige til indledende variabeludvælgelse. Så hvis du har mange manglende værdier eller ønsker et hurtigt og let fortolkeligt svar, kan du starte med et træ.
Neurale netværk er avancerede teknikker, der er i stand til at modellere ekstremt komplekse forhold. De er populære, fordi de er effektive og fleksible. Styrken ligger i deres evne til at håndtere ikke-lineære relationer i data, hvilket bliver mere og mere almindeligt, efterhånden som vi indsamler flere data. De bruges ofte til at underbygge resultater fra simple teknikker som regression og beslutningstræer. Neurale netværk er baseret på mønstergenkendelse og nogle AI-processer, der grafisk "modellerer" parametre. De fungerer godt, når man ikke kender en matematisk formel, der relaterer input til output, når forudsigelse er vigtigere end forklaring, eller når der er mange læringsdata. Kunstige neurale netværk blev oprindeligt udviklet af forskere, der forsøgte at efterligne neurofysiologien i den menneskelige hjerne.
Andre populære teknikker, du måske har hørt om
Bayesiansk analyse. Bayesianske metoder betragter parametre som tilfældige variabler og definerer sandsynlighed som "grader af tro" (det vil sige, at sandsynligheden for en begivenhed er den grad, i hvilken du tror, at begivenheden er sand). Når man udfører en Bayesiansk analyse, begynder man med en forudgående antagelse om sandsynlighedsfordelingen for en ukendt parameter. Når man har lært noget af de data, man har, ændrer eller opdaterer man sin antagelse om den ukendte parameter.
Ensemble-modeller.Ensemble-modeller produceres ved at teste flere lignende modeller og kombinere deres resultater for at forbedre nøjagtigheden, reducere fejl, reducere afvigelser og identificere den bedste model til brug med nye data.
Gradient boosting. Dette er en boosting-tilgang, der gentager dit datasæt flere gange for at generere resultater, der danner et vægtet gennemsnit af det gentagne datasæt. Ligesom beslutningstræer gør boosting ingen antagelser om fordelingen af data. Boosting er mindre tilbøjelig til at overtilpasse data end et enkelt beslutningstræ, og hvis et beslutningstræ passer ret godt til data, så forbedrer boosting ofte tilpasningen. ( Overtilpasning af data betyder, at du bruger for mange variabler, og at modellen er for kompleks. Undertilpasning betyder det modsatte - ikke nok variabler, og modellen er for simpel. Begge dele reducerer forudsigelsesnøjagtigheden).
Inkrementel respons (også kaldet net lift eller uplift-modeller). Disse modellerer ændringen i sandsynlighed forårsaget af en handling. De bruges i vid udstrækning til at reducere kundeflugt og til at fastslå effekten af forskellige marketingprogrammer.
K-nærmeste nabo (KNN). Dette er en ikke-parametrisk metode til klassificering og regression, der forudsiger et objekts værdier eller klassetilhørsforhold baseret på de k-nærmeste testeksempler.
Hukommelsesbaseret ræsonnement. Hukommelsesbaseret ræsonnement er en k-nærmeste nabo-teknik til kategorisering eller forudsigelse af observationer.
Partial least squares. Denne fleksible statistiske teknik kan anvendes på data af enhver form. Den modellerer relationer mellem input og output, selv når inputtene er sammenhængende og støjende, der er flere output, eller der er flere input end observationer. Metoden med Partial least squares leder efter faktorer, der forklarer både respons- og prognosticeringsvariationer.
Principiel komponentanalyse. Formålet med principiel komponentanalyse er at udlede et lille antal uafhængige lineære kombinationer (principielle komponenter) af et sæt variabler, der bevarer så meget af informationen i de oprindelige variabler som muligt.
Støttevektormaskine. Denne overvågede maskinlæringsteknik bruger relaterede læringsalgoritmer til at analysere data og genkende mønstre. Den kan bruges til både klassificering og regression.
Dataudvinding af tidsserier. Tidsseriedata er tidsstemplet og indsamlet over tid med et bestemt interval (salg i en måned, opkald pr. dag, webbesøg pr. time osv.). Dataudvinding af tidsserier kombinerer traditionel dataudvinding og prognoseteknikker. Dataudvindings-teknikker som prøveudtagning, gruppering og beslutningstræer anvendes på data indsamlet over tid med det formål at forbedre forudsigelserne.
Hvad skal du bruge for at komme i gang med at bruge prognostisk analyse?
Få mere at vide om, hvordan du får den analytiske livscyklus til at fungere for dig
Det første, du skal bruge for at komme i gang med at bruge prognostisk analyse, er et problem, der skal løses. Hvad ønsker du at vide om fremtiden baseret på fortiden? Hvad ønsker du at forstå og forudsige? Du skal også overveje, hvad der skal ske med forudsigelserne. Hvilke beslutninger vil blive drevet af indsigterne? Hvilke handlinger vil der blive foretaget?
For det andet skal du bruge data. I dagens verden betyder det data fra mange forskellige steder. Transaktionssystemer, data indsamlet af sensorer, tredjepartsinformation, callcenter-notater, weblogs osv. Du får brug for en databearbejder, eller en person med erfaring i datahåndtering, til at hjælpe dig med at rense og forberede data til analyse. At forberede data til en prognostisk modelleringsøvelse kræver også en person, der forstår både data og forretningsproblemet. Hvordan du definerer dit mål, er afgørende for, hvordan du kan fortolke resultatet. (Dataforberedelse anses for at være et af de mest tidskrævende aspekter af analyseprocessen. Så vær forberedt på det).
Derefter begynder opbygningen af den prognostiske model. Stadig mere brugervenlig software betyder, at flere mennesker kan bygge analytiske modeller. Men du vil sandsynligvis stadig have brug for en dataanalytiker, der kan hjælpe dig med at forfine dine modeller og finde frem til den bedste model. Og så har du måske brug for en IT-medarbejder, der kan hjælpe med at implementere dine modeller. Det betyder, at modellerne skal arbejde på dine valgte data - og det er her, du får dine resultater.
Prognostisk modellering kræver en teamtilgang. Du har brug for folk, der forstår det forretningsproblem, der skal løses. Nogen, der ved, hvordan man forbereder data til analyse. Nogen, der kan opbygge og forfine modellerne. En IT-medarbejder til at sikre, at du har den rette analyseinfrastruktur til modelopbygning og implementering. Og en overordnet ansvarlig kan hjælpe med at gøre dine analytiske forhåbninger til virkelighed.
Læs mere om dette emne
- Strengthen your payment fraud defenses with stronger authenticationThe rapid growth of digital wallets and payment applications ushered in many new payment fraud threats. Today, it’s more critical than ever to authenticate users. Learn four innovative to ways strengthen your authentication defenses while reducing false positives and protecting customers’ assets.
- Nerd in the herd: protecting elephants with data scienceA passionate SAS data scientist uses machine learning to detect tuberculosis in elephants. Find out how her research can help prevent the spread of the disease.
- Health care cost containment through big data analyticsHealth insurers are plagued by fraud, waste and abuse. For health care cost containment, an enterprise approach to payment integrity using data management and analytics can help. With this approach, payers can detect and prevent fraud; influence provider, employee and patient behavior; and substantially reduce costs.
- Analytics for prescription drug monitoring: How to better identify opioid abusePrescription drug monitoring programs (PDMPs) are a great start in combating abuse of prescription drugs, but they could be doing much more. Better data and analytics can inform better treatment protocols, provider education and policy decisions – and save lives.