Bedrägeribekämpning och maskininlärning:
vad du behöver veta
Att upptäcka bedrägerier är ett utmanande problem. Faktum är att bedrägliga transaktioner är ovanliga, de står för en mycket liten del av aktiviteten hos en organisation. Utmaningen ligger i att en liten andel av aktiviteten snabbt kan leda till stora ekonomiska förluster om rätt verktyg och system inte finns på plats. Kriminella är sluga. Då traditionella bedrägeriplaner inte ger något resultat har bedragare lärt sig att ändra sin taktik. De goda nyheterna är att med framstegen inom bedrägerianalys kan system lära, anpassa sig och avslöja framträdande mönster för att motverka bedrägerier.
De flesta organisationer använder fortfarande regelbaserade system som sitt huvudsakliga verktyg för att upptäcka bedrägeri. Regler kan göra ett strålande jobb med att avslöja kända mönster, men enbart regler är inte särskilt effektivt för att avslöja okända planer, anpassa sig till nya bedrägerimönster eller hantera bedragares allt mer sofistikerade tekniker. Det är här bedrägerianalys, driven av maskininlärning, blir nödvändig för att motverka och upptäcka bedrägerier.
Maskininlärning är den senaste flugan. De flesta leverantörer säger sig ha någon form av maskininlärning, särskilt för bedrägeribekämpning. SAS har varit en pionjär inom maskininlärning sedan 1980-talet, då neurala nätverk först användes för att bekämpa kreditkortsbedrägerier. Men bara för att vi har hållit på med maskininlärning och bedrägerianalys så länge betyder inte det att vi har vilat på våra lagrar. Faktum är att det är precis tvärtom.
Data: väsentligt för bra maskininlärningssystem
Datamängder bara växer och växer och allt eftersom volymen ökar så ökar utmaningarna med att upptäcka bedrägerier. Faktum är att data är mycket viktigt när det kommer till att bygga maskininlärningssystem. Talesättet att mer data är lika med bättre modeller är sant vad gäller bedrägeribekämpning. För yrkesverksamma är det nödvändigt att deras maskininlärningsplattformar går att skala upp allt eftersom data och komplexitet ökar. Medan akademiska verktyg ofta fungerar bra med tusentals poster och ett par megabyte värt av data så mäts verkliga problem i gigabytes eller till och med terabytes värt av data.
Fördelarna med mångfald
Det finns ingen enskild maskininlärningsalgoritm eller metod som fungerar. Framgång kommer från förmågan att testa många olika sorters maskininlärningsbaserade metoder, att prova variationer av dem och testa dem med ett stort urval av datamängder. Dataexperten behöver en verktygslåda med ett brett utbud av övervakade och oövervakade metoder – samt många olika tekniker för funktionsutveckling. Sist men inte minst, maskininlärning för bedrägeribekämpning har en kreativ aspekt. Det handlar om att applicera bedrägerianalys på nya och ovanliga sätt, som att kombinera övervakade och oövervakade maskininlärningsmetoder i ett system för att bli mer effektiva än någon annan enskild metod är på egen hand.
Prestandarapport för bedrägeribekämpningsteknik
Enligt en undersökning av ACFE och SAS kommer användningen av artificiell intelligens (AI) och maskininlärning i bedrägeribekämpningsprogram sannolikt att tredubblas under de två nästkommande åren. Utforska hur organisationer bekämpar de snabbt växande bedrägeritrenderna med dessa tekniker och andra, däribland traditionell analys, generativ AI, verktyg för ärendehantering och biometri.
Läs rapporten
Integrera i verksamheten
Det borde vara uppenbart, men detta är en utmaning för många organisationers initiativ för bedrägerianalys. När du väl tagit fram en maskininlärningsmodell blir utmaningen att integrera den i verksamheten. Om din data finns i molnet är det logiskt att din maskininlärningsmodell är integrerad med din molnlagring och dina molntjänster. På samma sätt vill du ha en maskininlärningsmotor som stöttar streamande av data i realtid om din data streamas från kantmoln. Flyttbara modeller och integrering av logiska val i verksamhetens system är ytterst viktigt för storskaligt hindrande av bedrägeri – när det sker i stor skala.
White boxing
Det är mycket viktigt att förklara vad ett maskininlärningssystem gör och det kallas ofta för ”white boxing”. Maskininlärningsmetoder och modeller är oftast svarta lådor. Det är väldigt svårt (om inte omöjligt) att förklara för analytiker varför de fick fram en viss poäng eller ett visst beslut. Det finns många tillvägagångssätt för att göra det möjligt att tyda bedrägerianalyser, däribland poängkort baserade på lokal linjär approximation, generering av textuell återgivning och skapande av grafisk datavisualisering. Dessa är approximationer, men de kan ge användare insikt i maskininlärningsmodellen och leda processen för bedrägeriutredning.
Fortgående övervakning
Allting förändras och din bedrägerianalys måste över tid anpassa sig. Fortgående övervakning av maskininlärningssystem för bedrägeribekämpning är absolut nödvändigt för att lyckas. Allt eftersom befolkningar och den underliggande datan förändras försämras förväntade systeminmatningar, vilket påverkar den totala prestandan. Detta är inte unikt för maskininlärningssystem, utan regelbaserade system står inför samma utmaning. Men nyare maskininlärningsmetoder kan anpassa sig till nya och oidentifierade mönster när underliggande förändringar sker. Det undanröjer några, men inte alla, behov av att träna och utvärdera maskininlärning på nytt.
Ett bra övervakningsprogram bygger på ett proaktivt tillvägagångssätt. Eftersom det granskar den data som kommer in i systemet, utvärderar maskininlärningsmodellens prediktion och förklaringar och varnar administratörer om skiftande datatrender och statistik innan dramatiska förändringar påverkar verksamheten och det slutliga resultatet.
Och hur påverkas kunderna?
För ett finansinstitut var det en utmaning att bekämpa bedrägerier. De behövde identifiera brottsliga transaktioner, samtidigt som de upprätthöll hög kvalitet på sin kundservice. En vaksam insats för att ertappa bedrägerier får inte inkräkta på kunden genom att flagga – och avslå – legitima transaktioner.
Finansinstitutet i fråga ville modernisera sitt regelbaserade bedrägeribekämpningssystem och hitta balans mellan översyn och kundtjänst. För att göra detta arbetade de tillsammans med SAS för att implementera en maskininlärningsbaserad bedrägeribekämpningslösning som nyttjar en grupp av neurala nätverk för att skapa två olika bedrägeripoäng:
- En grundläggande bedrägeripoäng som utvärderar sannolikheten att ett konto har olagligt uppsåt.
- En transaktionspoäng som utvärderar sannolikheten att en individuell transaktion är olaglig.
Med hjälp av den här metoden kunde finansinstitutet korrekt identifiera månatliga transaktioner till ett värde av närmare en miljon dollar som hade blivit felaktigt identifierade som bedrägeri. Därtill identifierade de ytterligare 1,5 miljoner dollar per månad i bedrägerier som tidigare inte hade upptäckts. Förutom att dramatiskt förbättra företagets förmåga att upptäcka bedrägerier ledde analyslösningen till att kundnöjdheten ökade påtagligt. Hur? Genom att förbättra processen för godkännande av transaktioner, samtidigt som upptäckten av bedrägerier effektiviserades, minskade friktionen mellan företaget och dess kunder markant.
”Maskininlärning för bedrägeribekämpning har en kreativ aspekt. Det handlar om att applicera bedrägerianalys på nya och ovanliga sätt, som att kombinera övervakade och oövervakade maskininlärningsmetoder i ett system för att bli mer effektiva än någon annan enskild metod är på egen hand.
Tänk utanför boxen
Slutligen, framgångsrika maskininlärningsprogram har ett inslag av fortgående experimentering. Det räcker inte att bara bygga en maskininlärningsmodell och sedan låta den jobba. Bedragare är smarta och teknologi förändras snabbt. Att ha en testmiljö där dataexperter fritt kan experimentera med en mängd olika metoder, data och tekniker för att bekämpa bedrägeri har blivit en viktig aspekt av de främsta analysprogrammen för bedrägeri. Investeringar i att boosta kapaciteten för dataexperter som bekämpar bedrägerier har en nästan omedelbar avkastning.
Vill du lära dig mer om maskininlärning?
Kort och gott, maskininlärning automatiserar utvinningen av kända och okända mönster från data. Det uttrycker de mönstren som antingen en formula eller en instruktionsuppsättning som kan användas på ny och okänd data. Maskinen lär och anpassar sig allt eftersom resultat och nya mönster presenteras och det kan ske med eller utan övervakning.
Övervakad maskininlärning är en grupp analytiska metoder som försöker att lära sig från identifierade poster i data. Det kallas ofta för märkt data. För att träna en övervakad modell visar du den både bedrägliga och icke bedrägliga poster. Sedan försöker modellen att härleda en funktion eller en instruktionsuppsättning som kan förutsäga om bedrägeri förekommer genom att tillämpa den på nya exempel. Vanliga metoder inom övervakad maskininlärning inkluderar logistisk regression, neurala nätverk, beslutsträd, gradient boosting- maskiner, stödvektormaskiner och många fler.
Oövervakad maskininlärning är annorlunda. Då man inte vet vilken data som är bedräglig vill man att modellen skapar en funktion som beskriver datans struktur. På så sätt flaggar modellen allt som inte passar modellen som en avvikelse.
För att träna en oövervakad modell räcker det att erbjuda den data – modellen försöker sedan att härleda en funktion eller en instruktionsuppsättning som beskriver datans underliggande struktur och dimension. Funktionen eller instruktionsuppsättningen kan sedan användas på ny och okänd data.
Utmaningen med oövervakade metoder är att det ofta är svårt att fastställa systemets precision innan data har behandlats och bekräftats för hand. Vanliga metoder inom oövervakad maskininlärning inkluderar självorganiserande kartor, k-means, DBSCAN, uppskattning av kärntäthet, enklass-stödvektormaskiner, huvudkomponentanalys och många fler.
Vi går vidare till artificiell intelligens
Vi har kommit långt, från statistisk analys till maskininlärning och artificiell intelligens. Och utvecklingen visar inga tecken på att sakta ner. Upptäck hur SAS kan hjälpa dig att bekämpa bedrägeri genom proaktiv upptäckt som bygger på avancerad analys, maskininlärning och AI-tekniker.
Rekommenderad läsning
- Article Know your blind spots in tax fraud preventionTax agencies sometimes miss fraud that's happening right under their noses – despite robust external fraud prevention efforts. Find out where traditional tax fraud prevention and detection efforts fall short, and how analytics can change that.
- Article 5 ways to measure beehive health with analytics and hive-streaming dataThis analytical approach to understanding bee hive health can automatically alert beekeepers to changes in hive weights, temperatures, flight activity and more.
- Article Proactive detection – A new approach to counter terrorTo counter terror, investigative teams can better utilize the data they already have by applying a fresh approach with these steps to proactive detection.
- Article Taking pre-emptive action to stem the tide of VAT fraud lossesEU countries lost an estimated €159.5 billion in VAT revenues to VAT fraud in 2014. The solution? Hybrid fraud analytics technology.