Tech Talk: Fraudedetectie in het bankwezen verbeteren
Een verhaal over vervalsing
Bijna tien jaar geleden wilde een iets te ambitieuze tapijtverkoper een penthouse kopen in het centrum van een grote stad in Italië.
Hij verkocht tapijten, tapijten van hoge kwaliteit. Maar het was niet het soort bedrijf dat genoeg geld opbracht om een penthouse te kopen. Hoe dan ook, hij ging naar de bank voor een lening, werd goedgekeurd en werd trots de nieuwe eigenaar van een penthouse.
Na een paar extra maanden werd hij uit het penthouse gezet omdat hij de rente van zijn lening niet kon terugbetalen.
Waarom bestaan er zulke vergoedingsproblemen? Vanwege een dalende tapijtmarkt? Nee, deze persoon voegde een extra cijfer toe aan het einde van zijn loonstrook met behulp van een videotutorial over documentvervalsing.
Fraude omvat vals geld en valse veiligheidsdocumenten, maar ook identiteits- en reisdocumenten, en kost de wereldeconomie jaarlijks 3,2 biljoen pond (ruwweg 3,8 biljoen euro ). Ook vervalsing van documenten is een veelvoorkomend probleem in het bankwezen, dat jaar na jaar veel geld en middelen kost. De afgelopen maanden werkte Agilytic aan een oplossing om de banksector te helpen dit probleem aan te pakken.
Overzicht fraudedetectietechnologie
Optische tekenherkenning (OCR) - de klassieke techniek
Fraudedetectie op vervalste documenten is gebaseerd op optische tekenherkenning (OCR). OCR controleert de tekstinhoud op het document en de opmaak (bijvoorbeeld grootte, lettertypen, de positie van de tekens). Het is zelfs mogelijk om dit te doen op reeds geregistreerde documentsjablonen. De positie van de tekstvelden moet vooraf worden gedefinieerd om ervoor te zorgen dat het algoritme zich goed kan concentreren en de tekst direct kan lezen. Als het document niet geregistreerd is, kun je een heuristische benadering gebruiken waarbij het algoritme de interessante punten in de afbeelding probeert te detecteren. Vervolgens wordt de tekst en de bijbehorende informatie geëxtraheerd. Natuurlijk zijn de prestaties dan minder efficiënt. Hier illustreren we de OCR-techniek:
Omdat er geen trainingsgegevens nodig zijn, is OCR erg nuttig. Idealiter heb je één sjabloon om de tekenherkenning te verbeteren. Deze techniek heeft echter beperkingen - als het document een afbeelding is en geen tekstdocument en als de vervalsing erg goed gedaan is.
Steganografie - de grafische techniek om niet voor de hand liggende vervalsingen te detecteren
We kunnen de fraudedetectie van vervalste documenten verbeteren met steganografie. Het idee achter steganografie is dat het informatie verbergt achter wat je direct met je oog ziet, waarbij het pixelniveau van afbeeldingsgebaseerde documenten wordt bereikt om wijzigingen te detecteren. De manipulatie voor de vervalsing is het creëren van wijzigingen op de pixels rond de vervalste tekst. Deze manipulaties zijn bijvoorbeeld :
kopiëren-plakken vanuit het document (CPI)
kopiëren-plakken van buiten het document (CPO)
een of meer tekens op een afbeelding verwijderen (CUT)
een tekstvak maken om tekst na te bootsen (IMI)
Steganografie zoekt naar deze achtergrondwijzigingen om vervalsingen op documenten te detecteren. Door specifieke filters toe te passen op de afbeelding worden de wijzigingen rond de tekst benadrukt. Elk filter genereert numerieke outputwaarden en we gebruiken die waarden om het classificatiealgoritme te voeden. Na de trainingsfase kan het algoritme detecteren of er sprake is van een vervalsing (of niet).
De training van het algoritme is afhankelijk van documenten waarin vervalsing goed gespecificeerd en gelabeld is (d.w.z. waarin een waarde die door een filter uit een afbeelding wordt gegenereerd, gerelateerd is aan een vervalst of echt document).
OCR kan niet goed werken op afbeeldingsdocumenten (bijv. gescande documenten), maar steganografie past perfect bij deze taak. We hebben deze techniek getest op een dataset met loonstrookjes die 75% van de fraude detecteerde (je kunt meer informatie vinden in dit wetenschappelijke artikel). Bovendien kun je steganografietechnieken ook toepassen op andere soorten documenten, zoals identiteitskaarten of paspoorten. De kwaliteit van het beelddocument en de trainingsdocumenten is echter een beperking van deze techniek.
Agilytickijk op fraudedetectie
Het vermogen om fraude met vervalste documenten op te sporen verbetert aanzienlijk wanneer OCR en steganografie worden gecombineerd. Hoe zit het met andere waardetoevoegende stappen? Zowel vervalste als echte documenten zijn essentieel voor het trainen van het algoritme en het detecteren van fraude. In de praktijk is het echter niet eenvoudig om vervalste documenten te identificeren en te verzamelen.
Om dit probleem op te lossen, kunnen we beelddocumenten onderverdelen in kleinere afbeeldingen en de afbeeldingen bijsnijden. Documenten met meer dan één vervalsing kunnen meer afbeeldingen opleveren om te analyseren voor het algoritme, waardoor het aantal vervalste documenten om het algoritme te trainen toeneemt. Het toepassen van het detectiealgoritme op kleinere afbeeldingen verbetert de prestaties, omdat mensen vervalsingen kunnen maken op een klein en specifiek deel van de afbeelding. Vervolgens verkleinen we het onderzoeksgebied, wat betere resultaten oplevert. Ten slotte voeren we kruisvalidatie uit van de informatie die aanwezig is op sommige documenten. Documenten zoals loonstrookjes of eigendomstitels worden vergeleken met gegevens van ID-kaarten en paspoorten.
Tijdsbesparing en detectienauwkeurigheid voor banken
Fraudedetectie van vervalste documenten is een belangrijke uitdaging voor de banksector. Vandaag hebben we een robuuste oplossing - een combinatie van OCR om wijzigingen op tekstdocumenten te detecteren, steganografie om vervalsingen op beelddocumenten te detecteren en kruisvalidatiecontrole tussen de documenten. Dit resulteert in tijdsbesparing en een verbetering van het detectiepercentage voor banken.
Neem contact op als u geïnteresseerd bent om uw uitdagingen op het gebied van fraudedetectie samen met ons aan te gaan!