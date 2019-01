Na veel lawaai over big data binnen de verzekeringsindustrie wordt het de laatste tijd toch iets stiller op dit terrein. Net als ieder ander onderwerp volgt ook big data hier de Gartner Hype Cycle: elke noviteit volgt een vast patroon. Eerst is er een aantal succesverhalen die de verwachting van het onderwerp sterk doen toenemen. Dit leidt tot een piek met te hooggespannen verwachtingen die na enige tijd niet realiseerbaar blijken. Dan zakt het verwachtingsniveau naar een dieptepunt om uiteindelijk weer toe te nemen tot een realistischer niveau.

Zo waren er verhalen van het combineren van big data met machinelearningtechieken om te zorgen voor zelflerende premiesystemen voor (schade)verzekeringen. Geen maandenlange trajecten meer nodig van het bepalen van risicopremies, projecties naar de toekomst en het finetunen aan de hand van de concurrentie, maar een computergestuurd premiemodel dat zich zelf aanpast zodra er meer gegevens beschikbaar komen. Voor een schadeactuaris die zich met prijsstelling bezighoudt is dit een droom met twee kanten: enerzijds een dagdroom die het werk sterk vereenvoudigt en anderzijds een nachtmerrie waarbij je werk overbodig wordt omdat de computer de analyses sneller, eenvoudiger en beter kan.

Prijsverschillen op postcode

Nu zijn big data niet nieuw binnen de verzekeringsindustrie: al jaren proberen verzekeraars de klanten zo min mogelijk te vragen en via externe gegevens zo veel mogelijk data te koppelen. Een mooi voorbeeld is het uitvragen van het kenteken van een voertuig, waarna de verzekeraar met een datakoppeling alle informatie over dat voertuig als bijvoorbeeld gewicht, motorvermogen en waarde eenvoudig ophaalt. Ook in de prijsstelling is dit zichtbaar: was het tarief voor een autoverzekeraar in het verleden alleen afhankelijk van een paar factoren, nu wordt er steeds meer gedifferentieerd in prijs zonder dat er meer informatie wordt opgevraagd: elk jaar halen de voorbeelden van prijsverschillen tussen leeftijden of postcodes wel weer eens de pers.

Ook machine learning is – wiskundig gezien – niet nieuw. Al in de jaren zeventig van de vorige eeuw ontstonden de ideeën om computers te gebruiken om te leren op een manier zoals mensen leren (denk aan neurale netwerken) en ook andere technieken zijn theoretisch al langer uitgedacht. Het echte startpunt van de big data hype is de recente ontwikkeling in computerkracht in combinatie met big data en machine learning. Theoretisch doordachte concepten worden nu in sneltreinvaart in praktijk gebracht door de toegenomen computermogelijkheden.

Deep learning

Zo is Google in staat om babyfoto’s van je gezin van de juiste naam te voorzien als je alleen een paar recente foto’s van je oudere kinderen zelf van naam hebt voorzien. De techniek die hiervoor gebruikt wordt is deep learning en maakt gebruik van de gefotografeerde ontwikkeling van andere baby’s tot volwassenen die al eerder zijn geüpload bij Google. De grote hoeveelheid foto’s van andere gezinnen helpt Google om een paar foto’s van jouw eigen gezin snel te kunnen classificeren.

Deze technieken zijn ook toepasbaar binnen de verzekeringsindustrie. Zo startte Legal & General in Amerika in de zomer van 2017 een korte pilot met een levensverzekering waarbij de premiestelling en acceptatie geschieden aan de hand van een selfie. De leeftijd, het geslacht en de body mass index (BMI) worden dan afgeleid van de foto en er wordt binnen seconden een quote afgegeven.

Ook binnen Nederland zijn er initiatieven met deze nieuwe technieken. Independer bracht eind vorig jaar in samenwerking met Nationale-Nederlanden een autopolis op de markt onder de naam Roxo, waarbij het tarief is bepaald met behulp van machine learning. Daarnaast zijn er al langer verzekeringen op de markt waarbij de prijs mede wordt bepaald aan de hand van je rijgedrag dat wordt gemonitord door een apparaatje aan boord van de auto of een app op de smartphone. Toch lijken deze initiatieven maar een zeer beperkte doelgroep aan te spreken.

Vertrouwen en solidariteit

Verzekeren is een complex product. Je ruilt een vaste premie om voor een vergoeding voor financieel verlies door een onzekere gebeurtenis. Dit vereist van klanten vertrouwen in de verzekeraar, maar ook de bereidheid tot solidariteit, het delen van de risico’s met anderen die ook die verzekering kopen, waarbij prijs ook zeker een onderdeel is van het beslisproces. Hierbij past slecht een afsluitproces waarbij een premie getoond wordt die voor de klant niet intuïtief duidelijk is: als je in de premieberekening een factor opvraagt die niets van doen lijkt te hebben met het risico, komt daar al snel kritiek op. Bijvoorbeeld bij het afsluiten van een autoverzekering: een foto uploaden van de auto wordt ‘normaler’ gezien dan bijvoorbeeld het opvragen van een foto van de inhoud van de koelkast.

De claim van big data dat er mogelijk veel meer data gecorreleerd zijn met het risico en dat je die data kunt gebruiken om het risico in te schatten, is mogelijk waar, maar gaat niet

helpen in de uitlegbaarheid van de premie. Als daarnaast technieken als neurale netwerken of deep learning gebruikt zouden worden, wordt het voor zowel de consument als de verzekeraar onduidelijk op welke gronden premies worden vastgesteld.

Tevens wordt het lastiger om te beoordelen of dit soort modellen toch niet impliciet ergens onbedoelde discriminatie inbouwt. Als voorbeeld zou je een model kunnen maken dat voorspelt of een Amerikaanse presidentskandidaat de verkiezing zal winnen of niet. Het model zal puur uit het feit dat er nog nooit een vrouw heeft gewonnen, de factor ‘geslacht’ als belangrijke factor meewegen. Actuarissen zouden een dergelijke factor nooit zelf kiezen in de modellen, maar een computer is, als de data voorhanden zijn zonder expliciet voorbehoud, volledig indifferent in de keuze van de factoren.

Schadelast

Ook zelflerende premiesystemen zullen niet gangbaar worden, omdat het tijdverschil tussen keuze en resultaat veel groter is. Als je een model maakt voor het taggen van foto’s, krijg je direct terugkoppeling als het mechanisme het verkeerd heeft. Een dergelijke directe terugkoppeling is van wezenlijk belang voor zelflerende systemen. Voor verzekeringspremies is de terugkoppeling de schadelast. En die komt nu eenmaal pas veel later tot stand, waardoor er geen directe terugkoppeling mogelijk is en waardoor zelflerende premiesystemen feitelijk met een veel te lange vertraging werken. De noodzakelijke investeringen in dit soort systemen zullen niet opwegen tegen de geringe voordelen. De analyse van de mogelijkheden en de uitkomsten daarvan brengen ons de laatste tijd weer met beide benen op de grond, waardoor de markt volgens de Gartner Hype Cycle beland is in het dieptepunt.

Eerste schifting

Het feit dat de echte hype over lijkt, geeft ons wel de ruimte om te onderzoeken op welke plekken big data en machine learning wel toepasbaar zijn binnen de verzekeringsindustrie. Naar verwachting blijven bij de tarifering transparantie en uitlegbaarheid echt nodig, maar kan het opstellen van tarieven wel sneller door de toepassing van machinelearningtechnieken in de opbouw van een tariefmodel: laat de computer een eerste schifting maken in de beschikbare verklarende variabelen, alvorens de definitieve modellen door de actuarissen met de hand te laten afronden. Dit geeft een aanmerkelijke versnelling en besparing van de werkzaam­heden.

Toch zit daar niet het grootste voordeel van de nieuwe ontwikkelingen. Er zijn namelijk andere terreinen denkbaar, waar verzekeraars hun klanten veel beter kunnen bedienen met meer data en nieuwe technieken. Denk hierbij aan de mogelijkheid om meer geautomatiseerd te zoeken naar mogelijke fraude om zo de fraudecoördinatoren van leads te voorzien met de grootste kans op ‘succes’. Beheersen van fraude is ook een methode om het vertrouwen van consumenten terug te winnen en de tarieven laag te houden. Dat modellen daarbij minder transparante uitkomsten genereren, is minder van belang omdat het fraudeonderzoek toch altijd al handmatig wordt vervolgd.

Proactieve hulp

Wat wel in het voordeel van de klant werkt zijn service­georiënteerde meldingen. Zo kan automatisch een bericht worden aangemaakt, als bijvoorbeeld uit externe openbare bronnen blijkt dat een kenteken op een andere naam is overgeschreven, om de klant te wijzen op het feit dat de verzekering wellicht ook moet worden aangepast. Andere open-source data in combinatie met voorspellende modellen kunnen gebruikt worden voor preventie van schadelast, door het uitsturen van waarschuwingen op de momenten dat het voor de klant relevant is. Of, en denk hierbij bijvoorbeeld aan lokale heftige regenbuien, een specifieke groep klanten aan te schrijven als er een vermoeden is dat mogelijk schade is ontstaan om zo proactief hulp te bieden.

Eerlijker verzekeren

Het grootste voordeel voor de klant van de nieuwe ontwikkelingen zit echter in het communicatieproces met de verzekeraar. Verzekeren is niet eenvoudig voor de meeste klanten. Chatbots en conversational design websites kunnen klanten eenvoudig, snel én 24 uur per dag helpen met hun vragen rond nieuwe verzekeringen, bestaande dekkingen en schades. Een mooi voorbeeld hiervan is Lemonade in de Verenigde Staten. Bij de premieberekening worden klanten daar in staat gesteld om snel en eenvoudig een complete dekking af te nemen voor hun inboedel, of om meer vragen te beantwoorden om beter een afweging te kunnen maken tussen een lagere premie en meer risico zelf te dragen.

In andere vakgebieden zijn dit juist de terreinen waar zelflerende algoritmes nu al met succes worden toegepast. En waarbij gedurende het proces waar mogelijk zoveel mogelijk interne en externe data wordt betrokken. Als je bijvoorbeeld een pakketje van Bol.com niet hebt ontvangen, word je op haar website zeer snel en handig geholpen om alle informatie bij elkaar te krijgen, zodat een medewerker aan het eind van het proces alle data overzichtelijk bij elkaar heeft om de juiste stappen te kunnen zetten.

En voor actuarissen is dit werk usance: op basis van historische data modellen maken waarmee voorspellingen gemaakt worden. Geen voorspellingen rond schade, maar rond de vragen waar klanten mee zitten. En dat die modellen niet zo transparant zijn, is minder van belang: de klant voelt zich snel en goed geholpen. En al zal dit er niet voor zorgen dat klanten verzekeren ‘leuk’ gaan vinden, we kunnen het ze hier wel makkelijker en duidelijker maken. En ook worden ze geholpen om de dekking beter af te stemmen op hun eigen wensen en eisen. Zo kunnen we data inzetten om verzekeren nog eerlijker te maken en ook daar heeft de verzekeringsindustrie weer baat bij.