De rubriek ‘AI on the road’ behandelt onze AI expert Krijn Logister vraagstukken die hij tijdens meetings met klanten tegenkomt. In deze rubriek: ‘Wat is er zo AI aan Optical Character Recognition (OCR)?’

Krijn, wat is er zo AI aan OCR, deze techniek bestaat immers toch al jaren?
Dat is inderdaad een vraag die mij vaak wordt gesteld door organisaties waar ik langsga om te praten over wat Artificial Intelligence kan betekenen voor hun archief. OCR, de techniek om bestanden om te zetten tot leesbare, doorzoekbare tekst, is niets nieuws, dat bestaat al jaren. Wat er nu anders is dan jaren geleden is dat de hedendaagse OCR-toepassing, voorzien van AI-techniek, in staat is ook hele oude archieven snel te doorzoeken. De OCR-engine van nu is er een waarvan de accuraatheid en snelheid enorm zijn verbeterd, doordat gebruik wordt gemaakt van machine learning technologie.

Kun je dit verduidelijken met een voorbeeld?
‘Wij leveren onze OCR/AI-toepassing, Hyarchis Search-It, bij diverse organisaties binnen de hypotheeksector. Hypotheekdossiers worden lang bewaard, twintig tot dertig jaar is heel normaal. De documenten die zich in deze archieven bevinden zijn vaak gescand in een tijd dat er minder technisch vernuft en controle was. Veelal zijn deze documenten voorzien van ruis, bijvoorbeeld koffievlekken, wat het moeilijker maakt om deze om te zetten naar doorzoekbare tekst. Wat voor ons vanuit het menselijk oog makkelijk te herkennen is, is voor een computer een stuk lastiger.

Wanneer komt Artificial Intelligence om de hoek kijken?
Hyarchis Search-It legt de focus niet alleen op de OCR-functie, maar richt zich daarnaast op de voor- en nabewerking. De tool herkent documenten, bepaalt automatisch wat er nodig is voor een maximale bewerking en optimaliseert deze voor OCR. Daarna worden de bestanden herkend en voorzien van een ‘blinde’ OCR laag die op de documenten wordt gezet. Als laatste wordt het document weer in elkaar gezet, dit alles zonder iets aan te passen in het originele bestand.

Wat is het doel uiteindelijk van deze OCR herkenning?
AI helpt om content, de inhoud, van de documenten meer tot haar recht te laten komen. Met Search-It maak je op een slimme manier gebruik van AI, doordat je archief relatief eenvoudig en snel volledig doorzoekbaar wordt. Hierdoor kun je op een intelligente manier gebruik gaan maken van je content. Je weet exact wat er in je archief staat en kunt deze complexe data gaan omzetten tot inzichten.

Dan nu even terug naar de praktijk. Hoe en waar pas je deze techniek toe?
Neem Quion als voorbeeld, een grote partij die administratieve afhandeling voor de hyptoheek sector verzorgd. Zij beheren de complete hypotheekdossiers voor geldverstrekkers. Dit betekent een archief van miljoenen documenten. De nog ongestructureerde inhoud van deze documenten wordt door middel van AI omgezet naar gestructureerde data. Deze data biedt tal van mogelijkheden om de dienstverlening verder te optimaliseren. Hiervoor is door Hyarchis in samenwerking met Quion een roadmap samengesteld, waarbij Search-It als eerste project wordt behandeld. Daarna wordt de AI tool, Hyarchis Classify getest. 

En dat leidt bij Quion uiteindelijk tot..?
Of het nu het toevoegen van een bouwdepot betreft of het verzoek tot het toesturen van een hypotheekdossier, alle e-mails en bijlagen worden geopend, waarna het juiste proces gestart wordt. Met onze AI tools worden alle documenten doorzoekbaar, waarna Hyarchis Classify deze documenten classificeert en geheel geautomatiseerd toekent aan de juiste workflow. Inmiddels is de proof of concept met Hyarchis Search-it goedgekeurd.

Kunnen we concluderen dat de huidige OCR-tools zeer zeker AI zijn?
‘Correct. De AI-techniek in OCR-tools zorgt ervoor dat de inhoud van documenten nog beter en sneller herkend en gelezen wordt. Bovendien zorgt AI ervoor dat data wordt omgezet in inzichten. Dus ja, het antwoord op de vraag luidt dan ook: hedendaagse OCR-functionaliteit is AI.

Auteur: Krijn Logister

Terug naar feed