Oefening baart kunst

Promovendus Liping Yang van de vakgroep telecommunicatie- en verkeersbegeleidingssystemen bij de faculteit Elektrotechniek heeft op drie manieren geprobeerd om computers geschreven tekst te laten lezen. De Verborgen Markov-modellen, die computers trainen in het herkennen van handschriften, lijken nog het meest te beloven.

Het is begrijpelijk dat het lezen van handschriften niet meevalt voor een computer. Het ene handschrift is het andere niet. Afhankelijk van de aangeleerde schrijfmethode kunnen er grote verschillen optreden. En ook bij één persoon zijn er verschillen te bespeuren. De ene keer schrijft men wat groter dan de andere keer, of soms net iets schuiner. Er zijn mensen die zelfs iedere dag anders schrijven, afhankelijk van emotionele gesteldheid, en van de schrijfwaren.

Als de computer eenmaal in staat is om handschriften te lezen dan zijn vele toepassingen met multimedia denkbaar. Het identificeren van handtekeningen bijvoorbeeld. In de toekomst kan dit mogelijk de pinpas vervangen. Overschrijven van de ene rekening naar de andere kan dan per computer met schrijftableau.

Toch klinkt dit heel fraudegevoelig. Mensen die een beetje op de hoogte zijn van de programmatuur waarmee computers handschriften lezen, zouden door veel oefenen ook handtekeningen kunnen namaken. Yang wijst erop dat het daarom ook erg belangrijk is de druk van de pen op het tableau en de schrijfsnelheid te kunnen meten. Die zijn niet aan de handtekening te zien, maar wel erg karakteristiek van persoon tot persoon.
Chinees

Yang (mba.b.sc.), geboren in China, ziet ook een andere belangrijke toepassingsmogelijkheid: het lezen van Chinese tekens. ,,Vele Chinezen beheersen het westerse alfabet niet. Op school leer je schrijven in Chinees alfabet. Het opschrijven van gesproken woord in westers alfabet geeft vaak problemen met de spelling. Mensen leren vaak pas omgaan met een westers toetsenbord zodra dat voor hun werk vereist is.”

Als de computer tekens kan herkennen, dan kunnen Chinezen de computer in hun eigen taal opdrachten geven via een schrijftableau. Vroeger probeerde men dat op te lossen door een keyboard met Chinese tekens te ontwikkelen. Aangezien er zo’n vijfduizend verschillende tekens zijn moest het Chinese schrift daarvoor eerst uiteen gerafeld worden in een veel kleiner aantal basistekens.

Als voorbeeld schrijft Yang haar naam in twee tekens op papier. ,,Dit geheel is mijn familienaam, Yang”, legt ze uit. ,,Allebei de tekens los hebben geen formele betekenis.” ,,Deze”, zegt Yang, terwijl ze één van de twee aanwijst, ,,heeft te maken met hout en als je twee van deze achter elkaar zet dan staat er bos. Een keyboard met deze twee lossetekens kan een heleboel verschillende woorden vormen.”

Toch blijkt het in de praktijk voor gebruikers erg moeilijk om Chinese tekens uit deze keyboardtekens samen te stellen. Het zou daarom veel makkelijker zijn als de computer Chinees handschrift kon lezen van een schrijftableau, denkt Yang. De betekenis van de tekens kan in het geheugen worden opgeslagen en op die manier kan een computer in het Chinees commando’s uitvoeren.
Raaklijnen

Yang heeft zich beperkt tot leren lezen van de computer van het zichtbare deel van het schrift, en heeft dus het de pendruk en schrijfsnelheid even buiten beschouwing gelaten. Ze heeft drie manieren getest om de computer te laten lezen. Daarvoor zocht ze naar methodes die zo min mogelijk last hebben van verschillen in grootte van de letters. Eén methode, het zogenaamde dynamisch programmeren, kijkt naar hoeken langs de letters. Het maakt raaklijnen aan de letters op constante afstand van elkaar en kijkt naar de hoek die deze raaklijnen met elkaar maken. Dat kan hij als referentie nemen bij het herkennen van ingevoerde geschreven tekst, na correctie voor de grootte van de letter.

Een ander model, dat gebruik maakt van Fourier-analyses, kijkt in plaats van naar de hoeken die raaklijnen maken, naar de totale vorm van de letter. Hij beschrijft de letter als functie die bestaat uit een aantal vaste elementen. De coëfficiënten voor deze elementen variëren per letter. Als de computer nu een letter moet herkennen dan bepaalt hij de functiecoëffiënten en bekijkt met welke letter die het best overeenkomen.

Maar de meest veelbelovende methode is volgens Yang het Verborgen Markov-model. Deze maakt gebruik van kansverdelingen. Door deze letter dertig keer op te schrijven en aan de computer te laten lezen, krijgt de machine het idee hoe een bepaalde letter er gemiddeld uitziet. Op die manier wordt de computer getraind op het hele alfabet. De ingevoerde letter die de hoogste waarschijnlijkheid heeft wordt herkend.

Inmiddels is er al een fabrikant die een notebook heeft uitgebracht, ter grootte van een rekenmachine, dat in staat is handgeschreven tekst te lezen. Het is echter nog vrij primitief want het kan alleen maar één bepaald handschrift aan. Als de bezitter zijn personal digital assistent aan zijn broer zou willen doorverkopen, dan moet hij weer opnieuw getraind worden voor diens handschrift.

Ook al is deze assistent volgens Yang nog niet bijzonder succesvol, toch heeft ze wel bewondering voor het vertrouwen dat de producent kennelijk al heeft in het produkt. ,,Wat je hier ziet is dat ergens ter wereld al een premature techniek op de markt gebracht wordt, terwijl men op andere plaatsen, zoals bij ons op de vakgroep, nog met heel fundamenteel onderzoek bezig is.” (J.O.)

Joyce Ouwerkerk

Yang: … een premature techniek …

Computers hebben meestal geen training nodig, als ze eenmaal over de juiste software beschikken. Voor het herkennen van handschriften is dat anders. Promovendus Liping Yang van de vakgroep telecommunicatie- en verkeersbegeleidingssystemen bij de faculteit Elektrotechniek heeft op drie manieren geprobeerd om computers geschreven tekst te laten lezen. De Verborgen Markov-modellen, die computers trainen in het herkennen van handschriften, lijken nog het meest te beloven.