Wetenschap

Spellingscontrole voor kaarten

Nederland heeft het dichtste ondergrondse leidingnet ter wereld. Deze wirwar van buizen en kabels werd vroeger vastgelegd in handgetekende kaarten. Volstrekt passé in dit digitale tijdperk. Informaticus John Schavemaker leerde de computer daarom kaartlezen. En muziek spelen.

Nederland heeft het dichtste ondergrondse leidingnet ter wereld. Deze wirwar van buizen en kabels werd vroeger vastgelegd in handgetekende kaarten. Volstrekt passé in dit digitale tijdperk. Informaticus John Schavemaker leerde de computer daarom kaartlezen. En muziek spelen.

In de loop der jaren heeft de Gasunie ruim elfduizend kilometer gasleiding in de bodem gestopt. Alleen de gele markeringspalen her en der in het landschap herinneren er nog aan. Dit transportnet, het dichtste ter wereld, vertakt zich bij de steden in een fijnmazig web dat woonwijken en industrieterreinen van gas voorziet. Alleen al in Delft is bijna driehonderd kilometer gasleiding weggewerkt onder stoepen, perken en wegen.

De zachte Nederlandse bodem herbergt niet alleen gasleidingen. Opgeteld bij alle leidingen en kabels voor elektriciteit, water en telecommunicatie, ligt er circa 1,75 miljoen kilometer aan infrastructuur onder de zoden. De vervangingswaarde hiervan wordt geschat op een slordige 150 miljard gulden, ongeveer tienduizend gulden per hoofd van de bevolking. Het leidingnet is daarmee het verborgen kapitaal van de nutsbedrijven, de bodem hun oude sok.

Hoewel de distributie van energie, water en data in het algemeen soepel verloopt, is het leidingnet niet geheel onderhoudsvrij. Voor nieuwe vertakkingen, vervanging van kabels of storingen moet geregeld de schop de grond in. Energiebedrijven en verwante instellingen brengen hun ondergrondse inventaris daarom al decennia lang nauwkeurig in kaart. Nu gebeurt dat in digitale vorm, maar een groot deel van de documentatie bestaat nog uit handgetekende kaarten.

Voor het plannen van een ingrijpende onderhoudsklus moeten soms duizenden oude kaarten worden uitgeplozen. Dat kan handiger, dacht het Brabantse elektriciteitsbedrijf PNEM. Via Topspin, een stichting die onderzoek op het gebied van informatietechnologie en beeldverwerking stimuleert, formuleerde PNEM in 1994 een mooie onderzoeksopdracht. Informaticus John Schavemaker hapte toe. Hij promoveert 18 juni bij ITS.

Schavemaker: ,,Tijdens mijn afstudeerperiode was ik al in de ban geraakt van elektronische beeldverwerking. Het onderzoekswerk zelf trok me ook erg aan, mede vanwege het levendige contact dat je dan met de hoogleraren hebt.”

Dat het PNEM-project enige beperkingen oplegde, vond Schavemaker geen bezwaar. ,,Dat het onderzoek zou gaan over kaartinterpretatie, stond van het begin af vast. En ook dat het project binnen twee jaar een werkend systeem moest opleveren. Het onderzoek is daar echt een beetje omheen gebouwd. Aan de andere kant had ik daarna nog twee jaar over die ik vrij kon besteden.”

Wit of zwart

Een kaart in de computer zetten is kinderspel. Leg hem onder de scanner, sla het bitmap-bestand op, klaar is Kees. Niet dus. ,,Een doorsnee kaart levert al gauw 250 megabyte aan informatie op”, legt de onderzoeker uit. ,,Dat is nu misschien niet zo’n probleem meer, maar toen ik aan het project begon was dat nog een hoop.”

Behalve dat zo’n bult data een groot beslag legt op de computercapaciteit, heeft een bitmap nog een nadeel: hij is niet makkelijk te bewerken. Het zou het mooiste zijn als de scan van het leidingnetwerk kon worden ingelezen in een computer aided design-systeem (cad). Eventuele wijzigingen kunnen dan met een paar muisklikken worden doorgevoerd. Maar een gescand plaatje verhoudt zich tot een cad-tekening als printje tot een tekstbestand. De informatie is star en onveranderlijk: een aanpassing kan er alleen door- of overheen gekalkt worden.

Dat wordt dus overtikken. Het alternatief is dat de computer leert lezen. Sinds enkele jaren kan dat. Met optical character recognition kan een tekst via een scanner zo in de tekstverwerker gepropt worden voor verdere bewerking. Voor tekeningen bestaat een dergelijk systeem nog niet. Het digitaliseren van kaarten gebeurt daarom meestal door mensen: monnikenwerk waarbij elk punt met de hand moet worden ingevoerd.

Schavemaker besefte al gauw dat hij de omzetting van scan naar computertekening in een aantal stappen moest opdelen. In de eerste fase wordt van de gescande kaart een binair plaatje gemaakt. Het systeem bekijkt de kaart als het ware door de oogharen. ,,Simpel gezegd bepaal je van elk beeldpunt of het wit of zwart moet worden. Daardoor scheid je de voorgrond van de achtergrond, en komen de leidingen en andere tekenobjecten duidelijk naar voren.”

De computer trekt het ontstane lijnenspel over, in een proces dat vectorisatie wordt genoemd. De kaart die eerst bestond uit miljoenen losse beeldpunten, wordt nu beschreven in wiskundig bepaalde lijnen en curven. De scan, de binaire kaart en vectortekening worden vervolgens gevoerd aan detectoren, speciale stukjes software die uit de lawine van beeldelementen ‘betekenisvolle objecten’ proberen te filteren.
China

,,Daarbij moet je denken aan leidingen, knooppunten, pijlen en huizen”, aldus Schavemaker. ,,Voor elk object heb ik een detector ontwikkeld. Door de resultaten van de verschillende detectoren te combineren, kun je het aantal fouten flink reduceren. Voor simpele objecten is het herkenningspercentage zelfs tachtig tot honderd procent.”

In de laatste stappen legt de computer verbanden tussen alle beeldelementen, en wordt de kaart met een topografische kaart vergeleken. Schavemaker ontwikkelde daarvoor een database waarin allerlei classificaties en combinaties van tekenobjecten voorkomen. Een soort spellingcontrole, maar dan voor kaarten.

Mocht de computer er desondanks niet uitkomen, dan grijpt een operator in. De promovendus heeft bewust gekozen voor dit semi-automatische systeem. ,,Bij kaarten weet je meestal wat je kunt verwachten, dus deze aanpak ligt voor de hand. Algoritmen die inspelen op onvoorziene omstandigheden maken het systeem alleen maar ingewikkeld.” Al met al duurt de omzetting van een kaart anderhalf uur. ,,Maar dat was twee jaar geleden. Nu zijn de computers weer twee keer zo snel.”

Schavemaker en zijn collega’s rondden het kaartleesproject twee jaar geleden af. Opdrachtgever PNEM toonde zich indertijd enthousiast, maar heeft er vooralsnog weinig mee gedaan. ,,Ik heb begrepen dat ze de omzetting hebben uitbesteed. Daarover ben ik wel een beetje teleurgesteld”, bekent hij. ,,We hadden toch hetidee dat we een behoorlijk bruikbaar systeem hadden afgeleverd. Maar vanuit het oogpunt van kosten is het misschien goedkoper om al die kaarten op de boot naar China te zetten, en ze daar te laten overtrekken. Ik weet niet of dat werkelijk gebeurt. Maar het zou goed kunnen.”

De resterende twee jaar gebruikte Schavemaker om zijn onderzoek verder uit te diepen. ,,Je moet het geheel ook nog van een theoretisch sausje voorzien. Dat schiet er namelijk wel eens bij in. Aan de ene kant heb je een projectgroep die snel resultaat wil zien, aan andere kant je vakgroep die degelijk wetenschappelijk werk eist. Dat wringt soms. Als je iets moet implementeren, heb je geen tijd hebt om echt baanbrekende dingen te verzinnen.”

Als aardigheidje onderzocht Schavemaker nog een totaal andere toepassing van zijn systeem. In een paar weken tijd herprogrammeerde hij de computer voor het herkennen en afspelen van notenschrift. De demonstratie van de musicerende machine trok veel bekijks op zijn vakgroep. Misschien iets te veel. ,,Mijn werk van die laatste paar weken kreeg meer aandacht dan die jaren onderzoek daarvoor. Ergens wel een beetje zuur.”

Nederland heeft het dichtste ondergrondse leidingnet ter wereld. Deze wirwar van buizen en kabels werd vroeger vastgelegd in handgetekende kaarten. Volstrekt passé in dit digitale tijdperk. Informaticus John Schavemaker leerde de computer daarom kaartlezen. En muziek spelen.

In de loop der jaren heeft de Gasunie ruim elfduizend kilometer gasleiding in de bodem gestopt. Alleen de gele markeringspalen her en der in het landschap herinneren er nog aan. Dit transportnet, het dichtste ter wereld, vertakt zich bij de steden in een fijnmazig web dat woonwijken en industrieterreinen van gas voorziet. Alleen al in Delft is bijna driehonderd kilometer gasleiding weggewerkt onder stoepen, perken en wegen.

De zachte Nederlandse bodem herbergt niet alleen gasleidingen. Opgeteld bij alle leidingen en kabels voor elektriciteit, water en telecommunicatie, ligt er circa 1,75 miljoen kilometer aan infrastructuur onder de zoden. De vervangingswaarde hiervan wordt geschat op een slordige 150 miljard gulden, ongeveer tienduizend gulden per hoofd van de bevolking. Het leidingnet is daarmee het verborgen kapitaal van de nutsbedrijven, de bodem hun oude sok.

Hoewel de distributie van energie, water en data in het algemeen soepel verloopt, is het leidingnet niet geheel onderhoudsvrij. Voor nieuwe vertakkingen, vervanging van kabels of storingen moet geregeld de schop de grond in. Energiebedrijven en verwante instellingen brengen hun ondergrondse inventaris daarom al decennia lang nauwkeurig in kaart. Nu gebeurt dat in digitale vorm, maar een groot deel van de documentatie bestaat nog uit handgetekende kaarten.

Voor het plannen van een ingrijpende onderhoudsklus moeten soms duizenden oude kaarten worden uitgeplozen. Dat kan handiger, dacht het Brabantse elektriciteitsbedrijf PNEM. Via Topspin, een stichting die onderzoek op het gebied van informatietechnologie en beeldverwerking stimuleert, formuleerde PNEM in 1994 een mooie onderzoeksopdracht. Informaticus John Schavemaker hapte toe. Hij promoveert 18 juni bij ITS.

Schavemaker: ,,Tijdens mijn afstudeerperiode was ik al in de ban geraakt van elektronische beeldverwerking. Het onderzoekswerk zelf trok me ook erg aan, mede vanwege het levendige contact dat je dan met de hoogleraren hebt.”

Dat het PNEM-project enige beperkingen oplegde, vond Schavemaker geen bezwaar. ,,Dat het onderzoek zou gaan over kaartinterpretatie, stond van het begin af vast. En ook dat het project binnen twee jaar een werkend systeem moest opleveren. Het onderzoek is daar echt een beetje omheen gebouwd. Aan de andere kant had ik daarna nog twee jaar over die ik vrij kon besteden.”

Wit of zwart

Een kaart in de computer zetten is kinderspel. Leg hem onder de scanner, sla het bitmap-bestand op, klaar is Kees. Niet dus. ,,Een doorsnee kaart levert al gauw 250 megabyte aan informatie op”, legt de onderzoeker uit. ,,Dat is nu misschien niet zo’n probleem meer, maar toen ik aan het project begon was dat nog een hoop.”

Behalve dat zo’n bult data een groot beslag legt op de computercapaciteit, heeft een bitmap nog een nadeel: hij is niet makkelijk te bewerken. Het zou het mooiste zijn als de scan van het leidingnetwerk kon worden ingelezen in een computer aided design-systeem (cad). Eventuele wijzigingen kunnen dan met een paar muisklikken worden doorgevoerd. Maar een gescand plaatje verhoudt zich tot een cad-tekening als printje tot een tekstbestand. De informatie is star en onveranderlijk: een aanpassing kan er alleen door- of overheen gekalkt worden.

Dat wordt dus overtikken. Het alternatief is dat de computer leert lezen. Sinds enkele jaren kan dat. Met optical character recognition kan een tekst via een scanner zo in de tekstverwerker gepropt worden voor verdere bewerking. Voor tekeningen bestaat een dergelijk systeem nog niet. Het digitaliseren van kaarten gebeurt daarom meestal door mensen: monnikenwerk waarbij elk punt met de hand moet worden ingevoerd.

Schavemaker besefte al gauw dat hij de omzetting van scan naar computertekening in een aantal stappen moest opdelen. In de eerste fase wordt van de gescande kaart een binair plaatje gemaakt. Het systeem bekijkt de kaart als het ware door de oogharen. ,,Simpel gezegd bepaal je van elk beeldpunt of het wit of zwart moet worden. Daardoor scheid je de voorgrond van de achtergrond, en komen de leidingen en andere tekenobjecten duidelijk naar voren.”

De computer trekt het ontstane lijnenspel over, in een proces dat vectorisatie wordt genoemd. De kaart die eerst bestond uit miljoenen losse beeldpunten, wordt nu beschreven in wiskundig bepaalde lijnen en curven. De scan, de binaire kaart en vectortekening worden vervolgens gevoerd aan detectoren, speciale stukjes software die uit de lawine van beeldelementen ‘betekenisvolle objecten’ proberen te filteren.
China

,,Daarbij moet je denken aan leidingen, knooppunten, pijlen en huizen”, aldus Schavemaker. ,,Voor elk object heb ik een detector ontwikkeld. Door de resultaten van de verschillende detectoren te combineren, kun je het aantal fouten flink reduceren. Voor simpele objecten is het herkenningspercentage zelfs tachtig tot honderd procent.”

In de laatste stappen legt de computer verbanden tussen alle beeldelementen, en wordt de kaart met een topografische kaart vergeleken. Schavemaker ontwikkelde daarvoor een database waarin allerlei classificaties en combinaties van tekenobjecten voorkomen. Een soort spellingcontrole, maar dan voor kaarten.

Mocht de computer er desondanks niet uitkomen, dan grijpt een operator in. De promovendus heeft bewust gekozen voor dit semi-automatische systeem. ,,Bij kaarten weet je meestal wat je kunt verwachten, dus deze aanpak ligt voor de hand. Algoritmen die inspelen op onvoorziene omstandigheden maken het systeem alleen maar ingewikkeld.” Al met al duurt de omzetting van een kaart anderhalf uur. ,,Maar dat was twee jaar geleden. Nu zijn de computers weer twee keer zo snel.”

Schavemaker en zijn collega’s rondden het kaartleesproject twee jaar geleden af. Opdrachtgever PNEM toonde zich indertijd enthousiast, maar heeft er vooralsnog weinig mee gedaan. ,,Ik heb begrepen dat ze de omzetting hebben uitbesteed. Daarover ben ik wel een beetje teleurgesteld”, bekent hij. ,,We hadden toch hetidee dat we een behoorlijk bruikbaar systeem hadden afgeleverd. Maar vanuit het oogpunt van kosten is het misschien goedkoper om al die kaarten op de boot naar China te zetten, en ze daar te laten overtrekken. Ik weet niet of dat werkelijk gebeurt. Maar het zou goed kunnen.”

De resterende twee jaar gebruikte Schavemaker om zijn onderzoek verder uit te diepen. ,,Je moet het geheel ook nog van een theoretisch sausje voorzien. Dat schiet er namelijk wel eens bij in. Aan de ene kant heb je een projectgroep die snel resultaat wil zien, aan andere kant je vakgroep die degelijk wetenschappelijk werk eist. Dat wringt soms. Als je iets moet implementeren, heb je geen tijd hebt om echt baanbrekende dingen te verzinnen.”

Als aardigheidje onderzocht Schavemaker nog een totaal andere toepassing van zijn systeem. In een paar weken tijd herprogrammeerde hij de computer voor het herkennen en afspelen van notenschrift. De demonstratie van de musicerende machine trok veel bekijks op zijn vakgroep. Misschien iets te veel. ,,Mijn werk van die laatste paar weken kreeg meer aandacht dan die jaren onderzoek daarvoor. Ergens wel een beetje zuur.”

Redacteur Redactie

Heb je een vraag of opmerking over dit artikel?

delta@tudelft.nl

Comments are closed.