Tuesday, January 13, 2009

Who Checks the Spell-Checkers?

Tja, eigenlijk nooit zo bij stilgestaan, moet ik bekennen. Wanneer je Word gebruikt weet je dat er een spellchecker door het programma gehanteerd wordt en meedraait. Je vaart er zelfs steeds meer blind op. Maar hoe correct en up-to-date is deze controleur eigenlijk? In dit artikel in Slate wordt een beetje uit de doeken gedaan hoe het werkt. Je hebt de spellecheckers, of woordenboeken die bij tekstverwerkers gebruikt worden en daarnaast zijn er de woordindexen die bijvoorbeeld een zoekmachine hanteert. Deze werken met andere algorithmes en zijn recenter dan de spellchecker van Microsoft. In het artikel bleek Microsoft bijvoorbeel Facebook niet te kennen, wel Friendster. Ook namen zijn soms vrij arbritair toegevoegd. De bandnaam Monkees wordt verbeterd tot monkeys. En er zijn op dit vlak andere rare voorbeelden te geven. Een belangrijke vraag is waarom het zo lang moet duren voordat bepaalde namen en woorden in het woordenboek van Microsoft terechtkomen? Terwijl de indexen bij zoekmachines laten zien dat het veel sneller kan. Volgens het artikel komt dit doordat de indexen bij tekstverwerkers en zoekmachines een verschillend doel dienen. Zoekmachines moeten voorbereid zijn op zoekvragen van de meest uiteenlopende aard, inclusief spelfouten. Hun woordenschat moet dus zo groot en breed mogelijk zijn. Tekstverwerkers zijn conservatiever en gericht op de meest gangbare, legitieme woorden. Citaat: "In other words, search engines put breadth first and spelling accuracy second while word processors are the other way around". Meer weten? Lees dan vooral het volledige, engelstalige, artikel in Slate.

No comments: