Tuesday, September 8, 2009

Google Books voor historische teksten

Onderzoekers in Israel zijn er in geslaagd een computerprogram-ma te ontwikkelen, dat oude teksten kan scannen en lezen (ontcijferen). Het programma gebruikt eenzelfde algorithme voor patroonherkenning, dat ook bij het "lezen" van vingerafdrukken gebruikt wordt. Maar: "..... in this case, the program identifies letters, words and even handwriting styles, saving historians and liturgists hours of sitting and studying each manuscript". Nog een citaat: "By recognizing such patterns, the computer can recreate with high accuracy portions of texts that faded over time or even those written over by later scribes, said Itay Bar-Yosef, one of the researchers from Ben-Gurion University of the Negev.“The more texts the program analyses, the smarter and more accurate it gets,” Bar-Yosef said." De droom van wetenschappers die zich bezighouden met oude teksten natuurlijk. Wanneer deze teksten eenmaal ingevoerd zijn in de database van Google fungeert Google daarna als de zoekmachine, die het ook is. Op die manier is een oude tekst snel terug te vinden en wordt bovendien "leesbaar" gepresenteerd. Wat vroeger enorm veel ontcijferwerk en tijd kostte, gebeurt nu in een vloek en een zucht. Het programma werkt nu alleen nog maar met Hebreeuwse teksten, maar zal andere talen net zo goed kunnen ontcijferen aldus de onderzoekers. En voor ons bibliotheken: "And as libraries across the world move to digitize their collections, they say the program can drive an engine to search instantaneously any digital database of handwritten documents." Bij Wired leest u er meer over.

No comments: