µö·¯´× ¿¬±¸ÀÚµéÀº Áö±Ý Ã¥°ú ¾¾¸§Çϰí ÀÖ´Ù. °í¹®¼ÀÇ ³»¿ëÀ» Àü»çÇÏ´Â ÀΰøÁö´É(AI) ÅøÀ» °³¹ßÇØ ¼ö ¼¼±â¸¦ °ÅÃĿ ¹®ÇåÀ» ¿¬±¸ÇÏ´Â À̵éÀ» À§ÇØ ±ÍÁßÇÑ ÀÚ¿øÀ» ±¸ÃàÇϰí ÀÖ´Â °ÍÀÌ´Ù.
±×°£ °í¹®¼´Â ½ºÄµÀ̳ª »çÁøÃÔ¿µÀ¸·Î µðÁöÅÐÈ(ûù)¸¦ ÁøÇàÇØ¿Ô´Ù. ±×¸®½º ¼Ò¹®ÀÚ³ª µ¶ÀÏ ÇÁ¶ôÅõ¾îü(Fraktur)¿Í °°Àº °í¹®¼´Â Àü¹®°¡¶ó¸é ÀÐÀ» ¼ö ÀÖ°ÚÀ¸³ª, ÀϹÝÀεéÀÌ Àаųª ÄÄÇ»ÅÍ·Î °Ë»öÇϱâ´Â ºÒ°¡´É¿¡ °¡±õ´Ù.
ÀηÂÀ» µ¿¿øÇØ ÀÌ·± °í¹®¼¸¦ ÀÏÀÏÀÌ ¼öÁýÇØ ÆÄÀÏ·Î ¸¸µå´Â ÀÛ¾÷Àº ¸¹ÀÌ ½Ã°£, ºñ¿ëÀÌ ¼Ò¿äµÈ´Ù. ÀÌ´Â °³¹ßÀÚµéÀÌ Àμ⹰À̳ª ¼Õ±Û¾¾¸¦ ±â°è°¡ ÀÐÀ» ¼ö ÀÖ´Â ÇüÅ·Πº¯È¯ÇÏ´Â ±¤Çй®ÀÚ ÀÎ½Ä¿ë µðÁöÅÐ ÅøÀ» °³¹ßÇÏ°Ô µÈ ÀÌÀ¯À̱⵵ ÇÏ´Ù. ¿©±â¿¡ µö·¯´×À» Ȱ¿ëÇϸé Á¤È®¼ºÀÌ Å©°Ô Çâ»óµÈ´Ù.
Àι®ÇÐ ¿¬±¸ÀÚµéÀº ÀÌ¿Í °°Àº AI ºÐ¼®À» °ÅÄ£ ÅØ½ºÆ®¸¦ »ç¿ëÇØ Ã¥ ¼Ó ƯÁ¤ ´Ü¾î¸¦ °Ë»öÇϰí, ÁÖ·Î »ç¿ëµÆ´ø Ç¥ÇöÀÌ ½Ã°£ÀÇ È帧¿¡ µû¶ó ¾î¶»°Ô º¯ÈÇß´ÂÁö »ìÆìº¸¸ç ¾ð¾î ÁøÈ ÃßÀ̸¦ ºÐ¼®Çϰųª Àα¸ Åë°è³ª »ç¹« ±â·ÏÀ» ÅëÇØ °³°³ÀÎÀÇ ¹è°æµµ ÃßÀûÇÒ ¼ö ÀÖ´Ù.
À̹ø ¿¬±¸ÀÇ ¶Ç ´Ù¸¥ ÀÌÁ¡À̶ó¸é, ÅØ½ºÆ® À̹ÌÁö°¡ µö·¯´× ³×Æ®¿öÅ©ÀÇ °´Ã¼ÀνÄÇнÀÅ×½ºÆ®¸¦ ¼öÇàÇϱ⿡ ÀÌ»óÀûÀÎ ¿©°ÇÀÌ µÈ´Ù´Â Á¡ÀÌ´Ù. µ¿¹°»çÁøÀ̳ª °Å¸®ÀÇ Ç³°æ ¼Ó ¿©·¯ ¿ä¼Ò¸¦ ½Äº°ÇÏ´Â °æ¿ì¿Í ´Þ¸®, ÅØ½ºÆ® ¼Ó ±ÛÀÚ°¡ ‘c’ ÀÎÁö ‘o’ ÀÎÁö ÆÇ°¡¸§ÇØ¾ß ÇÏ´Â °æ¿ì ³ª¿Ã ¼ö ÀÖ´Â ´äÀº ÇϳªÀ̱⠶§¹®ÀÌ´Ù.
Å丶½º ºê·ÎÀÌ¿¤(Thomas Breuel) ¿£ºñµð¾Æ ¿¬±¸¿øÀº “µö·¯´× ¸ðµ¨¿¡ °³(dog) »çÁøÀ» ÀÔ·ÂÇÏ¸é °³(dog) Àϼöµµ ÀÖ°í, µ¿¹°(animal) Àϼöµµ ÀÖ°í, ´Ü¸ð ÄÚ±â(cogi)¶ó°í ´äÇÒ ¼öµµ ÀÖ´Ù. ±×·¯³ª ±ÛÀÚÀÇ °æ¿ì ´äÀÌ ¸íÈ®ÇÏ´Ù. Á¤´ä°ú ¿À´äÀÌ ¹«¾ùÀÎÁö ºÐ¸íÈ÷ ¾Ë ¼ö ÀÖ´Ù”°í ¼³¸íÇÑ´Ù.
°í¹®¼¿Í ¸¸³ ÀΰøÁö´É(AI) ±â¼ú
ºê·ÎÀÌ¿¤Àº 2004³âºÎÅÍ °í¹®¼ ºÐ¼®¿¡ µö·¯´×À» »ç¿ëÇØ ¿Ô´Ù. ¼øÈ¯½Å°æ¸Á(RNN)ÀÇ ÀÏÁ¾ÀÎ LSTM(Long Short-Term Memory)À» ÀÌ·¯ÇÑ ÀÛ¾÷¿¡ Àû¿ëÇÑ ÃÖÃÊÀÇ ¿¬±¸ÀÚ ±×·ìÀ» À̲ø¾î¿Ô´Ù.
Àνķü°ú ¿Àµ¶·ü Ãø¸é¿¡¼ Á¤¸» ȹ±âÀûÀ̾ú´Ù. ±×´Â ¿¬±¸¸¦ ÁøÇàÇÒ ´ç½Ã µ¶ÀÏ Ä«ÀÌÀú½º¶ó¿ìÅ׸¥´ëÇб³(the University of Kaiserslautern) ±³¼ö·Î ÀçÁ÷ ÁßÀ̾ú´Ù.
±¸ÅÙº£¸£Å© Àμâ¼úÀÇ º»°íÀåÀÎ µ¶ÀÏÀº °í¹®¼ µ¥ÀÌÅ͸¦ ¿¶÷Çϱ⿡ ÁÁÀº °÷À̾ú´Ù°í ºê·ÎÀÌ¿¤Àº ¸»Çß´Ù. ÄíÅÙº£¸£Å© Àμâ¼úÀÌ ¹ß¸íµÈ ÈÄ ¸£³×»ó½º ½Ã±â µ¿¾È À¯·´ Àü¿ª¿¡ °ÉÃÄ Àμâ±â°¡ ³Î¸® º¸±ÞµÈ Á¡Àº ¿ì¸® ¸ðµÎ ¾Ë°í ÀÖ´Â »ç½ÇÀÌ´Ù.
16¼¼±âºÎÅÍ 20¼¼±â ÃʱîÁö ³ª¿Â ¿©·¯ µ¶ÀϾî Àμ⹰Àº ÇÁ¶ôÅõ¾î(Fraktur)¶ó°í ºÒ¸®´Â ¿¹¼úÀû ¼Ã¼·Î ÀÛ¼ºµÆ´Ù. ºê·ÎÀÌ¿¤ÀÇ ¼³¸í¿¡ µû¸£¸é Áö±ÝÀº ÀÌ ¼Ã¼¸¦ ÀÐÀ» ¼ö ÀÖ´Â »ç¶÷ÀÌ ´õ ÀÌ»ó Á¸ÀçÇÏÁö ¾Ê´Â´Ù.
ºê·ÎÀÌ¿¤ ÆÀÀº 2007³â ÇÁ¶ôÅõ¾î Àμ⹰À» µðÁöÅÐ ¹æ½ÄÀ¸·Î Àü»çÇϱâ À§ÇØ OCRopus(optical character recognition)¶ó°í ºÒ¸®´Â ¿ÀǼҽº ½Ã½ºÅÛÀ» °³¹ßÇß´Ù. ¼ÒÇÁÆ®¿þ¾îÀÇ ÃֽйöÀüÀÎ ‘ocropus3’Àº ±êÇãºê(GitHub)¿¡¼ »ç¿ëÇÒ ¼ö ÀÖ´Ù. ¿¬±¸ÆÀÀÇ ¼³¸í¿¡ µû¸£¸é, ¶óƾ¾î ÅØ½ºÆ® ¿Àµ¶·üÀÌ 0.1%¿¡ ºÒ°úÇÑ ¼öÁØÀÌ´Ù.
¿¬±¸ÁøÀº ´Ù¸¥ ¾ð¾î¿Í ÅØ½ºÆ® ¿ëÀ¸·Î Æ®·¹ÀÌ´×µÈ µ¥ÀÌÅ͸¦ »ç¿ëÇØ ¶óƾ¾î¿Í ±×¸®½º¾î, »ê½ºÅ©¸®Æ®¾î ÅØ½ºÆ®¿¡ OCRopus¸¦ »ç¿ëÇß´Ù.
¶Ç ´Ù¸¥ µ¶ÀÏ ¿¬±¸ÀÚÀÎ ¿ìº£ ½´ÇÁ¸µ¸¸(Uwe Springmann)Àº OCRpus·Î µðÁöÅÐ Àι®ÇÐ ¿¬±¸¸¦ ÁøÇàÇߴµ¥, ±×°¡ ´Ù·ç´Â 15¼¼±â¿¡¼ 17¼¼±â±îÁöÀÇ ¶óƾ¾î, µ¶ÀϾî Àμ⹰¿¡ ´ëÇÑ ¹®ÀÚÀνķüÀº ±âÁ¸ 85%¿¡¼ 98%·Î °³¼±µÆ´Ù.
½´ÇÁ¸µ¸¸°ú ±×ÀÇ °øµ¿ÀúÀڷΠȰ¾àÇÏ´Â Å©¸®½ºÆ¼¾È ·¹¿ï(Christian Reul)Àº ÇöÀç ¿£ºñµð¾Æ GPU¿Í LSTM, ÄÁº¼·ç¼Ç ´º·² ³×Æ®¿öÅ©(convolutional neural networks)¸¦ ÅëÇÕÇÑ Ä®¶ó¸¶¸®(Calamari)¶ó´Â À̸§ÀÇ ¿ÀǼҽº µö ·¯´× OCR ¿£ÁøÀ» »ç¿ëÇϰí ÀÖ´Ù. ºß¸£Ã÷ºÎ¸£Å© ´ëÇб³(the University of Würzburg) ¹®Çå·µðÁöÅÐÇÐ ¼¾ÅÍ µðÁöÅÐÈ ÀÌ»çÀÎ Å©¸®½ºÆ¼¾È ·¹¿ï¿¡ µû¸£¸é GPU¸¦ »ç¿ëÇØ Æ®·¹ÀÌ´×°ú Ãß·Ð ¼Óµµ°¡ 10¹è Çâ»óµÆ´Ù.
±Û : ÀÌ»þ »ì¸®¾È(Isha Salian) / »çÀ̾𽺷ÀΰøÁö´É ¶óÀÌÅÍ / ¿£ºñµð¾Æ
ÃÖÅÂ¿ì ±âÀÚ taewoo@internews.kr
<ÀúÀÛ±ÇÀÚ © ÀÎÅÍÆäÀ̽º´º½º, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö>