NDSL 24,729 Link page¿¡¼­ [¿ø¹®º¸±â] ¹öÆ°À» Ŭ¸¯Çϼ¼¿ä.

[±¹³» ÇÐÀ§³í¹®]

°¢Á¾ ¹®¼­¸¦ µðÁöÅÐ ¿µ»óÀÇ ÇüÅ·Π°ü¸®ÇÏ´Â ½Ã½ºÅÛ¿¡¼­´Â ¹®¼­ÀÇ °¡°ø, º¯È¯, °Ë»ö, Àç»ý»ê µîÀ» À§ÇØ ¹®¼­ ¿µ»óÀÇ ³»¿ëÀ» ´Ù¾çÇÑ ÇüÅ·Πó¸®ÇÒ ¼ö ÀÖ¾î¾ß ÇÑ´Ù. º» ³í¹®¿¡¼­´Â ¹®¼­ ¿µ»óÀ» ´Ü¾î ´ÜÀ§·Î ºÐÇÒÇÏ°í, °¢ ´Ü¾î ¿µ»óÀÇ ¼Ó¼ºÀ» ÃßÃâÇÏ´Â ½Ã½ºÅÛÀ» Á¦¾ÈÇÑ´Ù. Áö±Ý±îÁö ´ëºÎºÐÀÇ ¹®¼­ ºÐÇÒ ½Ã½ºÅÛµéÀº ±¤ÆÄÀÏ ½Ã½ºÅÛ°ú ¹®ÀÚÀÎ½Ä ¼ÒÇÁÆ®¿þ¾î ÆÐÅ°Áöµé¿¡ Àû¿ëÇϱâ À§ÇÑ ¹®¼­ ¿µ»óÀÇ ½Ã°¢Àû °³¼±°ú Àüó¸® ¸ñÀûÀ¸·Î °³¹ßµÇ¾ú´Âµ¥, Á¦¾ÈÇÏ´Â ½Ã½ºÅÛÀº ÁÖÁ¦¾î °Ë»öÀ» ±â¹ÝÀ¸·Î ÇÏ´Â ´ë¿ë·® ¹®¼­ ¿µ»ó °Ë»ö ½Ã½ºÅÛ¿¡ È°¿ëÇÒ ¼ö ÀÖ´Â ¿µ»ó ó¸® ±â¹ýµé·Î ±¸¼ºÇÑ´Ù. Á¦¾ÈÇÑ ½Ã½ºÅÛÀº ¿µ»ó Àüó¸®, ¹®¼­ ±¸Á¶ ºÐ¼®, ´Ü¾î ¿µ»ó ºÐÇÒ, ´Ü¾î ¿µ»ó ¼Ó¼º ÃßÃâÀÇ ³× °¡Áö ¸ðµâ·Î ±¸¼ºµÈ´Ù. ¸ÕÀú, ¿µ»ó Àüó¸® ¸ðµâ¿¡¼­ ¹®¼­¸¦ ½ºÄ³´× ÇÒ ¶§ ÈçÈ÷ ¹ß»ýÇÏ´Â ¿µ»óÀÇ ±â¿ï¾îÁüÀ» ÇØ°áÇÑ´Ù. ¹®¼­ ±¸Á¶ ºÐ¼® ¸ðµâ¿¡¼­´Â ¹®¼­ÀÇ ±âÇÏÇÐÀûÀÎ ±¸Á¶¸¦ ºÐ¼®ÇÏ¿© ±â¿ï¾îÁü ±³Á¤µÈ ¿µ»óÀ» ¿µ¿ªµé·Î ºÐÇÒÇÏ°í, ÅؽºÆ® ¶Ç´Â ºñÅؽºÆ®(non-text) ¿µ¿ªÀ¸·Î ºÐ·ùÇÑ´Ù. ´Ü¾î ¿µ»ó ºÐÇÒ ¸ðµâÀº °¢ ÅؽºÆ® ¿µ¿ªÀ» ´Ü¾î ´ÜÀ§·Î ºÐÇÒÇÑ´Ù. ´Ü¾î ¿µ»ó ¼Ó¼º ÃßÃâ¿¡¼­´Â ºÐÇÒµÈ ´Ü¾î ¿µ»óµéÀÌ °¡Áö´Â ¾ð¾îÀÇ Á¾·ù, ½ºÅ¸ÀÏ, ¹®ÀÚ Å©±â, ¹®ÀÚ °³¼ö, ¼­Ã¼ µîÀÇ ¼Ó¼ºµéÀ» ÃßÃâÇÑ´Ù. ½Ã½ºÅÛÀ» ±¸¼ºÇÏ´Â ¿µ»ó ó¸® ±â¹ýµéÀº ±âÁ¸ÀÇ ¹®¼­ ¿µ»ó ó¸® ±â¹ýµé¿¡ ºñÇØ Á¤È®µµ¿Í ó¸® ¼Óµµ¸¦ °³¼±Çϵµ·Ï ¼³°èµÇ¾ú´Ù. ¹®¼­ ¿µ»óÀÇ ±â¿ï¾îÁü ÃßÁ¤ ¹× ±³Á¤ ¹æ¹ýÀº °³º°ÀûÀÎ È­¼Ò Á¤º¸¸¦ »ç¿ëÇÏÁö ¾Ê°í, ¿¬°áµÈ È­¼ÒµéÀÇ »ç°¢Çü ¿µ¿ªÀÎ ºí·Ï Á¤º¸¸¦ »ç¿ëÇÑ´Ù. °³·«Àû(coarse) ÃßÁ¤°ú »ó¼¼(refined) ÃßÁ¤ÀÇ 2´Ü°è Àü·«À» »ç¿ëÇÏ´Â ÇãÇÁ º¯È¯(Hough transform)À» ±â¿ï¾îÁü ÃßÁ¤¿¡ Àû¿ëÇÏ°í, ºí·Ï ´ÜÀ§ÀÇ È¸Àü º¯È¯À» ±³Á¤ ´Ü°è¿¡¼­ ¼öÇàÇÑ´Ù. ±×¸®°í ±âÁ¸ ¿¬±¸ Áß¿¡¼­ Àß ¾Ë·ÁÁø ¹æ¹ýµé°ú Á¤·®ÀûÀÎ ¼º´É ºñ±³¸¦ ¼öÇàÇÏ¿© Á¦¾È ¹æ¹ýÀÇ ¿ì¼ö¼ºÀ» ÀÔÁõÇÏ¿´´Ù. ¹®¼­ ±¸Á¶ ºÐ¼® ¹æ¹ýÀº ¿¬°á¿ä¼Ò ºÐ¼®°ú Åõ¿µ ÇÁ·ÎÆÄÀÏ ¹æ¹ýÀ» °áÇÕÇÏ¿© »ç¿ëÇÏ¿´´Ù. ºÐÇÒ¿¡ µû¸¥ ó¸® ½Ã°£À» ÁÙÀ̱â À§ÇØ ´Ù¾çÇÑ Çػ󵵸¦ °¡Áö´Â ´Ù´Ü°è ¿µ»óÀ» »ý¼ºÇÏ¿©, °³·«Àû ¿µ¿ª ºÐÇÒ¿¡´Â ÀúÇØ»óµµ ¿µ»óÀ» »ç¿ëÇÏ°í »ó¼¼ ¿µ¿ª ºÐÇÒ¿¡´Â °íÇØ»óµµ ¿µ»óÀ» »ç¿ëÇÏ¿´´Ù. ´Ü¾î ¿µ»ó ºÐÇÒ¿¡¼­´Â ¼öÆò Åõ¿µ ÇÁ·ÎÆÄÀÏÀ» ÀÌ¿ëÇÏ¿© ÅؽºÆ® ¿µ¿ªÀ» ÅؽºÆ® ¶óÀÎÀ¸·Î ºÐ¸®ÇÏ°í, ¿¬°á¿ä¼Ò ºÐ¼®À» ¼öÇàÇÏ¿© ÅؽºÆ® ¶óÀÎÀ» ´Ü¾î ´ÜÀ§·Î ºÐÇÒÇÏ¿´´Ù. ¶ÇÇÑ, Ư¼ö±âÈ£¸¦ °ËÃâÇÏ¿© ´Ü¾î ºÐ¸®ÀÇ Á¤È®µµ¸¦ °³¼±ÇÏ¿´´Ù. ´Ü¾î ¿µ»ó ¼Ó¼º ÃßÃâ¿¡¼­´Â ´Ù¼¸ °¡Áö ¼Ó¼ºÀÌ Á¶ÇÕµÈ 264 Ŭ·¡½º¸¦ °í·ÁÇÏ¿´°í, ´ÙÃþ ÆÛ¼ÁÆ®·Ð, 2Â÷Çü ÆǺ°ÇÔ¼ö, ¼±Çü ÆǺ°ÇÔ¼ö¸¦ ÀÌ¿ëÇÑ °èÃþÀû ºÐ·ù±â ¸ðµ¨À» ±¸ÃàÇÏ¿´´Ù. ¼Ó¼º ºÐ·ù¸¦ À§ÇÑ Æ¯Â¡Àº ÇÑ±Û ´Ü¾î ¿µ»óÀÇ °æ¿ì 8°¡Áö, ¿µ¹® ´Ü¾î ¿µ»óÀÇ °æ¿ì 9°¡Áö¸¦ ÃßÃâÇÏ¿´´Ù. Á¦¾È ¾Ë°í¸®ÁòµéÀÇ ¼º´É Æò°¡¸¦ À§ÇØ ´Ù¾çÇÑ ¹®¼­ ¿µ»ó°ú ´Ü¾î ¿µ»óÀ» »ç¿ëÇÏ¿´´Ù. ¿µ»ó Àüó¸®¿Í ¹®¼­ ±¸Á¶ ºÐ¼®¿¡¼­ »ç¿ëµÇ´Â ¹®¼­ ¿µ»óÀº 300dpi·Î ½ºÄ³´×ÇÏ¿´°í, 2,016°³¿Í 238°³ ¿µ»óÀ¸·Î °¢°¢ ±¸¼ºµÇ¾î ÀÖ´Ù. ´Ü¾î ¿µ»ó ºÐÇÒ¿¡¼­´Â ¹®¼­ ¿µ»óÀ¸·ÎºÎÅÍ ÃßÃâÇÑ 50°³ ÅؽºÆ® ºí·ÏµéÀ» »ç¿ëÇÏ¿´´Ù. ´Ü¾î ¿µ»ó ¼Ó¼º ÃßÃâ¿¡¼­´Â ´Ù¼¸ °¡Áö ¼Ó¼ºÀÌ Á¶ÇÕµÈ 26,400°³ ´Ü¾î ¿µ»óÀ» »ç¿ëÇÏ¿© ½ÇÇèÀ» ¼öÇàÇÏ¿´´Ù. Á¦¾È ½Ã½ºÅÛÀº ¹®¼­ ¿µ»óÀÇ ´Ü¾î ´ÜÀ§ ºÐÇÒ¿¡ ´ëÇÑ ½ÇÁ¦ÀûÀÎ ¿¬±¸ÀÇ °á°ú·Î¼­, ´Ü¾î ¿µ»óÀÇ ¼Ó¼º Á¤º¸´Â ¹®¼­ ÀÎ½Ä ¹× °Ë»ö ´Ü°èÀÇ º¹Àâµµ¸¦ Àý°¨ÇÒ ¼ö ÀÖ°í OCR ¼º´ÉÀ» °³¼±ÇÒ ¼ö ÀÖ´Ù. µû¶ó¼­ Á¦¾È ½Ã½ºÅÛ°ú ´Ü¾î ÀÎ½Ä ½Ã½ºÅÛ°úÀÇ °áÇÕÀº °í¼º´É, °í¼ÓÀÇ È¿°ú¸¦ ³¾ ¼ö ÀÖ´Ù. ±×·¯¹Ç·Î »ç¿ëÀÚ°¡ ÁöÁ¤ÇÑ ÁÖÁ¦¾î¸¦ Æ÷ÇÔÇÏ´Â ¹®¼­ ¿µ»óÀ» ´ë¿ë·® µ¥ÀÌÅͺ£À̽º¿¡¼­ ã¾Æ¾ß ÇÏ´Â ÀüÀÚµµ¼­°ü, ±¤ÆÄÀÏ ½Ã½ºÅÛ µîÀÇ ¿µ»ó °Ë»ö ½Ã½ºÅÛ¿¡ º» ¿¬±¸ÀÇ °á°ú°¡ È¿°úÀûÀ¸·Î ÀÀ¿ëµÉ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëÇÑ´Ù.

[±¹³» ÇÐÀ§³í¹®]

±¹¹®¿ä¾à
 
 ³×Æ®¿öÅ© Åë½Å¸ÁÀº ¿©·¯ °¡Áö Á¤º¸¸¦ ÇÊ¿ä·Î ÇÏ´Â ¼ö¸¹Àº »ç¶÷µé¿¡°Ô º¸´Ù ºü¸£°í Æí¸®ÇÏ°Ô Á¤º¸¸¦ Á¦°øÇØ ÁØ´Ù. ±×·¯³ª °¢Á¾ Á¤º¸ÀÇ ¹ü¶÷À¸·Î ÀÎÇÑ ÀÌ¿ëÀÚµéÀÇ È¥¶õ°ú, ¼ö¸¹Àº ³í¹®À̳ª ¼­Àû µîÀÌ º¸°üµÇ¾î ÀÖ´Â µµ¼­°üÀÌ ½Ã°£Àû °ø°£Àû Á¦¾à¼ºÀ¸·Î ÀÎÇÑ »ç¿ëÀÚÀÇ ºÒÆíÇÔ ¹× Á¤º¸°Ë»ö ½Ã½ºÅÛÀÇ ºó¾à¼º°ú ÇѰ輺À¸·Î ÀÎÇØ Çö ½ÃÁ¡¿¡¼­ÀÇ Á¤º¸ °ü¸® ½Ã½ºÅÛ ¹× ¹®¼­ °ü¸® ½Ã½ºÅÛÀÇ ´ë´ëÀûÀÎ º¸¼ö¿Í »õ·Î¿î ½Ã½ºÅÛÀÌ ÇÊ¿äÇÏ°Ô µÇ¾ú´Ù. ¶ÇÇÑ ÀÌ·¯ÇÑ ½Ã½ºÅÛÀ» ¸¸µé±â ÀÌÇؼ­´Â ½Ã°£, ÀηÂ, ÀÚ±ÝÀÌ ÇÊ¿äÇÏ°Ô µÇ¾ú´Ù.
 º» ³í¹®¿¡¼­´Â ÀÌ·± ¹®Á¦Á¡µéÀ» ÃÖ¼ÒÈ­ ÇÏ°í µðÁöÅÐ µµ¼­°ü ¹®¼­°ü¸® ½Ã½ºÅÛ ±¸ÃàÀ» ÀÚµ¿È­ ÇÏ´Â Ãø¸é¿¡¼­, µµ¼­°ü¿¡ ÀÖ´Â ¼­Áö¹®¼­µéÀ» ½ºÄË ÈÄ ÅؽºÆ® ¹®¼­¿Í ±×¸² ºÎºÐÀ» ºÐ¸® ÃàÃâÇÑ °æ¿ì, HTML ¹®¼­·Î ÀÚµ¿ º¯È¯ÇÏ°í ÀÚµ¿ ¸µÅ©½ÃÅ°´Â ÀÛ¾÷À» ¼öÇàÇÏ°í, CGIÀÇ °³³äÀ» »ç¿ëÇÏ¿© »ç¿ëÀÚ¿¡°Ô º¸´Ù Áú³ôÀº ¼­ºñ½º¸¦ Á¦°ø¹ÞÀ» ¼ö ÀÖ´Â µµ±¸¸¦ ¼³°èÇÏ°í ±¸ÇöÇÏ¿´´Ù.

[±¹³»³í¹®]

In 2002, Korean Code of Civil Procedure(hereinafter, ¡°KCCP¡±) s. 344 was amended (¥¡) to exclude ¡°the documents possessed by public entity, including Nation, local authority, and even public enterprise(hereinafter, ¡°Government Documents¡±)¡± from the general duty of producing evidentiary documents, and (¥¢) to leave it to complete discretion of public entity on whether to produce ¡°documents containing official secrets(hereinafter, ¡°Government Secret Documents¡±)¡±. As a result, the likelihood of documentary discovery from the public entity is almost denied in Korea.This legislative attitude was intended to harmonize KCCP and Korean Freedom of Information Act(hereinafter, ¡°KFOIA¡±). However it is harshly criticized as a more excessive legislation than is needed to achieve legislative intent.In England, who keeps the documents is not a factor to determine the scope of documentary disclosure. What matters is the balancing of the public interest in the administration of justice and the public interest in maintaining the confidentiality of certain documents which may include governmental secrets. Furthermore, in 2001, Japanese Code of Civil Procedure(hereinafter, ¡°JCCP¡±), which was very similar to KCCP, was amended to eliminate general exclusion of Government Documents, and add special procedure to hear the discoverability of Government Secret Documents.The legislations of both countries show us how to improve documentary discovery scheme in Korea. What is important is the contents of the documents rather than who is possessing them.Hence I suggest that the exception under KCCP 344 ¨è should be eliminated to create general duty to produce Government Documents. And I also suggest that the determination of discoverability of certain Government Secret Documents should not be on the discretion of the public entity holding them but on the Judiciary.

[±¹³» ÇÐÀ§³í¹®]

¹®¼­ ³»ºÎ¿¡ ¾Ç¼ºÄڵ尡 Àº´ÐµÇ¾î »ç¿ëÀÚÀÇ PC¸¦ °ø°ÝÇÏ´Â ¹®¼­Çü ¾Ç¼ºÄÚµå´Â 2015³âÀ» ±âÁ¡À¸·Î ·£¼¶¿þ¾îÀÇ °ø°Ý±â¹ýÀ¸·Î »ç¿ëµÇ´Â µî »õ·Î¿î °ø°Ý±â¹ýÀÇ µîÀå°ú ÇÔ²² Áõ°¡ÇÏ´Â Ãß¼¼ÀÌ´Ù. ÀÌ·¯ÇÑ ¹®¼­Çü ¾Ç¼ºÄÚµå´Â ÇÇÇØÀÚ°¡ ¹®¼­ ¿­¶÷ ½Ã ÇØ´ç ¹®¼­ ÆíÁý ÇÁ·Î±×·¥ÀÇ ¸ÅÅ©·Î µîÀÇ Æ¯Á¤ ±â´ÉÀ» ÀÌ¿ëÇÏ¿© ¹®¼­³»ºÎ¿¡ »ðÀÔµÈ ¾Ç¼ºÄڵ带 ½ÇÇà½ÃÄÑ ¾Ç¼ºÇàÀ§¸¦ ¼öÇàÇÏ´Â ±¸Á¶¸¦ Áö´Ï°í ÀÖ´Ù. º» ³í¹®¿¡¼­´Â ¹®¼­³»ºÎ¿¡ »ðÀÔµÈ ¾Ç¼ºÄڵ尡 ½ÇÇàµÇ¾î ¹ß»ýÇÏ´Â ÇÇÇظ¦ ¹æÁöÇϱâ À§ÇØ ¹®¼­Çü ¾Ç¼ºÄÚµå ÇÇÇØ ¹æÁö¸¦ À§ÇÑ ¹®¼­ °Ý¸® ½Ã½ºÅÛ(Doc-Sandbox)À» Á¦½ÃÇÑ´Ù. Doc-Sandbox´Â °¡»óÈ­ ±â¼úÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÈ »ç¿ëÀÚÀÇ È£½ºÆ®OS¿¡¼­ °Ý¸®µÈ °¡»óÈ­ ȯ°æÀ» ÅëÇØ ¹®¼­¸¦ ½ÇÇàÇÏ¿© ¹®¼­ ³»ºÎÀÇ ¾Ç¼ºÄڵ忡 ÀÇÇÑ ¾Ç¼ºÇàÀ§·ÎºÎÅÍ »ç¿ëÀÚÀÇ PC¸¦ º¸È£ÇÔ°ú µ¿½Ã¿¡ VNC ±â¼úÀ» »ç¿ëÇÏ¿© ¹®¼­ »ç¿ëÀÚ´Â ±âÁ¸ ¹®¼­ ½ÇÇà¹æ½Ä°ú µ¿ÀÏÇÑ ÆíÁýȯ°æÀ» Á¦°ø¹ÞÀ» ¼ö ÀÖ´Ù. ¶ÇÇÑ ÀÏ¹Ý ¹®¼­ ½ÇÇà ´ëºñ ³ôÀº Áö¿¬½Ã°£À» ³ªÅ¸³»´Â °¡»óȯ°æ ³»ºÎ¿¡¼­ÀÇ ¹®¼­½ÇÇà ¿À¹öÇìµå¸¦ ±Øº¹Çϱâ À§ÇØ ¹®¼­ÀÇ °øÀ¯ ¹× °¡»óÈ­ ȯ°æ ³»ºÎ¿¡ In-Memory ¹æ½ÄÀÇ µð½ºÅ©¸¦ ÇÒ´çÇÏ¿´À¸¸ç, ÀÌ´Â °¡»óÈ­ ȯ°æÀ» ±¸µ¿ÇÏ¿© ¹®¼­¸¦ °Ý¸®ÇÏ¿© ½ÇÇàÇÏ´Â ¹æ½Äº¸´Ù Áö¿¬½Ã°£ ´ëºñ 386¹è ºü¸¥ ¼Óµµ¸¦ ³ªÅ¸³»¾ú´Ù. ÀÌ·Î½á »ç¿ëÀÚ´Â °¡»óÈ­ ȯ°æ¿¡¼­ ¹ß»ýÇÏ´Â ¿À¹öÇìµåÀÇ ¿µÇâÀ» ÃÖ¼ÒÈ­ÇÏ¿© È¿À²ÀûÀÌ°í ¾ÈÀüÇÑ ¹®¼­ ÆíÁýȯ°æÀ» »ç¿ëÇÒ ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ Doc-Sandbox´Â ¹®¼­ ³» Æ÷ÇÔµÈ ¾Ç¼ºÄڵ带 ±Ùº»ÀûÀ¸·Î Â÷´ÜÇÔÀ¸·Î½á ¾Ç¼ºÄڵ忡¼­ ¹ß»ýµÇ´Â Á¤º¸ À¯Ãâ ¹× ¹ÙÀÌ·¯½º °¨¿° µîÀÇ ¹æÁö ±â´ÉÀ» ¼öÇàÇÒ ¼ö ÀÖ´Ù.

[±¹³» ÇÐÀ§³í¹®]

ÀÎÅÍ³Ý º¸±Þ¿¡ µû¶ó ¾Ç¼ºÄÚµåÀÇ À¯Æ÷°æ·Î°¡ ´Ù¾çÇØÁö°í ÀÖÀ¸¸ç, ÀÌ·Î ÀÎÇÑ °¨¿°»ç·Êµµ ¸Å³â Áõ°¡ÇÏ°í ÀÖ´Ù. ÃÖ±Ù ÇѼö¿ø »çÅ·ΠÀÎÇØ APT°ø°ÝÀÌ À̽´°¡ µÇ¾ú°í, APT °ø°Ý±â¹ý¿¡ ´ëÇØ ¿¬±¸°¡ ÀÌ·ç¾îÁö°í ÀÖ´Ù. 
 À̸ÞÀÏ·Î À¯Æ÷ÇÏ´Â ¾Ç¼ºÄÚµåÀÇ °æ¿ì ¹®¼­Çü ¾Ç¼ºÄڵ尡 ¸¹À¸¸ç, ÁÖ·Î PDF ÆÄÀÏÀ̳ª MS¿öµå ÆÄÀÏ, HWP¹®¼­ ÆÄÀÏ µîÀÇ Ãë¾àÁ¡À» ÀÌ¿ëÇÑ ¾Ç¼ºÄÚµå À¯Æ÷°¡ ´ëºÎºÐÀÌ´Ù.
 º» ³í¹®¿¡¼­´Â ¹®¼­Çü ¾Ç¼ºÄڵ尡 ½ÇÇàµÇ¸é ¾Ç¼ºÄڵ带 ¼³Ä¡ÇÏ°í ½ÇÇàÇÏ´Â ¹æ¹ýÀ» »ç¿ëÇÏ´Â °ÍÀ» Âø¾ÈÇÏ¿©, ¾Ç¼ºÄڵ尡 ¼³Ä¡µÇ°í ½ÇÇàµÉ ¶§ ŽÁö ¹× Â÷´ÜÇÏ´Â ¹æ¹ýÀ» Á¦½ÃÇÏ°íÀÚ ÇÑ´Ù.

[±¹³» ÇÐÀ§³í¹®]

ÀüÀÚ¹®¼­´Â °è¾à¼­, °íÁö¼­ µî ¹ýÀûÈ¿·ÂÀÌ ¿ä±¸µÇ´Â ºÎºÐº¸´Ù´Â Á¤º¸Àü´Þ ¼ö´Ü¿¡ ¸¹ÀÌ È°¿ëµÇ¾î ¿Ô´Ù. °è¾à¼­, °íÁö¼­ µî Áß¿äÇÑ ¹®¼­ÀÇ À¯ÅëÀº Á¾À̹®¼­ ¶Ç´Â º¸¾ÈÀÌ °­È­µÈ ƯÁ¤ ½Ã½ºÅÛ¿¡¼­¸¸ Àû¿ëµÇ°í ÀÖ´Ù. ÀüÀÚ¹®¼­¸¦ º¸¾ÈÀÌ °­È­µÈ EDI¿Í °°Àº Àü¿ë ½Ã½ºÅÛÀ» ÀÌ¿ëÇÒ °æ¿ì °úµµÇÑ ºñ¿ë°ú ³ë·ÂÀÌ ÇÊ¿äÇÏ°Ô µÇ¸ç ³»ºÎ ½Ã½ºÅÛ°ú ¿ÜºÎ ½Ã½ºÅÛ ¿¬°è°¡ ÇÊ¿ä½Ã º¸¾È ¹æ¾ÈÀ» °­±¸ÇؾßÇÏ´Â µî ȸ»çÀÇ ºÎ´ãÀ» ÁÖ°Ô µÇ¸ç ±â¾÷ÀÇ È¯°æÀÌ Æ¯Á¤ ¿ÜºÎ ½Ã½ºÅÛ°ú ¿¬°è µÇ¸é¼­ ³»ºÎ ½Ã½ºÅÛÀÇ È®Á¤¼º, ȣȯ¼º¿¡ ¿µÇâÀ» ÁÖ°Ô µÈ´Ù. ±¹³» ÀüÀÚ¹®¼­ ÀÌ¿ë½ÇÅ Á¶»ç¿¡ ÀÇÇÏ¸é °ø±ÞÀÚ¿Í ¼ö¿äÀÚ ¸ðµÎ ½Å·ÚÇÒ ¼ö ÀÖ´Â ¹æ¾ÈÀ» ÇÊ¿ä·Î ÇÏ°í ÀÖÀ¸¸ç ƯÈ÷ °ø±ÞÀÚÀÇ °æ¿ì ½Å·ÚÇÒ ¼ö ÀÖ´Â ÀüÀÚ¹®¼­ À¯Åë ÀÎÇÁ¶ó ±¸ÃàÀÇ Çʿ伺ÀÌ ´ëµÎµÇ°í ÀÖ´Ù. ¼ö¿äÀÚÀÇ °æ¿ì´Â ÀüÀÚ¹®¼­½Ã½ºÅÛ µµÀÔÀ» À§ÇÑ ÀÚ¿ø Áö¿øÀÇ Çʿ伺À» ÃÖ¿ì¼±À¸·Î ÇÏ°í ÀÖ¾î ÀüÀÚ¹®¼­ ȯ°æ ¸¶·ÃÀ» À§Çؼ­´Â ºñ¿ëºÎºÐµµ Áß¿äÇÑ ¿ä¼ÒÀÓÀ» ¾Ë ¼ö ÀÖ´Ù. µû¶ó¼­ ÀüÀÚ¹®¼­ÀÇ ¼Û¼ö½ÅÀÇ ½Å·Ú¼ºÀ» º¸ÀåÇÏ°í ÀÀ¿ëÇÁ·Î±×·¥ÀÇ È®À强°ú ȣȯ¼ºÀ» º¸ÀåÇÏ´Â ¹æ¾ÈÀ» °­±¸ÇÏ´Â °ÍÀÌ ÇÊ¿äÇÏ´Ù. º» ¿¬±¸¿¡¼­´Â ±¹¿Ü ±â¼ú µ¿ÇâÀ» ÅëÇÏ¿© ½Å·Ú ¹æ¾ÈÀ» ºñ±³ÇÏ¿´À¸¸ç ½Å·Ú¹æ¹ýÀ¸·Î Á÷Á¢ÀÎÁõ°ú Á¦3ÀÚ ÀÎÁõ¹æ½ÄÀ» ºñ±³ÇÏ¿´´Ù. ƯÈ÷ ´Ù¾çÇÑ ±¹°¡°¡ ½Å·Ú ¹æ½ÄÀ» ¸¶·ÃÇÏ°í µµÀÔÇÏ´Â »ç·Ê¸¦ ÅëÇÏ¿© ±¹¿Ü¿¡¼­µµ ½Å·Ú¹ÞÀ» ¼ö ÀÖ´Â Àü¼Û ¹æ¾ÈÀÌ ÇÊ¿äÇÔÀ» È®ÀÎÇÒ ¼ö ÀÖ¾ú´Ù. ÀüÀÚ¹®¼­ÀÇ °³¹æ¼ºÀ» À§Çؼ­ XMLÀ» ±â¹ÝÀ¸·Î ÇÏ´Â SOAPÀÇ È°¿ëÀ» ¼±ÅÃÇÏ¿´À¸¸ç ¹®¼­ÀÇ ÀÚüÀÇ ½Å·Ú¼º È®º¸¸¦ À§ÇÑ ÀüÀÚ¼­¸í°ú ¼Û¼ö½ÅÀÇ Àü¼Û±¸°£ÀÇ ½Å·Ú¼ºÀ» °­È­ÇÑ ebMSÀÇ ÇÁ·ÎÅäÄÝÀ» È°¿ëÇÏ°Ô ÇÏ¿´´Ù. ÀüÀÚ¹®¼­ÀÇ ¼Û¼ö½ÅÀ» À§ÇÑ ÀüÀÚ¹®¼­ À¯Åë ¼­ºñ½º Ç÷§Æû ¼³°è¸¦ ÅëÇÏ¿© ½Å·Ú¼ºÀ» È®º¸ÇÏ¿´´Ù. »ç¿ëÀÚÀÇ »ç¿ëÆí¸®¼ºÀ» °í·ÁÇÏ¿© µð·ºÅ͸® ¼­¹öÀÇ ±¸ÃàÀ» ÇÏ¿´À¸¸ç ÃÖÁ¾ ¸ñÀûÁö¸¦ ½±°Ô ãÀ» ¼ö ÀÖµµ·Ï ÇÏ¿´´Ù. µð·ºÅ͸®¼­¹öÀÇ °æ¿ì ¼ö½ÅÀÚÀÇ ¹°¸®Àû À§Ä¡¸¦ °Ë»öÇÒ ¼ö ÀÖ´Â ÀúÀå¼Ò·Î½á ½Å·ÚÇÒ ¼ö ÀÖ´Â Á¤º¸¸¦ ȹµæÇÒ ¼ö ÀÖµµ·Ï ÀüÀÚ¼­¸íÀ» ÅëÇÏ¿© ÁÖ¼ÒÁ¤º¸°¡ À¯ÅëÀÌ µÇµµ·Ï ±¸ÇöÀ» ÇÏ¿´´Ù. Àü¼ÛµÈ ¹®¼­ÀÇ Á¦3ÀÚ ÀÎÁõÀ» À§ÇÑ signedData ±¸Á¶ÀÇ È®Àμ­ À¯ÅëÀ» ÅëÇÏ¿© ±¸ÇöÀÌ µÇ¾ú´Ù. ÁÖ¼Ò µî·Ï Á¶È¸À» ¼öÇàÇÏ´Â ÁÖ¼Ò µð·ºÅ͸® ½Ã½ºÅÛÀº ºÎÇÏ Å×½ºÆ®¸¦ ÅëÇÏ¿© ÀüÀÚ¹®¼­ À¯Åë¿¡ ÀÖ¾î ´ë±Ô¸ð ¼­ºñ½º È°¿ë¿¡ ´ëÇÑ °¡´É¿©ºÎ¸¦ ½ÇÁõÇÏ¿´À¸¸ç °³¼± »çÇ׿¡ ´ëÇؼ­µµ µµÃâÇÏ¿´´Ù. º» ¿¬±¸´Â ±â¾÷°ú °³ÀÎÀÌ ½Å·Ú¹Þ´Â ÀüÀÚÁÖ¼Ò¿Í À¯ÅëÁõ¸í¼­¸¦ ±â¹ÝÀ¸·Î Á¦3ÀÚ°¡ Áõ¸íÀ» ÅëÇÏ¿© ÀüÀÚ¹®¼­ À¯ÅëÀÌ °¡´ÉÇÑ ½Ã½ºÅÛ ±¸ÇöÀÌ ¸ñÇ¥ÀÌ´Ù. ±¸ÇöÇÑ À¯Åë ½Ã½ºÅÛÀº ´ë±Ô¸ð ¼­ºñ½º°¡ °¡´ÉÇÏ¸ç ±â¾÷, ±â°ü, °³ÀÎÀÌ ´Ü¼ø Á¤º¸Àü´Þ ÀÌ»óÀÇ ¸ñÀûÀ¸·Î ±âÁ¸¿¡ È°¿ëÇÏÁö ¸øÇÑ ¿µ¿ª¿¡¼­±îÁö È®ÀåµÈ ÀüÀÚ¹®¼­ À¯ÅëÀÌ ÀÌ·ç¾îÁüÀ¸·Î½á °æÁ¦Àû ºñ¿ëÀÌ Àý°¨µÇ°í °³º°¾÷¹«ÀÇ È¿À²ÀÌ Áõ´ëµÇ¾î ±â¾÷°ú °ø°ø±â°ü¿¡¼­ »ý»ê¼ºÀÌ Çâ»óµÇ´Â ±â´ëÈ¿°ú¸¦ ¿¹»óÇÑ´Ù.

[±¹³» ÇÐÀ§³í¹®]

K-Means Clustering algorithm is a very popular clustering technique, which is used in the field of information retrieval. In this thesis, we analyze a performance of document clustering using K-Means algorithm by coefficient similarity. K-Means algorithm by coefficient smilarity is used Cosine coefficient, Dice coefficient, and Jaccard coefficient besides euclidean distant coefficient when it selects the new centroids from the initial centroids in precedure of K-Means algorithm. For experiment, we make use of the 200 most frequently appeared documents from the Reuter21578 newswire test collection and 200 documents from the Korean daily newspapers for Korean data. The input data for Clustering Module composed of number of document and number of terms, TF(term frequency), DF(doucument frequency). To verify the performance of the proposed K-Means Algorithm, we compare algorithms on the view point of precision and recall, and the F-measure of Information Retrieval. In addition, we define a new metrics 'average precision' and 'average recall' for the overall clustering results. The experimental results show that K-Means algorithm's average precisions and average recall are better than those of K-Means Algorithm by euclidean distant when it is used K-Means algorithm by Cosine coefficient and Dice coefficient, Jaccard coefficient, and we find that speed of Clustering is faster than before.

[±¹³» ÇÐÀ§³í¹®]

ºñÆ®ÄÚÀÎÀ» ºñ·ÔÇÑ °¡»óÈ­Æó°¡ µîÀåÇϸ鼭 ±× ±â¹Ý±â¼úÀÎ ºí·ÏüÀο¡ ´ëÇÑ ´Ù¾çÇÑ ¿¬±¸°¡ ÁøÇàµÇ°í ÀÖÀ¸¸ç, À̸¦ »ê¾÷Àü¹Ý¿¡ ÀÌ¿ëÇÏ°íÀÚ ÇÏ´Â ¿òÁ÷ÀÓÀÌ ÀÏ°íÀÖ´Ù. °Ô´Ù°¡ ºí·ÏüÀÎÀº Áö±Ý±îÁöÀÇ Áß¾ÓÈ­µÈ Á¤º¸È­»çȸ¿¡ Ä¿´Ù¶õ º¯È­¸¦ °¡Á®¿Ã °ÍÀ̸ç, ÃÊ¿¬°á»çȸ·Î º¯È­ÇÏ°í ÀÖ´Â ½Ã´ë¿¡ »õ·Î¿î ´ë¾ÈÀ» Á¦°øÇÒ °ÍÀ̶ó°í Æò°¡¹Þ°í ÀÖÀ¸¸ç, °ú°Å NetscapeÀÇ °øµ¿ ¼³¸³ÀÚ¿´´ø Marc AndreessenÀº ¡°1975³âÀº °³Àοë ÄÄÇ»ÅÍ, 1993³âÀº ÀÎÅͳÝÀÇ ÇØ¿´´Ù¸é, 2014³âÀº ºñÆ®ÄÚÀÎÀÌ´Ù.¡±¶ó¸ç ºñÆ®ÄÚÀΰú ºí·ÏüÀÎ ±â¼ú¿¡ ´ëÇØ ±ØÂùÇÏ¿´°í, Don TapscottÀº ¡°ºí·ÏüÀÎÀÌ ÇâÈÄ ¼¼°è °æÁ¦ÀÇ º¯ÇõÀ» ÁÖµµÇÒ ÃæºÐÇÑ ÀáÀç·ÂÀ» º¸À¯ÇÏ°í ÀÖ´Ù.¡±°í ÁÖÀåÇÑ´Ù.
 ¿À´Ã³¯ÀÇ Á¤º¸½Ã½ºÅÛÀÇ ¸ðµç µ¥ÀÌÅÍ°¡ Áß¾Ó¿¡ ÁýÁߵǾî ÀÖ°í, À̸¦ Á¤º¸Á¦°øÀÚ Áï µ¥ÀÌÅ͸¦ °¡Áö°í ÀÖ´Â ±â°ü¿¡¼­ µ¥ÀÌÅÍÀÇ ½Å·Ú¼ºÀ» º¸ÀåÇÏ´Â ±¸Á¶ÀÌ´Ù. ÀÌ·Î ÀÎÇØ °³ÀÎÀÇ Á¤º¸¸¦ ºñ·ÔÇÏ¿© ±â¾÷, °ø°øÀÇ ¼ö¸¹Àº Á¤º¸µéÀÌ À̸¦ °ü¸®ÇÏ´Â ±â°ü¿¡ ÁýÁߵǾî ÀÖ°í À̸¦ ¾ÈÀüÇÏ°Ô º¸°üÇÏ°í ½Å·ÚÇÒ ¼ö ÀÖ´Â ¼­ºñ½º¸¦ º¸ÀåÇϱâ À§ÇÑ ºñ¿ëÀº °¥¼ö·Ï ´Ã¾î³¯ ¼ö ¹Û¿¡ ¾ø´Ù. 
 ºí·ÏüÀÎÀº ÀÌ·¯ÇÑ ±¸Á¶¿¡ º¯È­¸¦ °¡Á®¿Ã »õ·Î¿î ¹æ¾ÈÀ» Á¦½ÃÇß´Ù. ¹Ù·Î ¡®Á¤º¸ÀÇ ¹ÎÁÖÈ­(Democratization)¡¯ÀÌ´Ù. ±â»óÁ¤º¸, ¼Òµæ°ú ¼¼±Ý, Áö¸®Á¤º¸, º´¿ª°ú Áúº´°ú °°Àº ¼ö¸¹Àº Á¤º¸µéÀÌ ÀÌ¹Ì Á¤º¸ÀÇ ¼öÁý¿ªÇÒÀ» ÇÏ´Â Á¤ºÎ±â°ü°ú ÀϺΠ±â¾÷µéÀÌ ¼ÒÀ¯ÇÏ°í ÀÖ´Ù. ÇÏÁö¸¸ ÀÌ·¯ÇÑ Á¤º¸¸¦ °ø°³ÇÒ °æ¿ì ´õ Å« °æÁ¦Àû âÃâÈ¿°ú¸¦ °¡Á®¿Ã °ÍÀ̶ó´Â ¿¬±¸ ¹× »ç·ÊµéÀ» ÁÖº¯¿¡¼­ ÈçÈ÷ º¼ ¼ö ÀÖ´Ù. °Ô´Ù°¡ ÃÖ±Ù¿¡´Â ¿ì¹ö¿Í ¿¡¾îºñ¾Øºñ¿Í °°ÀÌ °øÀ¯°æÁ¦·Î »õ·Î¿î ºñÁî´Ï½º ¸ðµ¨À» ¼±µµÇß´ø ±â¾÷µéÁ¶Â÷ Á¡Â÷ ±âÁ¸ÀÇ ±â¾÷Çü ÀÓ´ë¼­ºñ½º¿Í °°ÀÌ »ç¾÷¸ðµ¨ÀÌ º¯ÁúµÇ¸é¼­, ºí·ÏüÀÎÀ» ÅëÇÏ¿© ¼­ºñ½ºÀÇ º»ÁúÀ» µÇã°íÀÚ ÇÏ´Â ¹Ù¶÷µµ ÀÏ°íÀÖ´Ù.
 ÀÌó·³ ºí·ÏüÀÎÀº ±âÁ¸ÀÇ ¼­ºñ½º¿¡ °Å¼¾ µµÀüÀ» ÇÒ °ÍÀÓ¿¡´Â ºÐ¸íÇÏ´Ù. ÇÏÁö¸¸ ¼­ºñ½º¸¦ Á¦°øÇÏ´Â ¹æ½ÄÀÌ ´Þ¶óÁö´Â ¹®Á¦ÀÌ¸ç µ¥ÀÌÅͶó´Â ÄÁÅÙÃ÷°¡ ´Þ¶óÁö´Â °ÍÀº ¾Æ´Ï´Ù.
 µ¥ÀÌÅÍ´Â ¼ö¸¹Àº ¼¼¿ùµ¿¾È ´©ÀûµÇ¾î¿Ô°í, ÀÌ´Â ¼­ºñ½º ¹æ½ÄÀÌ ¾î¶»µç ¿Ã¹Ù¸¥ ¹æ½ÄÀ¸·Î ÀçÈ°¿ëµÇ¾î¾ß ÇÔÀº ºÐ¸íÇÏ´Ù. ºí·ÏüÀÎ ±â¼úÀº ±âÁ¸ÀÇ ¼­ºñ½º¸¦ ´ëüÇÒ ¼ö ÀÖ´Â ¸Å·ÂÀûÀÎ ÀåÁ¡À» °¡Áö°í ÀÖ±ä ÇÏÁö¸¸, ¼­ºñ½º¸¦ Á¦°øÇÏ´Â °ü¸®ÁÖüÀÇ ºÎÀç, ÀÛ¾÷Áõ¸íÀÇ ¿À·ù, µ¥ÀÌÅÍÀÇ º¸¾È¼º µîÀÇ ¹®Á¦µéÀ» Æ÷ÇÔÇÑ ½Å·Ú¼º µî¿¡ °üÇÑ ¹®Á¦´Â Áö¼ÓÀûÀ¸·Î Ç®¾î³ª°¡¾ß ÇÏ´Â ¼÷Á¦À̸ç, °ø°ø°ú ±â¾÷ ±×¸®°í âÀÇÀû ¾ÆÀ̵ð¾î·Î ¹«ÀåÇÑ ½ºÅ¸Æ®¾÷µéÀÌ Çù¾÷ÇÏ¿© ÇØ°áÇØ ³ª°¥ ¼ö ÀÖÀ» °ÍÀ¸·Î ÆÇ´ÜÇÑ´Ù.
 º» ¿¬±¸¿¡¼­´Â ÀüÀÚ¹®¼­¸¦ ±â¹ÝÀ¸·Î ÇÏ¿© ±âÁ¸ÀÇ ¼­ºñ½º¸¦ ºí·ÏüÀÎÀ¸·Î ÀüȯÇÒ °æ¿ì °ü¸®ÀÚÀÇ ÀÔÀå¿¡¼­ °í·ÁÇØ¾ß ÇÒ »çÇ׵鿡´Â ¾î¶°ÇÑ °ÍµéÀÌ ÀÖ´ÂÁö °í·ÁÇØ º¸¾Ò°í, ÀÌ¿¡ ´ëÇÑ ÇØ°á¹æ¾ÈÀ» °ËÁõÇØ º¸¾Ò´Ù.

[±¹³» ÇÐÀ§³í¹®]

ÃÖ±Ù ÀÎÅÍ³Ý ±â¼úÀÇ ¹ßÀü°ú ÇÔ²² ½º¸¶Æ® ±â±â°¡ ´ëÁßÈ­µÊ¿¡ µû¶ó ¹æ´ëÇÑ ¾çÀÇ ÅؽºÆ® µ¥ÀÌÅÍ°¡ ½ñ¾ÆÁ® ³ª¿À°í ÀÖÀ¸¸ç, ÀÌ·¯ÇÑ ÅؽºÆ® µ¥ÀÌÅÍ´Â ´º½º, ºí·Î±×, ¼Ò¼È¹Ìµð¾î µî ´Ù¾çÇÑ ¹Ìµð¾î ¸Åü¸¦ ÅëÇØ »ý»ê ¹× À¯ÅëµÇ°í ÀÖ´Ù. ÀÌó·³ ¼Õ½±°Ô ¹æ´ëÇÑ ¾çÀÇ Á¤º¸¸¦ ȹµæÇÒ ¼ö ÀÖ°Ô µÊ¿¡ µû¶ó º¸´Ù È¿À²ÀûÀ¸·Î ¹®¼­¸¦ °ü¸®Çϱâ À§ÇÑ ¹®¼­ ºÐ·ùÀÇ Çʿ伺ÀÌ ±ÞÁõÇÏ¿´´Ù. ÇÏÁö¸¸ È¥ÀçµÈ ¹®¼­¸¦ °ü·Ã Á¤º¸¿¡ µû¶ó ºÐ·ùÇϱâ À§Çؼ­´Â °ü·Ã Àü¹®°¡°¡ ÇÊ¿äÇϸç, ÀÌ´Â ¸¹Àº ½Ã°£°ú ºñ¿ëÀÌ µé±â ¶§¹®¿¡ À̸¦ ÇØ°áÇϱâ À§ÇÑ ÀÚµ¿ ¹®¼­ ºÐ·ù¿¡ ´ëÇÑ ¿¬±¸°¡ ´Ù¾çÇÏ°Ô ÀÌ·ç¾îÁö°í ÀÖ´Ù. ¹®¼­ ºÐ·ù´Â ÅؽºÆ® ¹®¼­¸¦ µÑ ÀÌ»óÀÇ Ä«Å×°í¸® ȤÀº Ŭ·¡½º·Î Á¤ÀÇÇÏ¿© ºÐ·ùÇÏ´Â °ÍÀ» ÀǹÌÇϸç, SVM(Support Vector Machine), K-±ÙÁ¢ ÀÌ¿ô(K-Nearest Neighbor), Àΰø½Å°æ¸Á(Artificial Neural Network), ³ªÀÌºê º£ÀÌÁö¾È ¾Ë°í¸®Áò(Naive Bayes Algorithm), ÀÇ»ç°áÁ¤³ª¹«(Decision Tree) µî ´Ù¾çÇÑ ±â¼úµéÀÌ ¹®¼­ ºÐ·ù¿¡ È°¿ëµÇ°í ÀÖ´Ù. 
 
 ƯÈ÷, ¹®¼­ ºÐ·ù´Â ¹®¸Æ¿¡ »ç¿ëµÈ ´Ü¾î ¹× ¹®¼­ ºÐ·ù¸¦ À§ÇØ ÃßÃâµÈ ÇüÁú¿¡ µû¶ó ºÐ·ù ¸ðµ¨ÀÇ ¼º´ÉÀÌ ´Þ¶óÁú »Ó¸¸ ¾Æ´Ï¶ó, ¹®¼­ ºÐ·ù±â ±¸Ãà¿¡ »ç¿ëµÈ ÇнÀµ¥ÀÌÅÍÀÇ Áú¿¡ µû¶ó ¹®¼­ ºÐ·ùÀÇ ¼º´ÉÀÌ Å©°Ô Á¿ìµÈ´Ù. ÇÏÁö¸¸ Çö½Ç¼¼°è¿¡¼­ »ç¿ëµÇ´Â ´ëºÎºÐÀÇ µ¥ÀÌÅÍ´Â ¸¹Àº ³ëÀÌÁî(Noise)¸¦ Æ÷ÇÔÇÏ°í ÀÖÀ¸¸ç, ÀÌ·¯ÇÑ µ¥ÀÌÅÍÀÇ ÇнÀÀ» ÅëÇØ »ý¼ºµÈ ºÐ·ù ¸ðÇüÀº ³ëÀÌÁîÀÇ Á¤µµ¿¡ µû¶ó Á¤È®µµ Ãø¸éÀÇ ¼º´ÉÀÌ ¿µÇâÀ» ¹Þ°Ô µÈ´Ù. ´ëºÎºÐÀÇ ¹®¼­ ºÐ·ù ¿¬±¸´Â »õ·Î¿î ¾Ë°í¸®ÁòÀ» Á¦¾ÈÇϰųª ±âÁ¸ÀÇ ¾Ë°í¸®ÁòÀ» ¼öÁ¤ÇÏ´Â ¹æ½ÄÀ¸·Î ÀÌ·ç¾îÁö°í ÀÖÀ¸³ª, ÀÌ·¯ÇÑ ¹æ½ÄÀÇ ¿¬±¸´Â ÀÌ¹Ì ´õ ÀÌ»óÀÇ °³¼±Á¡À» ã±â¿¡´Â ÇÑ°èÁ¡¿¡ µµ´ÞÇß´Ù°í º¼ ¼ö ÀÖ´Ù. ÀÌ¿¡ º» ¿¬±¸¿¡¼­´Â »õ·Î¿î ¾Ë°í¸®ÁòÀ» Á¦¾ÈÇϰųª ¾Ë°í¸®ÁòÀ» ¼öÁ¤ÇÏ´Â °Í ¿Ü¿¡ µ¥ÀÌÅÍ »ç¿ë¿¡ ÃÊÁ¡À» ¸ÂÃß¾î ¹®¼­ ºÐ·ùÀÇ ¼º´ÉÀ» Çâ»ó½ÃÅ°´Â ¹æ¾ÈÀ» Á¦¾ÈÇÏ°íÀÚ ÇÑ´Ù. ÀϹÝÀûÀ¸·Î ¹®¼­ ºÐ·ù±â ±¸ÃàÀ» À§ÇÑ ÇнÀ µ¥ÀÌÅÍ ¹× °ËÁõ µ¥ÀÌÅÍÀÇ °æ¿ì, µÎ µ¥ÀÌÅÍÀÇ Æ¯¼ºÀÌ µ¿ÀÏÇϰųª ¸Å¿ì À¯»çÇÑ °ÍÀ¸·Î °¡Á¤ÇÏ¿© ±â°èÇнÀ ¾Ë°í¸®ÁòÀ» Àû¿ëÇÏ°Ô µÈ´Ù. ±×·¯³ª ÅؽºÆ®¿Í °°Àº ±¸Á¶È­µÇÁö ¾ÊÀº ºñÁ¤Çü µ¥ÀÌÅÍÀÇ °æ¿ì, ¹®¼­¿¡ Æ÷ÇÔµÈ ¾îÈÖ¿¡ µû¶ó ±× ÇüÁúÀÌ °áÁ¤µÇ±â ¶§¹®¿¡ ÇнÀ µ¥ÀÌÅÍ¿Í °ËÁõ µ¥ÀÌÅÍÀÇ ½ÃÁ¡ÀÌ ´Ù¸£¸é µÎ µ¥ÀÌÅÍ °£ÀÇ ÇüÁúÀÌ ´Ù¸£°Ô ³ªÅ¸³¯ °¡´É¼ºÀÌ ÀÖ´Ù. µû¶ó¼­ º» ¿¬±¸¿¡¼­´Â µ¥ÀÌÅÍ¿¡ ³ëÀÌÁ ÀÎÀ§ÀûÀ¸·Î »ðÀÔÇÏ¿© ¹®¼­ ºÐ·ù±âÀÇ °ß°í¼ºÀ» °­È­ÇÏ°í À̸¦ ÅëÇØ ºÐ·ùÀÇ Á¤È®µµ¸¦ Çâ»ó½Ãų ¼ö ÀÖ´Â ¹æ¾ÈÀ» Á¦¾ÈÇÏ°íÀÚ ÇÑ´Ù. Áï, ºÐ·ùÀÇ ´ë»óÀÌ µÇ´Â ¿ø ¹®¼­¿Í ÀüÇô ´Ù¸¥ Ư¡À» °®´Â ÀÌÁúÀûÀÎ µ¥ÀÌÅͼҽº·ÎºÎÅÍ ÃßÃâÇÑ ÇüÁúÀ» ¿ø ¹®¼­¿¡ ÀÏÁ¾ÀÇ ³ëÀÌÁîÀÇ ÇüÅ·Π»ðÀÔÇÏ¿© ÀÌÁú¼º ÇнÀÀ» ¼öÇàÇÏ°Ô µÈ´Ù. 
 
 ÇÏÁö¸¸ ÀÌÁúÀû µ¥ÀÌÅ͸¦ »ç¿ëÇÒ °æ¿ì, µ¥ÀÌÅÍÀÇ Çü½ÄÀÌ ´Ù¸£±â ¶§¹®¿¡ ÀüÅëÀû ±â°èÇнÀ ¾Ë°í¸®ÁòÀ» »ç¿ëÇϱⰡ ¾î·Æ´Ù. µû¶ó¼­ º» ¿¬±¸¿¡¼­´Â ÀÌÁú¼º ÇнÀÀ» À§ÇÏ¿© ÁØÁöµµÇнÀ ¾Ë°í¸®ÁòÀ» Àû¿ëÇÏ¿´À¸¸ç, ·¹À̺íÀÌ ÁöÁ¤µÇÁö ¾ÊÀº µ¥ÀÌÅÍ·Î ÀÎÇÑ ¼º´É ÀúÇϸ¦ ¹æÁöÇϱâ À§ÇÏ¿© ±ÔÄ¢ ¼±º° ±â¹Ý ¾Ó»óºí ÁØÁöµµÇнÀ(Rule Selection-Based Ensemble Semi-Supervised Learning Algorithm: RSESLA)À» Á¦¾ÈÇÏ¿´´Ù. RSESLA´Â ÀÌÁú¼º ÇнÀÀ» ÅëÇØ µµÃâµÈ ºÐ·ù ±ÔÄ¢ Áß ¹®¼­ ºÐ·ù±âÀÇ Á¤È®µµ Çâ»ó¿¡ ±â¿©ÇÏ´Â ºÐ·ù ±ÔÄ¢¸¸À» ÃßÃâÇÏ¿© Àû¿ëÇÏ´Â ¹æ½ÄÀ¸·Î ÀÌ·ç¾îÁö¸ç, º» ¿¬±¸¿¡¼­´Â ´º½º, Æ®À§ÅÍ ¹× ºí·Î±×¿Í °°ÀÌ 3°¡Áö À¯ÇüÀÇ ½ÇÁ¦ µ¥ÀÌÅ͸¦ ´ë»óÀ¸·Î ½ÇÇèÀ» ¼öÇàÇÏ¿´´Ù.

[±¹³»³í¹®]

ÀÎÅͳݿ¡ °ø°³µÈ ¼ö ¸¹Àº À¥ ¹®¼­µé¿¡´Â À¯ÀÍÇÑ Á¤º¸¸¦ Á¦°øÇÏ´Â À¥ ¹®¼­µé»Ó¸¸ ¾Æ´Ï¶ó, À½¶õ Á¤º¸¿Í °ü·ÃµÈ ºÒ°ÇÀüÇÑ À¯ÇØ À¥ ¹®¼­µéÀÌ ´Ù¼ö Æ÷ÇԵǾî ÀÖÀ¸¸ç, º» ¿¬±¸¿¡¼­´Â ÀÌ·¯ÇÑ À¯ÇØ À¥ ¹®¼­µéÀ» È¿°úÀûÀ¸·Î °ËÃâÇÒ ¼ö ÀÖ´Â ¹æ¹ýÀ» Á¦¾ÈÇÑ´Ù. Áï, À¯ÇØ À¥ ¹®¼­µéÀÇ ºÐ¼®À» ÅëÇÏ¿© À¯ÇØ À¥ ¹®¼­ ¼±Á¤À» À§ÇÑ Æò°¡ Ç׸ñµéÀ» µµÃâÇÏ°í, °¢ Æò°¡ Ç׸ñº° À¯ÇØ Á¡¼ö ºÎ¿©¸¦ À§ÇÑ Æò°¡ ±âÁØÀ» Á¦½ÃÇÑ´Ù. ±×¸®°í, À¯ÇØ Á¡¼öµéÀÇ ÃÑÇÕÀÌ ÀÓ°è°ª ÀÌ»óÀÎ À¥ ¹®¼­¸¦ À¯ÇØ À¥ ¹®¼­·Î °ËÃâÇÑ´Ù. º» ¿¬±¸ÀÇ °á°ú´Â À¯ÇØ À¥ ¹®¼­µé·ÎºÎÅÍ ÀÌ¿ëÀÚ¸¦ º¸È£ÇÏ°í ÀÎÅÍ³Ý »ç¿ëÀÇ ¾ÈÀü¼ºÀ» Çâ»ó½ÃÅ°´Âµ¥ ±â¿©ÇÒ °ÍÀ¸·Î ±â´ëµÈ´Ù.

[±¹³» ÇÐÀ§³í¹®]

Áß±¹ ÃÖÃÊÀÇ ÅëÀÏ Á¦±¹ÀÎ òÚð¨Ïаú À̸¦ °è½ÂÇÑ ùÓð¨ÏÐÀÇ ½Ã´ë¸¦ ÀÌÇØÇϴµ¥ ÀÖ¾î °ü°ÇÀÌ µÇ´Â ¹®Á¦´Â ¡®ð¨ÏС¯ÀÌ ¾î¶² ¹æ½Ä°ú Á¦µµ¸¦ °¡Áö°í ¡®ñéÏС¯À̶ó°í ÇÏ´Â °Å´ëÇÑ °ø°£À» Áö¹èÇߴ°¡ ÇÏ´Â ¹®Á¦ÀÏ °ÍÀÌ´Ù. ÀÌ·¯ÇÑ °ø°£ÀÇ Áö¹è¸¦ À§ÇØ òÚùÓð¨ÏÐÀº ÏÛ°ú úãÀ̶ó°í ÇÏ´Â Áö¹æÇàÁ¤±â±¸¸¦ ¼³¸³ÇÏ°í, ȲÁ¦ÀÇ ´ë¸®ÀÚÀÎ °ü·á¸¦ ÆÄ°ßÇØ Áö¹æÀ» ÅëÄ¡Çϵµ·Ï ÇÏ´Â ÏÛúã𤸦 ½Ç½ÃÇÏ¿´´Ù. ÇÏÁö¸¸ ÏÛúã𤰡 ½Ç½ÃµÇ°í ´Ù¾çÇÑ ÅëÀÏÁ¤Ã¥ÀÌ ½ÃÇàµÇ¾ú´Ù°í Çؼ­ ð¨ÏÐÀÇ °¢ Áö¹æÀÌ È²Á¦ÀÇ ÀÏ·üÀûÀÎ Áö¹èÇÏ¿¡ µé¾î°£ °ÍÀº ¾Æ´Ï´Ù. ¡®ð¨ÏС¯ Áö¹èüÁ¦¸¦ ¿Ï¼ºÇϱâ À§Çؼ­´Â ȲÁ¦¸¦ Á¤Á¡À¸·Î ÇÑ Áß¾Ó °ü·á±â±¸ÀÇ ¸í·ÉÀÌ ÏÛúãÀÇ °ü¸®µé¿¡ ÀÇÇØ ½ÇÁ¦ ½ÃÇàµÇ¾î úÁ×ì »çȸ¿¡±îÁö ½ÇÁúÀûÀÎ ¿µÇâ·ÂÀ» ¹ÌÄ¡µµ·Ï ÇÏ´Â ÇàÁ¤Ã¼°è°¡ Á¤ºñµÇ¾î¾ß¸¸ Çß´Ù. ¸¸¾à ȲÁ¦³ª Áß¾ÓÀÇ ¸í·ÉÀÌ Áö¹æÀ¸·Î Àü´ÞµÇÁö ¸øÇϰųª, Àü´ÞµÇ´õ¶óµµ ½ÇÁ¦ ½ÃÇàÀ¸·Î À̾îÁöÁö ¸øÇÑ´Ù¸é, Áö¹æ úÁ×ì »çȸ¿¡ ´ëÇÑ üÕð¨ÀÇ Áö¹è·ÂÀº À¯¸í¹«½ÇÇÏ°Ô µÇ°í, ð¨ÏÐÀÇ ÅëÀϼºÀº Å©°Ô ÈÑ¼ÕµÉ ¼ö¹Û¿¡ ¾øÀ» °ÍÀÌ´Ù. ¶ÇÇÑ Áß¾Ó°ú Áö¹æÀÇ °ü·á ÇàÁ¤Ã¼°è°¡ Àß Á¤ºñµÇ¾î ÀÖ´Ù°í ÇÏ´õ¶óµµ, Áß¾ÓÀÇ ¸í·ÉÀÌ ±¸µÎ Çü½ÄÀ¸·Î Àü´ÞµÈ´Ù¸é Àü´Þ °úÁ¤¿¡¼­ÀÇ Àü´Þ ³»¿ë ܨËÇ, ¸í·É ÁýÇà¿¡ ´ëÇÑ Ã¥ÀÓ È¸ÇÇ µî ´Ù¾çÇÑ ¹®Á¦°¡ ¹ß»ýµÉ ¼ö ÀÖ¾úÀ» °ÍÀÌ´Ù. µû¶ó¼­ òÚùÓð¨ÏÐÀº Á¦±¹ÀÇ ¸ðµç ÇàÁ¤Àû 󸮰¡ ¹®¼­¿¡ ÀÇÇؼ­¸¸ ÀÌ·ç¾îÁöµµ·Ï ÇÏ´Â Ùþßöú¼ïÙÀÇ Ã¼°è¸¦ ÀÏÂïºÎÅÍ °®Ãß°í ÀÖ¾úÀ¸¸ç, ÀÌ·± Ùþßöú¼ïÙü°èÀÇ ¿Ïºñ´Â òÚùÓÓÛÀÇ ÏÛúã𤰡 À¯ÁöµÇ°í ð¨ÏÐüÁ¦°¡ ¿øÈ°ÇÏ°Ô ±â´ÉÇϴµ¥ °áÁ¤ÀûÀÎ ¿ªÇÒÀ» ÇÏ¿´´Ù. Ùþßöú¼ïÙü°è¶ó°í ÇÏ´Â °ÍÀº ±¹°¡ ÅëÄ¡¸¦ À§ÇÑ ¸ðµç ÇàÁ¤ÀûÀÎ ¾÷¹« 󸮰¡ ¹®¼­¸¦ ÅëÇØ ÀÌ·ç¾îÁö´Â ½Ã½ºÅÛÀ̶ó°í ÇÒ ¼ö ÀÖ´Ù. ¹®¼­¸¦ ÅëÇØ Áß¾ÓÀÇ ¸í·ÉÀÌ Áö¹æ¿¡¼­ ½ÃÇàµÇ°í, Áö¹æÀÇ °¢Á¾ »óȲÀÌ Áß¾ÓÀ¸·Î Áý¾àµÊÀ¸·Î½á, Áß¾Ó°ú Áö¹æÀÇ °¢ °ü·á±â±¸°¡ ±ä¹ÐÈ÷ ¿¬°áµÈ °ÍÀÌ´Ù. Áï ¹®¼­ÇàÁ¤Ã¼°è´Â ð¨ÏÐÀ» Çϳª·Î ¹­´Â ÀÏÁ¾ÀÇ ¡®²ö¡¯°ú °°Àº ¿ªÇÒÀ» ¼öÇàÇÏ¿´À¸¸ç, ñéÏаú °°ÀÌ °Å´ëÇÑ °ø°£À» µ¿ÀÏÇÑ ¡®ð¨ÏÐüÁ¦¡¯ÇÏ¿¡ ¹­¾î ÅëÀÏÀû Áö¹è¸¦ °¡´ÉÇÏ°Ô ÇÑ °ü°ÇÀûÀÎ ±âÁ¦¿´´Ù. ±×¸®°í ÀÌ·¸°Ô ¿ÏºñµÈ ¹®¼­ÇàÁ¤Ã¼°è¸¦ µû¶ó Áö¹æÀÇ ±âÃþ »çȸ±îÁö Àü´ÞµÈ ú¼ïÙÙþßö´Â ÀÏ¹Ý ¹é¼ºµé°ú °°ÀÌ ¹®ÀÚ Çص¶´É·ÂÀ» °®ÃßÁö ¸øÇÑ »ç¶÷µé¿¡°Ô´Â ȲÁ¦ÀÇ ±ÇÀ§¸¦ º¸¿©ÁÖ´Â ½ÇÁ¦ÀûÀÎ »ó¡¹°·Î¼­µµ ±â´ÉÇϸç, ð¨ÏÐüÁ¦°¡ ±â´ÉÇÏ°í ÀÖÀ½À» º¸¿©ÁÖ´Â ½Ç¹°·Î¼­ ºñÃçÁ³À» °ÍÀÌ´Ù. µû¶ó¼­ º»°í¿¡¼­´Â òÚùÓÓÛÀÇ ÇàÁ¤¹®¼­°¡ ÀÛ¼º, ¹ß¼ÛµÈ ÈÄ ¼ö½Å±â°ü¿¡¼­ 󸮵DZâ±îÁöÀÇ °¢ °úÁ¤ÀÌ ½ÇÁ¦ÀûÀ¸·Î ¾î¶»°Ô ±â´ÉÇß´ÂÁö¸¦ »ìÆ캸°íÀÚ ÇÏ¿´´Ù. À̸¦ À§ÇØ Á¦1Àå¿¡¼­´Â òÚùÓÓÛ ðßßö¸¦ ºñ·ÔÇÑ ÇàÁ¤¹®¼­°¡ Áß¾ÓÀ¸·ÎºÎÅÍ ñ¶¿Í ÏÛ¿¡ Àü´ÞµÇ±â±îÁöÀÇ °úÁ¤°ú ¹æ¹ýÀ» ¹®¼­ÇàÁ¤ÀÇ È¿À²¼ºÀ̶õ Ãø¸é¿¡¼­ »ìÆ캸¾Ò´Ù. Á¦2Àå°ú Á¦3Àå¿¡¼­´Â ½ÇÁ¦ ¹®¼­¿¡ ±â·ÏµÈ ¸í·ÉÀÌ ½ÃÇàµÇ´Â ÇàÁ¤Àû, °ø°£Àû ¹üÀ§ÀÎ úã¿¡¼­ÀÇ ¹®¼­Ã³¸® °úÁ¤À» òÚÓÛ¿Í ùÓÓÛ·Î ±¸ºÐÇÏ¿© »ìÆ캸¾Ò´Ù. ±×¸®°í À̸¦ ÅëÇØ ´ç½Ã ¹®¼­ÇàÁ¤Ã¼°è¿¡¼­ úãÀÌ ÀÏÁ¤ÇÑ ±âÁØ ±â°üÀÇ ¿ªÇÒÀ» ¼öÇàÇßÀ½À» ¾Ë ¼ö ÀÖ¾ú´Ù. Á¦4Àå¿¡¼­´Â îñùÓ ÁßÈı⠼­ºÏ º¯°æÁö¿ªÀÇ ¹®¼­Àü´Þ ³ë¼±°ú, ÀÌµé ³ë¼±¿¡¼­ ½ÇÁ¦ ¹®¼­Àü´ÞÀ» ´ã´çÇÑ Áß°£ æ¾óױⱸÀÇ ¼³Ä¡ »óȲÀ» »ìÆ캽À¸·Î½á, öÇ, ÑÈöÇ(æ¾), ïÍ(âÊ)À¸·Î ±¸¼ºµÈ 3±ÞÀÇ éèîî±â±¸°¡ ¹®¼­Àü´ÞÀÇ ³ë¼± »ó¿¡ ¹èÄ¡µÇ¾î ÀÖ¾úÀ½À» ¾Ë ¼ö ÀÖ¾ú´Ù. ¸¶Áö¸· Á¦5Àå¿¡¼­´Â òÚùÓÓÛ éè, ïÍ, îî, öÇ, æ¾ µî °¢Á¾ éèîî±â±¸°¡ ¼³Ä¡µÈ ¹è°æ ¹× ½Ã°£ÀÇ È帧¿¡ µû¸¥ À̵é éèîî±â±¸ ±â´ÉÀÇ º¯È­ ¾ç»ó¿¡ ´ëÇØ »ìÆ캸¾Ò´Ù. ÀÌó·³ òÚùÓð¨ÏÐÀº ¹®¼­ÇàÁ¤ÀÌ ÀÏÁ¤ÇÑ Ã¼°è¿¡ µû¶ó ÀÌ·ç¾îÁöµµ·Ï ÇÏ´Â ¸¹Àº Á¶Ä¡¸¦ ÃëÇÏ¿´´Âµ¥, ¹®¼­ÇàÁ¤ÀÇ Ã¼°è¶ó°í ÇÏ´Â °ÍÀº ÇàÁ¤¹®¼­ÀÇ ÀÛ¼º, ¹ß¼Û, Á¢¼ö, 󸮸¦ ´ã´çÇÏ´Â °¢ ±Þ ÇàÁ¤±â°ü°ú, À̵é ÇàÁ¤±â°ü »çÀÌ¿¡¼­ ½ÇÁ¦ ¹®¼­ÀÇ Àü´ÞÀ» ´ã´çÇÏ´Â éèîî±â±¸, ±×¸®°í ¹®¼­ Àü´ÞÀÚ°¡ ÀÌ¿ëÇÏ´Â µµ·Î, ±³Åë¼ö´Ü, ¼÷¹Ú½Ã¼³ µîÀÇ Á¦ ¿ä¼Ò°¡ ÀÏÁ¤ÇÑ Ã¼°è ¾È¿¡¼­ ¼­·Î À¯±âÀûÀ¸·Î ¿¬°áµÇ¾î ¿øÈ°ÇÑ ÇàÁ¤¹®¼­ÀÇ ÅëÇàÀÌ ÀÌ·ç¾îÁöµµ·Ï ÇÏ´Â ½Ã½ºÅÛÀ̶ó°í ÇÒ ¼ö ÀÖ´Ù. ±×¸®°í ÀÌ·¸°Ô ¿ÏºñµÈ ü°è¸¦ µû¶ó °¢ ±Þ ÇàÁ¤±â±¸¿¡¼­ ÀÛ¼ºÇÑ ¹®¼­°¡ ºó¹øÈ÷ ¿Õ·¡ÇÔÀ¸·Î½á ½ÇÁ¦ÀûÀÎ ð¨ÏÐÀÇ ÅëÄ¡°¡ ÀÌ·ç¾îÁø °ÍÀÌ´Ù. òÚã·üÕÀÌ ±¹°¡ ´ë¼Ò»ç¸¦ ¸ðµÎ ó°áÇÏ¸ç ¸ÅÀÏ Ã³¸®ÇÒ ÇàÁ¤¹®¼­ÀÇ ÀÏÁ¤ÇÑ ¾çÀ» Á¤ÇصРÈÄ À̸¦ ¸ðµÎ ó¸®ÇÏÁö ¾ÊÀ¸¸é ÈÞ½ÄÇÏÁö ¾Ê¾Ò´Ù°í ÇÏ´Â °í»ç³ª, áËù¼°¡ ùÓ ÍÔðÓ êåÛÀÀ» µû¶ó ùàåÕ¿¡ ÀÔ¼ºÇÑ ÈÄ ãªßÓݤ¿Í åÙÞÈݤÀÇ Óñßö, ëÏÖµ µîÀÇ ¹®¼­¸¦ Àå¾ÇÇØ ùÓÀÌ ô¸ù»¸¦ ÅëÄ¡ÇÒ ¼ö ÀÖ´Â ±â¹ÝÀ» È®º¸Çß´Ù´Â ±â»ç´Â ¸ðµÎ òÚùÓð¨ÏÐÀÌ ¹®¼­ÇàÁ¤À» ÅëÇØ ÀÏ¹Ý ÚÅ¿¡ ´ëÇÑ Áö¹è¸¦ °üö½ÃÄ×À½À» ¿ª¼³ÇÏ°í ÀÖ´Ù. ÀÌó·³ òÚùÓÓÛ ¹®¼­ÇàÁ¤Ã¼°è´Â ȲÁ¦¸¦ Á¤Á¡À¸·Î ð¨ÏÐÀÇ ÅëÄ¡¸¦ ´ã´çÇÑ Áß¾Ó Á¤ºÎ¿Í, ½ÇÁ¦ ÅëÄ¡ÀÇ ´ë»óÀÎ Áö¹æ °ü·á±â±¸¸¦ ¿¬°áÇÏ´Â ¿ªÇÒÀ» ÇÏ¿´À¸¸ç, µ¿½Ã¿¡ úÁ×ìÀÇ ÅëÄ¡±â±¸·Î ¼³Ä¡µÈ ÏÛ $úã°ú ½ÇÁ¦ ÚÅÀÌ °ÅÁÖÇÏ´Â °ø°£ÀÎ úÁ×ì »çÀ̸¦ ÇϳªÀÇ ±¸Á¶ ¾È¿¡ ÅëÇÕ½ÃÅ°´Â ÀÛ¿ëÀ» Çß´Ù°í ÇÒ ¼ö ÀÖ´Ù. Áï ÏÛúã𤸦 ±Ù°£À¸·Î ÇÑ òÚùÓð¨ÏÐÀÇ ÅëġüÁ¦´Â ¡®ñéäç-ÏÛúã-úÁ×졯¸¦ ±¸Á¶ÀûÀ¸·Î ¿¬°á½ÃŲ ¹®¼­ÇàÁ¤Ã¼°è¿¡ ÀÇÇØ È¿À²ÀûÀ¸·Î ±â´ÉÇÑ °ÍÀÌ´Ù. òÚùÓÀÇ ð¨ÏÐüÁ¦°¡ ¼º¸³Çϱâ ÀÌÀüÀÇ ±¹°¡ Áö¹èÁ¦µµÀÎ ñ²ÓÛÀÇ ÜæËï𤰡 ¡®èÝ-ð³ý¥-ÌÏÓÞÜý-ÞÍ¡¯¸¦ ÇϳªÀÇ Áú¼­·Î ¹­¾îÁÖ´Â ÀÇÁ¦Àû °¡Á·Áú¼­ÀÎ ðóÛö𤿡 ÀÇÇØ ±â´ÉÇß´Ù´Â Á¡À» »ý°¢Çϸé, òÚùÓð¨ÏÐÀÇ ¿ª»ç¸¦ ÀÌÇØÇϴµ¥ ÀÖ¾î ¹®¼­ÇàÁ¤Ã¼°è ¿¬±¸°¡ °¡Áø Á߿伺À» ÁüÀÛÇÒ ¼ö ÀÖÀ» °ÍÀÌ´Ù. µû¶ó¼­ º»°íÀÇ òÚùÓÓÛ ¹®¼­ÇàÁ¤Ã¼°è¿¡ ´ëÇÑ ¿¬±¸´Â ´Ü¼øÇÑ Í¯ÓÛ Áß±¹ÀÇ ÇàÁ¤Á¦µµ¿¡ ´ëÇÑ ¿¬±¸¸¦ ³Ñ¾î, òÚùÓð¨ÏÐÀÇ ½Ã´ëÀû Ư¡°ú ±× ÀÌÀü ½Ã´ë¿ÍÀÇ Â÷º°¼ºÀ» ´õ¿í ºÎ°¢½ÃÅ°´Â ¿¬±¸°¡ µÇ¾úÀ» °ÍÀ¸·Î »ý°¢ÇÑ´Ù.

[±¹³»³í¹®]

À¥ÀÇ ºñ¾àÀûÀÎ ¼ºÀåÀ¸·Î À¥¿¡´Â ¹«¼öÇÑ Á¤º¸¸¦ ÃàÀûÇÏ°í ÀÖÀ¸¸ç, ƯÈ÷ ÅؽºÆ® ¹®¼­´Â Àΰ£¿¡ ÀÇÇØ °¡Àå ½±°Ô ±×¸®°í ¸¹ÀÌ ÀÌ¿ëµÇ´Â Çü½ÄÀ̶ó ÇÏ°Ú´Ù. ÅؽºÆ® ¹®¼­ÀÇ È¿À²Àû °Ë»öÀ» À§ÇØ ¸¹Àº ¿¬±¸°¡ ÀÌ·ç¾îÁ³À¸¸ç, È®·üÀ» ÀÌ¿ëÇÑ ¹æ¹ý, Åë°èÀûÀÎ ±â¹ýÀ» ÀÌ¿ëÇÑ ¹æ¹ý, º¤ÅÍ À¯»çµµ¸¦ ÀÌ¿ëÇÑ ¹æ¹ý, º£ÀÌÁö¾È ÀÚµ¿¹®¼­ ºÐ·ù ¹æ¹ý µîÀÌ Á¦¾ÈµÇ¾ú´Ù. ±×·¯³ª ÀÌ·¯ÇÑ ±âÁ¸ÀÇ ¹æ¹ýµéÀº ¹®¼­ÀÇ Æ¯Â¡À» Á¤È®ÇÏ°Ô ¹Ý¿µÇÒ ¼ö ¾ø°í, ÀǹÌÀû °Ë»öÀÌ ÀÌ·ç¾îÁöÁö ¾Ê´Â ´ÜÁ¡À» °¡Áö°í ÀÖ´Ù ÀÌ¿¡ º» ³í¹®Àº ¹®¼­¸¦ ¹Ì¸® ºÐ·ùÇÏ´Â ±âÁ¸ÀÇ ¹æ¹ýÀ» °³¼±Çϱâ À§ÇØ, À¯»çÇÑ ¹®¼­¸¦ ÀǹÌÀûÀ¸·Î ã¾Æ³»±â À§ÇÑ »õ·Î¿î ¹®¼­ ºÐ·ùÀÇ Ã´µµ¸¦ Á¦¾ÈÇϸç À̸¦ Àû¿ëÇÏ´Â ¹æ¹ýÀ» Á¦½ÃÇÑ´Ù. º» ¹æ¹ýÀº ¹®¼­ÀÇ ³»¿ëÀ» ÀǹÌÀûÀÎ °èÃþÀ¸·Î Ç¥ÇöÇÏ°í Áß¿ä µµ¸ÞÀο¡ °¡ÁßÄ¡¸¦ µÎ¸ç, ¹®¼­µé°£ÀÇ µµ¸ÞÀÎ °¡ÁßÄ¡¿Í µµ¸ÞÀÎ ³»ÀÇ °³³ä ÀÏÄ¡µµ¸¦ ÀÌ¿ëÇÏ¿© À¯»çµµ¸¦ ±¸ÇÑ´Ù.

[±¹³»³í¹®]

ÄÄÇ»ÅÍÀÇ ¹ßÀü°ú ÀÎÅͳÝÀÇ ±Þ¼ÓÇÑ ¹ßÀüÀ¸·Î Á¤º¸ÀÇ ¾çÀÌ Æø¹ßÀûÀ¸·Î Áõ°¡ÇÏ°Ô µÇ¾ú°í ÀÌ·¯ÇÑ ¹æ´ëÇÑ ¾çÀÇ Á¤º¸µéÀº ´ëºÎºÐ ¹®¼­ ÇüÅ·Π°ü¸®µÇ°í ÀÖÀ¸¸ç, ¹®¼­ ´ÜÀ§º° Ç¥ÇöµÈ ¸¹Àº Á¤º¸µéÀ» È¿°úÀûÀ¸·Î °ü¸®ÇÏ°í °Ë»öÇϱâ À§ÇÑ ¹æ¹ýÀÇ ¿¬±¸°¡ ÇÊ¿äÇÏ°Ô µÇ¾ú´Ù. ¹®¼­ Ŭ·¯½ºÅ͸µÀº ¹®¼­°£ÀÇ À¯»çµµ¸¦ ¹ÙÅÁÀ¸·Î ¼­·Î ¿¬°üµÈ ¹®¼­µéÀ» ±ºÁýÈ­ÇÏ¿© ¹®¼­µéÀ» ÁÖÁ¦º°·Î ÅëÇÕÇÏ´Â ¹æ¹ýÀ¸·Î ´ë¿ë·®ÀÇ ¹®¼­µéÀ» ÀÚµ¿À¸·Î ºÐ·ùÇÏ°í, °Ë»öÇÏ´Â µ¥ À־ °Ë»öÀÇ Á¤È®¼ºÀ» Áõ´ë½Ãų ¼ö ÀÖ´Ù. º» ³í¹®¿¡¼­´Â »õ·Î¿î ¹®¼­ÀÇ Ãß°¡³ª ±âÁ¸¹®¼­ÀÇ »èÁ¦·Î ÀÎÇÏ¿© ±ºÁýÈ­ ´ë»óÀÌ µÇ´Â ¹®¼­ ÁýÇÕÀÌ Á¡ÁøÀûÀ¸·Î º¯È­Çϴ ȯ°æÀ» À§ÇÑ Á¡ÁøÀû ¹®¼­ Ŭ·¯½ºÅ͸µ ¾Ë°í¸®ÁòÀ» Á¦¾ÈÇÑ´Ù. Á¡ÁøÀû ¹®¼­ Ŭ·¯½ºÅ͸µ ¾Ë°í¸®ÁòÀº »õ·Î¿î ¹®¼­°¡ Ãß°¡µÇ¾úÀ» °æ¿ì ¹®¼­ Àüü¸¦ ´Ù½Ã Ŭ·¯½ºÅ͸µÇÏÁö ¾Ê°í, ÀÌ¹Ì »ý¼ºµÈ Ŭ·¯½ºÅ͵éÀÇ ±¸Á¶¸¦ Àû±ØÀûÀ¸·Î º¯È­½ÃÅ´À¸·Î½á ³ôÀº È¿À²¼ºÀ» Á¦°øÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ, ¹®¼­ Ŭ·¯½ºÅ͸µÀÇ Á¤È®µµ¸¦ ³ôÀ̱â À§ÇÏ¿© Åë°èÀûÀÎ ±â¹ýÀ¸·Î ºÒ¿ë¾î¸¦ ÆǺ°ÇÏ¿© Á¦°ÅÇÏ´Â ¾Ë°í¸®ÁòÀ» Á¦¾ÈÇÏ°í, ¹®¼­ Ŭ·¯½ºÅ͸µ¿¡¼­ Á¤È®ÇÑ ´Ü¾î°¡ÁßÄ¡ »êÃâÀ» À§ÇØ TF$\times$IDF °ø½ÄÀ» ¼öÁ¤ÇÑ TF$\times$NIDF °ø½ÄÀ» Á¦¾ÈÇÑ´Ù.

[±¹³»³í¹®]

º» ³í¹®Àº ¸Ó½Å ·¯´× ±â¼úÀ» ÀÌ¿ëÇÏ¿© °ú°ÅÀÇ ¼öÁýµÈ ¹®¼­¸¦ ºÐ¼®ÇÏ°í À̸¦ ¹ÙÅÁÀ¸·Î ¹®¼­¸¦ ºÐ·ùÇÏ´Â ¹æ¹ýÀ» Á¦¾ÈÇÑ´Ù. ƯÁ¤ µµ¸ÞÀΰú °ü·ÃµÈ Å°¿öµå¸¦ ±â¹ÝÀ¸·Î µ¥ÀÌÅ͸¦ ¼öÁýÇÏ°í, Ư¼ö¹®ÀÚ¿Í °°Àº ºÒ¿ë¾î¸¦ Á¦°ÅÇÑ´Ù. ±×¸®°í ÇÑ±Û ÇüÅÂ¼Ò ºÐ¼®±â¸¦ »ç¿ëÇÏ¿© ¼öÁýÇÑ ¹®¼­ÀÇ °¢ ´Ü¾î¿¡ ¸í»ç, µ¿»ç, Çü¿ë»ç¿Í °°Àº Ç°»ç¸¦ űëÇÑ´Ù. ¹®¼­¸¦ º¤ÅÍ·Î º¯È¯ÇÏ´Â Doc2Vec ¸ðµ¨À» ÀÌ¿ëÇØ ¹®¼­¸¦ ÀÓº£µùÇÑ´Ù. ÀÓº£µù ¸ðµ¨À» ÅëÇÏ¿© ¹®¼­ °£ À¯»çµµ¸¦ ÃøÁ¤ÇÏ°í ¸Ó½Å ·¯´× ±â¼úÀ» ÀÌ¿ëÇÏ¿© ¹®¼­ ºÐ·ù±â¸¦ ÇнÀÇÑ´Ù. ÇнÀÇÑ ºÐ·ù ¸ðµ¨ °£ ¼º´ÉÀ» ºñ±³ÇÏ¿´´Ù. ½ÇÇè °á°ú, ¼­Æ÷Æ® º¤ÅÍ ¸Ó½ÅÀÇ ¼º´ÉÀÌ °¡Àå ¿ì¼öÇßÀ¸¸ç F1 Á¡¼ö´Â 0.83ÀÌ µµÃâµÇ¾ú´Ù.

[±¹³»³í¹®]

º» ³í¹®Àº À¥ ¹®¼­ÀÇ ´Ù¿î·Îµå °¡´É ¿©ºÎ¿Í ³»¿ë º¯°æ ¿©ºÎ¸¦ ¿¹ÃøÇÏ´Â µµ±¸¸¦ ±â¼úÇÑ´Ù. À¥ µ¥ÀÌÅͺ£À̽º °ü¸®ÀÚ´Â ÀÚ½ÅÀÌ °ü¸®ÇÏ´Â À¥ ¹®¼­ ÁýÇÕÀ» ÃֽŠ»óÅ·ΠÀ¯ÁöÇÏ·Á°í ÇÒ ¶§, ¿¹Ãø µµ±¸¸¦ ÅëÇÏ¿© ´Ù¿î·ÎµåµÇÁö ¾Ê°Å³ª º¯°æµÇÁö ¾Ê¾ÒÀ» À¥ ¹®¼­¿¡ ´ëÇÑ ºÒÇÊ¿äÇÑ ¿äûÀ» °¨¼Ò½Ãų ¼ö ÀÖ´Ù. º» ³í¹®¿¡¼­´Â À¥ ¹®¼­µéÀÇ °ú°Å º¯°æÀÌ ¹Ì·¡ º¯°æ°ú ¸Å¿ì ¹ÐÁ¢ÇÑ °ü·ÃÀÌ ÀÖÀ½À» °¡Á¤ÇÑ´Ù. º» ³í¹®¿¡¼­´Â ¾à 300¸¸°³ÀÇ À¥ ¹®¼­µéÀ» 2ÀÏ ÁÖ±â·Î 100ÀÏ µ¿¾È °üÂûÇÏ¿© º¯°æ °æÇâÀ» ºÐ¼®ÇÏ°í, °üÂûµÈ ¹®¼­µéÀÇ ´Ù¿î·Îµå °¡´É ¿©ºÎ¿Í ³»¿ë º¯°æ ¿©ºÎ¸¦ ¿¹ÃøÇÑ´Ù. ¿¹Ãø °á°ú´Â ½ÇÁ¦ÀÇ º¯°æ »ç½Ç°ú ºñ±³ Æò°¡µÇ¾ú´Ù.

[±¹³»³í¹®]

¹®¼­ ¹üÁÖÈ­¿¡¼­ ÀÌÁø ºÐ·ù¸¦ ´ÙÁß ºÐ·ù¿¡ Àû¿ëÇÒ ¶§ ÀϹÝÀûÀ¸·Î 'ÇÑ ¹üÁÖ¿¡ ÀûÇÕ-´Ù¸¥ ¸ðµç ¹üÁÖ¿¡¼­´Â ºÎÀûÇÕ(One-Against-All) ÆÇÁ¤ ¹æ¹ý'À» »ç¿ëÇÑ´Ù. ÇÏÁö¸¸, ÀÌ·¯ÇÑ 'ÇÑ ¹üÁÖ¿¡ ÀûÇÕ-´Ù¸¥ ¸ðµç ¹üÁÖ¿¡¼­´Â ºÎÀûÇÕ ÆÇÁ¤ ¹æ¹ý'Àº ÇÑ °¡Áö ¹®Á¦Á¡À» °¡Áö´Âµ¥, ÀûÇÕ(positive) ÁýÇÕÀÇ ¹®¼­µéÀº »ç¶÷ÀÌ Á÷Á¢¹üÁÖ¸¦ ÇÒ´çÇÑ °ÍÀÌÁö¸¸ ºÎÀûÇÕ(negative) ÁýÇÕÀÇ ¹®¼­µéÀº »ç¶÷ÀÌ Á÷Á¢ ¹üÁÖ¸¦ ÇÒ´çÇÑ °ÍÀÌ ¾Æ´Ï±â ¶§¹®¿¡ ¿À·ù ¹®¼­µéÀÌ ¸¹ÀÌ Æ÷Ç﵃ ¼ö ÀÖ´Ù´Â °ÍÀÌ´Ù. º» ³í¹®¿¡¼­´Â ÀÌ·¯ÇÑ ¹®Á¦Á¡À» ÇØ°áÇϱâ À§Çؼ­ ½½¶óÀ̵ù ¿øµµ¿ì(sliding window) ±â¹ý°ú EM ¾Ë°í¸®ÁòÀ» ÀÌÁø ºÐ·ù ±â¹ÝÀÇ ¹®¼­ ¹üÁÖÈ­¿¡ Àû¿ëÇÒ °ÍÀ» Á¦¾ÈÇÑ´Ù. Á¦¾ÈµÈ ±â¹ýÀº ¸ÕÀú ½½¶óÀ̵ù À©µµ¿ì ±â¹ýÀ» »ç¿ëÇÏ¿© ¿À·ù ¹®¼­µéÀ» ÃßÃâÇÏ°í À̵éÀ» EM¾Ë°í¸®ÁòÀ» »ç¿ëÇؼ­ ´Ù½Ã ¹üÁÖ¸¦ ÇÒ´çÇÔÀ¸·Î½á ÀÌÁø ºÐ·ù ±â¹ÝÀÇ ¹®¼­ ¹üÁÖÈ­ ±â¹ýÀÇ ¼º´ÉÀ» Çâ»ó½ÃŲ´Ù.

[±¹³»³í¹®]

ÃÖ±Ù ÀÎÅÍ³Ý »ó¿¡¼­ µ¥ÀÌÅÍ ±³È¯ÀÇ Ç¥ÁØ ÇÙ½É ±â¼ú·Î »ç¿ëµÇ´Â W3C(World Wide Web Consortium)ÀÇ XML(extensible Markup Language)Àº ¸ðµç Ç÷§Æû¿¡¼­ »ç¿ë °¡´ÉÇÑ ÀåÄ¡ ºñ Á¾¼ÓÀûÀÎ µ¥ÀÌÅÍ Çü½ÄÀÌ´Ù. ƯÈ÷ ±âÁ¸ÀÇ °¢ ±â¾÷¿¡¼­ ±¸ÃàµÇ¾î ÀÖ´ø °¢°¢ÀÇ ¾îÇø®ÄÉÀ̼ǰú ½Ã½ºÅÛ »çÀÌ¿¡ ±³È¯µÇ´Â ¼­·Î ´Ù¸¥ µ¥ÀÌÅÍ Çü½ÄÀ» ÅëÇÕÇÏ¿© À¯¿¬ÇÏ°í ºü¸¥ 󸮸¦ ÇÒ ¼ö ÀÖµµ·Ï ÇÑ´Ù. ±×·¯³ª XML ¹®¼­´Â ³í¸®ÀûÀÎ ±¸Á¶ Á¤º¸¸¸À» °¡Áö°í ÀÖÀ¸¹Ç·Î XML ¹®¼­¿¡ Ç¥Çö Á¤º¸¸¦ ±â¼úÇϱâ À§ÇÏ¿© W3C¿¡¼­´Â ¹®¼­ º¯È¯ Ç¥ÁØÀÎ XSLT(extensible Stylesheet Language Transformation)¸¦ ±Ç°íÇÏ¿´´Ù. ÀÌ´Â ÀÎÅÍ³Ý »ó¿¡¼­ µ¥ÀÌÅÍ ±³È¯À» À§ÇØ ¸¸µé¾îÁø XML¿¡ ÀûÇÕÇϵµ·Ï ¼³°èµÇ¾ú°í, XML ¹®¼­¸¦ »ç¿ëÀÚ¿¡°Ô Ç¥ÇöÇϱâ À§ÇÑ Ã³¸® ¹× ´Ù¸¥ µ¥ÀÌÅÍ Çü½ÄÀ¸·Î º¯È¯ÀÌ °¡´ÉÇϵµ·Ï Á¦¾ÈµÇ¾ú´Ù. ÀÌ¿¡ º» ³í¹®¿¡¼­´Â µ¥ÀÌÅÍ ±³È¯¿¡ »ç¿ëµÇ´Â XML ¹®¼­¿¡ Ç¥Çö Á¤º¸¸¦ ±â¼úÇÏ´Â XSLT ¹®¼­¸¦ WYSIWYC ȯ°æ¿¡¼­ ÆíÁýÇÒ ¼ö ÀÖÀ¸¸ç, XML¿¡ XSLT¸¦ Àû¿ëÇÏ¿© HTML(Hyper Text Markup Language) µ¥ÀÌÅÍ Çü½ÄÀ¸·Î º¯È¯ÇÏ´Â XSLT ¹®¼­ÆíÁý ½Ã½ºÅÛÀ» ¼³°è ¹× ±¸ÇöÇÏ¿´´Ù.

[ÇØ¿Ü³í¹®]

Á¶¼±½Ã´ë¿¡´Â ¿À´Ã³¯°ú ´Þ¸® ûŹÀÌ »ýÈ°ÀÇ Çʼö ¿ä°ÇÀ¸·Î ÀνĵǾ ±× ¼­½ÄÀÌ ¸Å¿ì À¯ÇüÈ­µÈ °Ý½ÄÀ¸·Î Á¸ÀçÇÏ¿´À¸¸ç, ±×·¯ÇÑ ¼­½ÄÀº ´©±¸³ª Âü°íÇÒ ¼ö ÀÖ´Â °£Âû ¼­½ÄÁýÀÇ ÀϺημ­ ÍëÊ浃 Á¤µµ¿´´Ù. À̰͸¸À¸·Îµµ ´ç½Ã »ç¶÷µéÀÌ Ã»Å¹¿¡ ´ëÇÑ »ýÈ° °¨°¢ÀÌ ¿À´Ã³¯°ú ¸¹ÀÌ ´Þ¶úÀ½À» ÁüÀÛÇÒ ¼ö ÀÖ´Ù. ÀÌ ±Û¿¡¼­´Â Á¶¼±½Ã´ë »ç¶÷µéÀÇ Ã»Å¹¿¡ ´ëÇÑ »ýÈ°Àû ½É¼º(À±¸®°¨°¢)¿¡ ´ëÇÑ ¿¬±¸¸¦ À§ÇÑ ±âÃʷμ­ ûŹÀ» ½ÇÇàÇÏ´Â ¹°Áú ÀÚ·á¶ó°í ÇÒ ¼ö Àִ ûŹ¹®¼­ÀÇ Æ¯¼ºÀ» ÇظíÇÏ´Â µ¥ ¸ñÀûÀ» µÎ¾ú´Ù. ÀÌ¿Í °°Àº ¹°ÁúÀڷḦ ÅëÇØ ±×µéÀÇ ±¸Ã¼ÀûÀÎ »ýÈ° °¨°¢À» ÀÌÇØÇÒ ¼ö Àֱ⠶§¹®ÀÌ´Ù.¿©±â¼­ ûŹ¹®¼­´Â öàÒ· ȤÀº á³ÖâÀ̶ó´Â ¹®¼­¸íÀ» ´Þ°í Àְųª ȤÀº µ¿ÀÏÇÑ ¾ç½ÄÀÇ ¹®¼­¸¦ ´ë»óÀ¸·Î ÇÏ°í ÀÖ´Ù. Á¶¼±Àü±â¿¡´Â ûŹ¹®¼­¸¦ Ī³äÀ̶ó´Â ¿ë¾î·Î ÀϹÝÈ­µÇ¾î ÀÖ¾úÁö¸¸ ÈıⰡ µÇ¾î¼­´Â ½Ç»ýÈ°¿¡¼­ ¼Ò·ÏÀ̶ó´Â ºñ±³Àû Å»°¡Ä¡È­µÈ ¿ë¾î·Î ´ëüµÇ¾ú´Ù´Â °ÍÀ» ¿ì¼± ÁöÀûÇÏ°í ½Í´Ù. ÀÌ´Â Á¶¼±ÈıⰡ µÇ¾î Ī³äÀÌ ÀÌ¹Ì À±¸®ÀûÀ¸·Î ¿À¿°µÈ ¾ð¾î°¡ µÇ¾úÀ¸¹Ç·Î À̰͸¸À¸·Î ûŹÀ» ÀºÀ¯ÀûÀ¸·Î Ç¥ÇöÇÒ ¼ö ÀÖ´Â ±â´ÉÀ» ´ÙÇÒ ¼ö ¾ø°Ô µÇ¾ú´ø °ÍÀ¸·Î ÃßÁ¤µÈ´Ù.Ī³äÀº ±× ¼­½ÄÀÌ ùÎý¾ó°Öâ, ÊÛÔºïñé©, òäáóÓÑÊøïÒãÁú¼ÊÛÖÉýÄóÂ, ÊÛãÒÊ£ÖµµîÀÇ °£Âû ¼­½ÄÁý¿¡ ½Ç·Á ÀÖ´Ù. À§ÀÇ ¼­½ÄÁý¿¡ ½Ç¸° Ī³äÀÇ ÁÖÁ¦µéÀº ¸Å¿ì ´Ù¾çÇÏ´Ù. ±× Áß ¨çðíÙý, ¨èð¾í÷ôë, ¨éߣáèôëÀº ¾î´À ¼­½ÄÁý¿¡³ª ½Ç·Á ÀÖ´Â ´ëÇ¥ÀûÀÎ ¿¹µéÀÌ´Ù. ±×·±µ¥ ÀÌ·¯ÇÑ ÁÖÁ¦µé Áß¿¡´Â ¿ÀÈ÷·Á Á¶¼±Àü±â¿¡ °¡Àå ÀϹÝÀûÀ¸·Î °ü·ÊÈ­µÈ Ī³äÀÎ Ò¿ÝæôëÀ̳ª ãÝÚªôëÀº ºüÁ® ÀÖ´Ù. À̴ Ī³äÀÌ Çã¿ëµÇ´Â ¹üÁÖ°¡ ½Ã´ëÀûÀÎ À±¸® ÀǽĿ¡ ±¸¼ÓµÇ¾î ÀÖ´Ù´Â »ç½ÇÀ» º¸¿©ÁØ´Ù. ±×¸®°í °£Âû¿¡ ½Ç·Á Àִ Ī³äÀ̶õ °ÍÀÌ Ã»Å¹ Áß¿¡¼­ »çȸÀûÀ¸·Î Çã¿ëµÈ ûŹÀ» ÇÑÁ¤ÇÏ¿© ÀÏÄ°í ÀÖ´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù.ÀÌ·¯ÇÑ Äª³äÀÇ Æ¯¼ºÀ» ÅëÇÏ¿© Á¶¼±½Ã´ë »ç¶÷µéÀÇ Ã»Å¹¿¡ ´ëÇÑ À±¸®°¨°¢ÀÌ ºñ¸®Àû ûŹ¿Í »ýÈ°¿¡¼­ Çã¿ëµÇ´Â ºÎŹÀÌ ¹Ì¹¦ÇÑ ÁöÁ¡¿¡¼­ °¥¶óÁö°í ÀÖ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. µû¶ó¼­ Á¶¼±½Ã´ë¿¡ ºñ¸®¼º ûŹÀÌ È¾ÇàÇÏ¿´°í ´ç½Ã »ç¶÷µéÀÌ ±×°Í¿¡ ´ëÇÑ À±¸®°¨°¢µµ ¾ø¾ú´Ù°í º¸´Â °ÍÀº ¿ÇÁö ¾Ê´Ù. ¿ÀÈ÷·Á ûŹ ¿ë¾îÀÇ º¯È­, ¸ÅŹÀÇ ¸íÈ®ÇÑ ¹üÁÖ ¼³Á¤, ûŹÀÇ ÁÖÁ¦ º¯È­ µîÀº ûŹ¿¡ ´ëÇÑ À±¸®ÀûÀÎ ½É¼ºÀÌ ¶Ñ·ÇÀÌ Á¸ÀçÇÑ´Ù´Â °ÍÀ» º¸¿©ÁÖ´Â °ÍÀÌ´Ù. ±×¸®°í ¼­½ÄÁýÀ¸·Î ûŹÀÇ ¼­½ÄÀÌ °ø°£µÇ¾ú´Ù´Â °ÍÀº ´ç½Ã »ç¶÷µéÀÌ »óÈ£Àû Àΰ£°ü°è¿¡ ´ëÇÑ Á¶½É¼º ³ôÀº À±¸®ÀǽÄÀÇ ÇÑ °¡Áö ÁöÇ¥¸¦ º¸¿©ÁØ´Ù.

[±¹³»³í¹®]

º» ¿¬±¸´Â Á¶¼±½Ã´ëÀÇ °í¹®¼­¿¡ »ç¿ëµÈ Á¾À̸¦ ºÐ¼®ÇÏ¿© ±× Ư¡À» °íÂûÇÔ¿¡ ±× ¸ñÀûÀ» µÎ°í ÀÖ´Ù. ÇöÁ¸ÇÏ´Â Á¾ÀÌ ½Ç¹°ÀÇ ºÐ¼®À» ÅëÇÏ¿© Á¶¼±½Ã´ë °í¹®¼­¿¡ »ç¿ëµÈ Á¾ÀÌÀÇ »óÅÂ¿Í º¯È­¸¦ ½ÇÁúÀûÀ¸·Î °üÂûÇØ º¸°íÀÚ ÇÑ´Ù. ºÐ¼®´ë»óÀº ¹®Áß¿¡ ¼ÒÀåÇÏ°í ÀÖ´Â °í¹®¼­ 1,504°ÇÀ¸·Î, ±× Á¾·ù´Â 17Á¾ 23Ç×ÀÌ´Ù. ºÐ¼®¹æ¹ýÀ¸·Î´Â Á¾ÀÌÀÇ ¹ßÇüÅÂ(¹ßÃÊ ¹ß²öÀÇ ÇüÅÂ), ¹Ðµµ, ¼¶À¯Á¾·ù¸¦ ºÐ¼®ÇÏ´Â ¹æ¹ýÀ» ½ÃµµÇÏ¿´´Ù. ¿ì¼± ¹ßÀÇ ÇüÅ´ ¹ßÃʼö¿Í ¹ß²öÆøÀ¸·Î ³ª´©¾î °üÂûÇÏ¿´´Âµ¥, 3cm³»ÀÇ ¹ßÃʼö´Â Å©°Ô 10°³ ³»¿ÜÀÇ °æ¿ì¿Í 17°³ ³»¿ÜÀÇ °æ¿ì·Î ³ª´©¾îÁø´Ù. 17°³ ³»¿ÜÀÇ °æ¿ì´Â Á¶¼±ÃʱâÀÇ Ã¥Áö¿¡¼­ º¸ÀÌ´Â ¹ßÃʼö¿Í À¯»çÇϳª, 10°³ ³»¿ÜÀÇ °æ¿ì´Â ±× »ç·Ê°¡ µå¹°´Ù. 10°³ ³»¿ÜÀÇ ¹ßÃʼö¸¦ °®Ãá °ÍÀº 1933³â Dard HunterÀÇ Á¶»ç¿¡ º¸ÀÌ´Â ¾ï»õ¹ßÀÎ °ÍÀ¸·Î ÆľǵȴÙ. ¹ßÃʼö¸¦ ½Ã±âÀûÀ¸·Î »ìÆ캸¸é, Á¶¼±Àü±â¿¡ ºñÇØ Áß±âºÎÅÍ ¸»±â·Î °¥¼ö·Ï ¹ßÃÊ°¡ ´õ¿í ÃÎÃÎÇØÁüÀ» È®ÀÎÇÒ ¼ö ÀÖ´Ù. ¹ß²öÆøÀº »ó´çÈ÷ ºÒ±ÔÄ¢ÀûÀ¸·Î ³ªÅ¸³ª¸ç, ÀÌ¿Ü¿¡µµ ´Ù¾çÇÑ Çö»óÀ» ¹ß°ßÇÒ ¼ö ÀÖ´Ù. ¿¹¸¦ µé¸é, ¹ß²ö°ú ¹ß²ö »çÀÌ¿¡ ªÀº ¹ß²öÀÌ ÀÖ´Â °æ¿ì, ¹ß²öÀÌ ÀÌÁßÀ¸·Î ³ªÅ¸³ª´Â °æ¿ì, ¹ß²öÆøÀÌ Á¼°Ô ³ªÅ¸³ª´Â °æ¿ì µîÀÌ ±×°ÍÀÌ´Ù. ¹ß²öÆøÀº Á¶¼±Èıâ·Î °¥¼ö·Ï Á¼¾ÆÁö´Â Çö»óÀ» º¸À̴µ¥, ƯÈ÷ 1800³â´ë ÀÌÈÄ¿¡ È®¿¬È÷ Á¼¾ÆÁüÀ» ¾Ë ¼ö ÀÖ´Ù. ´ÙÀ½À¸·Î ¹Ðµµ¸¦ »ìÆ캸¸é, ¹®¼­Á¾·ù¸¶´Ù ³ªÅ¸³ª´Â Æò±Õ¹Ðµµ°¡ 'ŹÁöÁØÀý(öôò¨ñÞï¹)'¿¡ ±â·ÏµÈ Á¾ÀÌ Á¾·ù¿Í ¹«°üÇÏÁö ¾Ê´Ù. Á¾ÀÌ Á¾·ùÀÇ Ç׸ñÀÌ °°Àº ¹®¼­´Â ¼­·Î À¯»çÇÑ Æò±Õ¹Ðµµ¸¦ º¸À̸ç ÃÊÁÖÁö, »óÇ°µµ·ÃÁö, ÇÏÇ°µµ·ÃÁö, ÀúÁÖÁöÀÇ ¼øÀ¸·Î ¹Ðµµ°¡ Á¡Á¡ ³·¾ÆÁø´Ù. ÀÌ¿Ü¿¡µµ °°Àº Á¾·ù ¹®¼­ÀÇ ¹Ðµµ¸¦ ºÐ¼®ÇØ º¸¸é ´ç½Ã¿¡ ¹®¼­¸¦ µÑ·¯½Ñ ´Ù¾çÇÑ ÀÌÇØ°ü°è¸¦ ¾Ë ¼ö ÀÖ´Ù. ¸¶Áö¸·À¸·Î ¹®¼­Áö¿¡ »ç¿ëµÈ ½Ä¹°¼¶À¯ÀÇ Á¾·ù¸¦ »ìÆ캸¾Ò´Ù. 'ŹÁöÁØÀý'¿¡¼­ ±¸ºÐÇÑ »óÇ°µµ·ÃÁö, ÇÏÇ°µµ·ÃÁö, ÃÊÁÖÁö, ÀúÁÖÁö¸¦ »ç¿ëÇÑ °¢ ¹®¼­ÁöÀÇ ¼¶À¯¸¦ °üÂûÇÑ °á°ú, ¸ðµÎ °°Àº ÇüÅÂÀÇ ´Ú¼¶À¯ÀÓÀ» ¾Ë ¼ö ÀÖ´Ù. ÀÌ´Â ¹®¼­Áö Á¦Á¶¿¡ »ç¿ëµÈ Á¾ÀÌ°¡ ½Ä¹°¼¶À¯ÀÇ Â÷ÀÌ¿¡ ÀÇÇؼ­ ±¸ºÐµÇ¾ú´ø °ÍÀÌ ¾Æ´Ï¶ó, Á¦ÀÛ °¡°ø¹æ¹ý µîÀÇ Â÷ÀÌ·Î ±¸ºÐµÇ¾úÀ½À» ¾Ë·ÁÁÖ´Â °ÍÀÌ´Ù. ¹®¼­ÀÇ ÀÛ¼º¸ñÀû¿¡ µû¶ó Á¾ÀÌÀÇ Á¾·ù¸¦ ´Ù¸£°Ô »ç¿ëÇÏ°í, ½Ã±â¿¡ µû¶ó¼­µµ Á¾ÀÌÀÇ Æ¯Â¡ÀÌ ´Ù¸¥ ¾ç»óÀ¸·Î ³ªÅ¸³­´Ù. º» ¿¬±¸¸¦ ÅëÇؼ­ Ã¥Áö(óüòµ)¿Í ¹®¼­Áö(Ùþßöòµ)ÀÇ ºñ±³¸¦ ÇÒ ¼ö ÀÖ°í, Áß±¹ÀÇ °í´ë Á¾ÀÌ¿Í Á¶¼±½Ã´ë Á¾ÀÌÀÇ ºñ±³µµ °¡´ÉÇÏ°Ô µÇ¾ú´Ù. ÀÌ¿Í °°Àº ¿¬±¸¸¦ ÅëÇØ ´ç½ÃÀÇ Á¾ÀÌ Á¾·ù¿Í ¹®¼­Á¾·ùº° ½Ã´ëº° º¯È­°úÁ¤À» ±¸Ã¼ÀûÀ¸·Î ÀÌÇØÇÒ ¼ö ÀÖ´Â °è±â°¡ µÇ¸®¶ó ¹Ï´Â´Ù.

[±¹³»³í¹®]

ÇöÀç ±¹³»ÀÇ EDMSÀÇ »óȲÀº ±¤ÆÄÀÏ ½Ã½ºÅÛÀÇ ´Ü°è¸¦ ¹þ¾î³ª EDMS·ÎÀÇ À̾çÀÌ µÎµå·¯Áö°í ÀÖ´Ù. ÀÌ°ÍÀº ±â¾÷¿¡¼­ ÀüÀÚ¿ìÆí, ÀüÀÚ°áÁ¦ µî°ú °°Àº ±×·ì¿þ¾îÀÇ ¹ß´Þ¿¡ ÈûÀÔÀº °ÍÀÌ´Ù. ÀÌ°°Àº EDMSÀÇ ¿ä±¸ Á¶°ÇÀ» ¸¸Á·Çϱâ À§ÇÑ ±¹³» °³¹ß Á¦Ç°À¸·Î´Â Çѱ¹¾ÆÀ̽ýº»çÀÇ OPENDMS, Æ®¶óÀÌÆ°Å×Å©ÀÇ MetaDesk µîÀÌ ÀÖ°í, ±¹³» µé¾î¿Í ÀÖ´Â ¿Ü±¹ Á¦Ç°À¸·Î´Â DOCS Open, FileNet, Saros, DocumentumµîÀÌ ÀÖ´Ù. ¿©±â¼­´Â ±¹³»¿Ü ¹®¼­ °ü¸® ½Ã½ºÅÛÀÇ ÇöȲ°ú Àü¸ÁÀ̶ó´Â ÁÖÁ¦·Î »ìÆ캸¾Ò´Ù.

[±¹³»³í¹®]

Áß±¹ÀÇ ÊÛÔº¿¬±¸ °¡¿îµ¥ ÌèîðÀ̳ª íãÝ­ µî¿¡ °üÇÑ ¿¬±¸¿¡ ºñÇϸé ðßßö¿Í °°Àº ÍëÙþßö¿¡ ´ëÇؼ­´Â »ó´ëÀûÀ¸·Î ¿¬±¸°¡ ¹ÌÁøÇÑ ÆíÀÌ´Ù. ÀÌ¿¡ º»°í´Â ÍëÙþßöÀÇ ßöãÒÀ» Áß½ÉÀ¸·Î °íÂûÇÏ¿´´Ù. ù°, 3°¡ÁöÀÇ ù»Ó¹ÙþßöÀÇ ßöãÒ : ¡®ßö¡¯¿Í ¡®ÑÀ¡¯·Î Åë¿ëµÇ´Â ÇÏ´Þ¹®¼­°¡ ÀÖ´Ù. ßö´Â ðßßö³ª ëÏÖµ°ú ¹®¼­ÀÇ ¼­½ÄÀ̳ª Àü´Þ°æ·Î¿¡¼­ À¯»çÇϸç, ßö ÀÌ¿Ü¿¡ ±× ¼­½ÄÀ̳ª °æ·Î´Ù ´Ù¸¥ ±¤¹üÀ§ÇÑ ¸ðµç ¹®¼­´Â ÑÀ·Î ºÒ¸°´Ù. ±×·¯³ª ÀÌµé ¹®¼­ ¸ðµÎ »óÇ๮¼­¿Í ÇÏÇ๮¼­°¡ ÇÔ²² ¾²ÀÌ¸ç ¸íÈ®ÇÑ Á¤ÀÇ°¡ ½±Áö ¾Ê´Ù. ÀÌ¿¡ º»°í¿¡¼­´Â ÇÏÇ๮¼­¿¡ ±¹ÇÑÇÏ¿© ±× ßöãÒÀÇ ºÐ·ù¸¦ ÅëÇØ °£µ¶¿¡ ±â·ÏµÈ ÇÏÇ๮¼­´Â ´ÙÀ½ÀÇ 3°¡Áö ÇÏÇ๮¼­·Î ºÐ·ùÇÒ ¼ö ÀÖ´Ù. ¥°. Ò´ûÜÒ´êÅìí ί٣ ìÑÙ£ ù» ί٣ ã¯ßöðôÞÀù»Ó×éÄíºåýðßßö ͱ ί٣ (ìÑÙ£) êÝ Î¯Ù£ åýëÏÖµ¤ýåý~ëÏÖµ ¥±. Ò´ûÜÒ´êÅìí ί٣ ìÑÙ£ êÝ Î¯Ù£ (ìÑÙ£) åýëÏÖµ¤ýåý~ëÏÖµ ì¹ Î¯Ù£ åýëÏÖµ¤ýåý~ëÏÖµ ¥². (êÅìí) ݤ¤ýί ͱ ί٣ (ìÑÙ£) êóÎç¤ýÙ½ì¤它êÓú° ¥°ÀÇ Çü½ÄÀº ðßßö¸¦ °¢ ±â°ü¿¡ ÇÏ´ÞÇÏ´Â ¼­½ÄÀ¸·Î °ÅÀÇ ¿¹¿Ü ¾øÀÌ ¡®ù»¡¯¶ó´Â ¿ë¾î¸¦ »ç¿ëÇÏ°í ÀÖ´Â Á¡ÀÌ Æ¯Â¡À̸ç, ¹®¹Ì¿¡´Â ¡®ðßý­ú¼ù»ñýÞö¡¯·Î Á¾°áµÈ´Ù. ¥±ÀÇ ¼­½ÄµéÀÌ ÇÊÀÚ°¡ ¡®ßö¡¯·Î ±ÔÁ¤ÇÏ´Â ¹®¼­·Î¼­, ÀÌµé ¹®¼­µéÀº °ÅÀÇ ¿¹¿Ü ¾øÀÌ ¹®¹Ì¿¡ ¡®åý~ëÏÖµ¡¯µîÀ¸·Î Á¾°áµÇÁö¸¸, ÀÌµé ¼­½Äµµ Å©°Ô ³ª´©¸é ÇÏ´ÞÇÒ ¶§¿¡ ¨ç ¡®Í±~êÝ~¡¯ ¨è ¡®êÝ¡¯ ¨é ¡®ì¹¡¯ µîÀÇ ¿ë¾î¸¦ »ç¿ëÇÏ´Â °æ¿ì·Î ³ª´­ ¼ö ÀÖ´Ù. ÀÌµé ¥± Çü½ÄÀÇ ¹®¼­µéµµ óüßö ÇüÅ·ΠµÇ¾î ÀÖ´Â °æ¿ì°¡ ´ëºÎºÐÀÌÁö¸¸ Á¾Á¾ ̬ó·³ ´Ù¸éó ÇüÅÂÀÇ ´Üµ¶ÊÛÀÌ »ç¿ëµÇ´Â °æ¿ìµµ ÀÖ´Ù. ¥²ÀÇ Çü½ÄÀº ÇÊÀÚ°¡ ¡®ÑÀ¡¯·Î ±ÔÁ¤ÇÏ´Â ¹®¼­·Î, æÄûܳª êÅìíµµ ¾øÀ¸¸ç ¹ß½ÅÀÚµµ ίÀ̳ª ݤ·Î µÇ¾î ÀÖ´Â Á¡À¸·Î º¸¾Æ ίݤÀÇ íþίÀÌ ¾Æ´Ñ ãªÀ̳ª íþÞÈ µîÀÌ ¹ß¼ÛÇÑ °ÍÀ¸·Î ÃßÁ¤µÈ´Ù. ÀÌ ¼­½ÄÀÇ Æ¯Â¡Àº ´Ù¸¥ ¹®¼­¿Í °°Àº ÀüÇüÀûÀÎ Á¾°áÇüÀÌ ¾øÀÌ ¡®êóÎ硯µîÀÇ ¿ë¾î°¡ ¸¹´Ù. µÑ°, ¥²Çü½Ä ÙþßöÀÇ Ò®é» : ¥²Çü½ÄÀÇ ¹®¼­´Â ËÜæÅùÓÊÛ µîÀÇ Àο밣¹®(1~15)¿¡¼­ ¾Ë ¼ö ÀÖµíÀÌ ½Ä·áÇ°À̳ª ±âŸ ºñÇ°ÀÇ Áö±Þ°ú ¼ö¼Û, ÇàÁ¤ÀûÀÎ »ç°ÇÀÇ ¿øÀαԸíÀ̳ª °æºñ°­È­ µî ÀÏ»óÀûÀÌ°í °æ¹ÌÇÑ °ø¹«¸¦ ÇÏ´ÞÇÏ´Â ³»¿ëÀÌ Áß½ÉÀÌ´Ù. ÀÌ·¯ÇÑ ¼­½ÄÀº ¡¶ùÓßö¡· µîÀÇ ±âÁ¸ ÞÈßö¿¡¼­µµ ±× Çü½ÄÀ» ¹ß°ßÇÒ ¼ö ÀÖÀ¸¸ç, ÁÖÀÇÇÒ Á¡Àº ÀÌ·¯ÇÑ Á¾·ùÀÇ ¹®¼­°¡ ´ëºÎºÐ ÊÛø¹º¸´Ù´Â Ôº¿¡ ±â·ÏµÇ¾î ÀÖÀ¸¸ç ¶§·Ð ±× ³»¿ëÀÌ ¾öÁßÇÑ °æ¿ì¿¡´Â ̬¿¡µµ ±â·ÏµÇ¾î ÀÖ´Ù´Â °ÍÀÌ´Ù. ¼Â°, ÎçÀÇ Ï¬áÖÕô¿¡ °üÇÑ ³»¿ëÀÌ´Ù. ÀϹÝÀûÀ¸·Î ¸í·ÉÀÌ °®´Â ±¸¼Ó·ÂÀº ¸í·ÉÀ» ¹ÝÆ÷ÇÏ´Â ÀÚÀÇ À¯¹«³ª ºÒÀÌÇà½Ã ±× ¹úÄ¢ÀÇ Á¤µµ¿¡ Á¿ìµÈ´Ù. ±× Á¡¿¡¼­ ¥²ÀÇ ¼­½Ä¿¡´Â ¹®¼­ÀÇ ¸»¹Ì¿¡ ³ª¸§ÀÇ ±¸¼Ó·ÂÀ» °®´Â Á¾°áÇüÀÌ ¾øÁö¸¸ ±× °¡¿îµ¥ ¾à ¹Ý¼ö¿¡ ¡®êóÎ硯¶ó´Â ¿ë¾î°¡ ÀÖ´Ù. ½ÇÁ¦ ¡®êóÎ硯´Â ëÏÖµÀÇ ðÉÙþó·³ ±¸Ã¼ÀûÀÎ ±¸¼Ó·ÂÀÌ ÀÖ´Â °Í °°Áö´Â ¾ÊÁö¸¸ ÇÑ´ë º¯°æÀÇ ±ºÁ¤°ü°è °£µ¶À̳ª ±âÁ¸ ÞÈßöÀÇ ¿ë·Ê(¡¶ç¤ôÑÖå¡·ðßá¡, ¡¶ùÓßö¡·Ïé76, 83, 89, ¡¶ý­ùÓßö¡·æêîî19, 31, 67, 71)¿¡¼­ º¸ÀÌ´Â ¡®Î硯, ȤÀº ¡®ÎçöÏ¡¯ µîÀÇ ¿ë·Ê´Â »ó´çÇÑ ±¸¼Ó·ÂÀÌ ÀÖ¾ú´ø °ÍÀ¸·Î º¸ÀδÙ.

[±¹³»³í¹®]

ÅؽºÆ® µ¥ÀÌÅÍ¿¡ ´ëÇÑ ´Ù¾çÇÑ ºÐ¼®À» À§ÇØ ÃÖ±Ù ºñÁ¤Çü ÅؽºÆ® µ¥ÀÌÅ͸¦ ±¸Á¶È­ÇÏ´Â ¹æ¾È¿¡ ´ëÇÑ ¿¬±¸°¡ È°¹ßÇÏ°Ô ÀÌ·ç¾îÁö°í ÀÖ´Ù. doc2VecÀ¸·Î ´ëÇ¥µÇ´Â ±âÁ¸ ¹®¼­ ÀÓº£µù ¹æ¹ýÀº ¹®¼­°¡ Æ÷ÇÔÇÑ ¸ðµç ´Ü¾î¸¦ »ç¿ëÇÏ¿© º¤Å͸¦ ¸¸µé±â ¶§¹®¿¡, ¹®¼­ º¤ÅÍ°¡ ÇÙ½É ´Ü¾î»Ó ¾Æ´Ï¶ó ÁÖº¯ ´Ü¾îÀÇ ¿µÇâµµ ÇÔ²² ¹Þ´Â´Ù´Â ÇÑ°è°¡ ÀÖ´Ù. ¶ÇÇÑ ±âÁ¸ ¹®¼­ ÀÓº£µù ¹æ¹ýÀº ÇϳªÀÇ ¹®¼­°¡ ÇϳªÀÇ º¤ÅͷΠǥÇöµÇ±â ¶§¹®¿¡, ´Ù¾çÇÑ ÁÖÁ¦¸¦ º¹ÇÕÀûÀ¸·Î °®´Â º¹ÇÕ ¹®¼­¸¦ Á¤È®ÇÏ°Ô »ç»óÇϱ⠾î·Æ´Ù´Â ÇѰ踦 °®´Â´Ù. º» ³í¹®¿¡¼­´Â ±âÁ¸ÀÇ ¹®¼­ ÀÓº£µùÀÌ °®´Â ÀÌ·¯ÇÑ µÎ °¡Áö ÇѰ踦 ±Øº¹Çϱâ À§ÇØ ´ÙÁß º¤ÅÍ ¹®¼­ ÀÓº£µù ¹æ¹ý·ÐÀ» »õ·Ó°Ô Á¦¾ÈÇÑ´Ù. ±¸Ã¼ÀûÀ¸·Î Á¦¾È ¹æ¹ý·ÐÀº Àüü ´Ü¾î°¡ ¾Æ´Ñ ÇÙ½É ´Ü¾î¸¸ ÀÌ¿ëÇÏ¿© ¹®¼­¸¦ º¤ÅÍÈ­ÇÏ°í, ¹®¼­°¡ Æ÷ÇÔÇÏ´Â ´Ù¾çÇÑ ÁÖÁ¦¸¦ ºÐÇØÇÏ¿© ÇϳªÀÇ ¹®¼­¸¦ ¿©·¯ º¤ÅÍÀÇ ÁýÇÕÀ¸·Î Ç¥ÇöÇÑ´Ù. KISS¿¡¼­ ¼öÁýÇÑ ÃÑ 3,147°³ÀÇ ³í¹®¿¡ ´ëÇÑ ½ÇÇèÀ» ÅëÇØ º¹ÇÕ ¹®¼­¸¦ ´ÜÀÏ º¤ÅͷΠǥÇöÇÏ´Â °æ¿ìÀÇ º¤ÅÍ ¿Ö°î Çö»óÀ» È®ÀÎÇÏ¿´À¸¸ç, º¹ÇÕ ¹®¼­¸¦ ÀǹÌÀûÀ¸·Î ºÐÇØÇÏ¿© ´ÙÁß º¤ÅÍ·Î ³ªÅ¸³»´Â Á¦¾È ¹æ¹ý·Ð¿¡ ÀÇÇØ ÀÌ·¯ÇÑ ¿Ö°î Çö»óÀ» º¸Á¤ÇÏ°í °¢ ¹®¼­¸¦ ´õ¿í Á¤È®ÇÏ°Ô ÀÓº£µùÇÒ ¼ö ÀÖÀ½À» È®ÀÎÇÏ¿´´Ù.

[±¹³»³í¹®]

[±¹³»³í¹®]

¸ðµç Á¶Á÷µéÀÌ ¿£ÅÍÇÁ¶óÀÌÁî ÄÜÅÙÃ÷ ¸Å´ÏÁö¸ÕÆ®(ECM)°¡ ÇÊ¿äÇÑ °ÍÀº ¾Æ´Ï´Ù. µµÅ¥·¦½º(Doculabs)´Â ÅëÇÕ¹®¼­°ü¸®(IDM)ÀÇ °³¿ä¿Í °¢Á¾ ºñÁî´Ï½º ¹®Á¦µéÀ» ÇØ°áÇÒ ¶§ÀÇ IDMÀÇ ¿ªÇÒ¿¡ ´ëÇØ ÀçÁ¶¸íÇغ»´Ù.

[±¹³»³í¹®]

À¥ ¹®¼­ Á¤º¸ ¼­ºñ½º´Â °ü¸®ÀÚÀÇ È¿À²Àû ¹®¼­°ü¸®¿Í »ç¿ëÀÚÀÇ ¹®¼­°Ë»ö ÆíÀǼºÀ» À§ÇØ ¹®¼­ ºÐ·ù ½Ã½ºÅÛÀ» ÇÊ¿ä·Î ÇÑ´Ù. ±âÁ¸ÀÇ ¹®¼­ ºÐ·ù ½Ã½ºÅÛÀº ºÐ·ùÇÏ°íÀÚ ÇÏ´Â ¹®¼­ ³» ¼±ÅÃµÈ ÀÚÁú¾îÀÇ °³¼ö°¡ Àû°Å³ª, ƯÁ¤ ¹üÁÖÀÇ ¹®¼­ ºñÀ²ÀÌ ³ô¾Æ ±× ¹üÁÖ¿¡¼­ ´ëºÎºÐÀÇ ÀÚÁú¾î°¡ ¼±ÅÃµÇ¾î ¸ðµ¨ÀÌ »ý¼ºµÈ °æ¿ì ºÐ·ù Á¤È®µµ°¡ ÀúÇϵǴ ¹®Á¦Á¡À» °¡Áø´Ù. ÀÌ·¯ÇÑ ¹®Á¦Á¡À» ÇØ°áÇϱâ À§ÇØ º» ³í¹®¿¡¼­´Â 'Modified ECCD' ±â¹ý ¹× '¹®¼­º° ¹üÁÖ °¡ÁßÄ¡' Ư¡ º¯¼ö¸¦ »ç¿ëÇÑ ¹®¼­ ºÐ·ù ½Ã½ºÅÛÀ» Á¦¾ÈÇÑ´Ù. ½ÇÇè °á°ú, Á¦¾È ¹æ¹ýÀÎ 'Modified ECCD' ±â¹ýÀÌ ${\chi}^2$ ¹× ECCD ±â¹ý¿¡ ºñÇØ ³ôÀº ºÐ·ù ¼º´ÉÀ» º¸¿´À¸¸ç, '¹®¼­º° ¹üÁÖ °¡ÁßÄ¡' Ư¡ º¯¼ö¸¦ 'Modified ECCD' ±â¹ýÀ¸·Î ¼±ÅÃµÈ ÀÚÁú¾î º¯¼ö¿¡ Ãß°¡ÇÏ¿© ÇнÀÇÏ¿´À» °æ¿ì¿¡ ´õ ³ôÀº ºÐ·ù ¼º´ÉÀ» º¸¿´´Ù.

[±¹³»³í¹®]

º» ¿¬±¸¿¡¼­´Â ±³·®ÀÇ ±¸Á¶°è»ê¼­¿Í °°ÀÌ ¿©·¯ Á¾·ùÀÇ ¸Ó¸®±âÈ£¸¦ »ç¿ëÇϸç Á¦¸ñÀÇ °èÃþ±¸Á¶°¡ º¹ÀâÇÑ Çü½ÄÀ» ¶ç´Â ¿£Áö´Ï¾î¸µ ¹®¼­ÀÇ ºñ±¸Á¶È­µÈ ÅؽºÆ® Á¤º¸¸¦ Á¦¸ñÀÇ °èÃþ ±¸Á¶¿¡ µû¸¥ Áر¸Á¶È­µÈ XML ¹®¼­·Î º¯È¯½ÃÅ°´Â ¹æ¹ýÀ» Á¦½ÃÇÑ´Ù. ÅؽºÆ® Á¤º¸·ÎºÎÅÍ Á¦¸ñÀÇ °èÃþ±¸Á¶¸¦ ÀÚµ¿À¸·Î ÃßÃâÇϱâ À§ÇØ ¹®¼­±¸Á¶ºÐ¼® ¹æ¹ýÀÇ ÇϳªÀÎ ¹®¼­±¸Á¶ÃßÃâ ±â¹ýÀ» ÀÌ¿ëÇÏ´Â ¹æ¹ýÀ» °³¹ßÇÏ¿´À¸¸ç, ƯÈ÷ °³Á¶½Ä ±¸¹®ÀÇ ½Äº°¹æ¹ýÀ» °³¹ßÇÏ¿© ±¸Á¶°è»ê¼­ ¹®¼­ °èÃþ±¸Á¶ÀÇ Á¦¸ñÃßÃâ°úÁ¤ ¹× °èÃþ±¸ºÐÀÇ Àüü Á¤È®µµ¸¦ Çâ»ó½Ãų ¼ö ÀÖ´Â ¹æ¹ýÀ» Á¦½ÃÇÏ¿´´Ù. Á¦½ÃµÈ ¹æ¹ý¿¡ µû¸¥ ÀÀ¿ë¸ðµâÀ» °³¹ßÇÏ¿´À¸¸ç, ÃÑ 40°³ÀÇ ±³·® ±¸Á¶°è»ê¼­¸¦ ´ë»óÀ¸·Î ±× ¼º´ÉÀ» Æò°¡ÇÏ¿´´Ù. ¸ÕÀú, 20°³ÀÇ °­°Å´õ »óºÎ ±¸Á¶°è»ê¼­¸¦ ´ë»óÀ¸·Î ¼±Çà ¿¬±¸°á°ú¿Í ºñ±³ÇÏ¿© º» ¿¬±¸¿¡¼­ °³¹ßµÈ ÀÀ¿ë¸ðµâÀÇ Á¤È®¼º°ú ½Å·Úµµ°¡ Çâ»óµÊÀ» º¸¿´´Ù. ¶ÇÇÑ, ´Ù¸¥ ±¸Á¶Çü½Ä¿¡ ´ëÇÑ ±¸Á¶°è»ê¼­ 20°³¿¡ ´ëÇÏ¿© °³¹ßµÈ ¸ðµâÀÇ Àû¿ë¼ºÀ» Æò°¡ÇÏ¿´´Ù. ±× °á°ú º» ¿¬±¸¿¡¼­ Á¦¾ÈÇÑ ¹æ¹ý¿¡ ÀÇÇÑ ¹®¼­ °èÃþ±¸Á¶ ºÐ¼®ÀÇ ÃÖÁ¾ Á¤È®µµ´Â Æò±Õ 99% ¼öÁØ ÀÌ»óÀ» ³ªÅ¸³»°í, Ç¥ÁØÆíÂ÷´Â 1.52·Î ³ªÅ¸³ª º» ¿¬±¸¿¡¼­ Á¦½ÃµÈ ¹æ¹ýÀÌ ´Ù¾çÇÑ Çü½ÄÀÇ ¸Ó¸®±âÈ£¸¦ »ç¿ëÇÏ¿© Á¦¸ñÀ» ±¸ºÐÇÏ´Â ¿©·¯ ¿£Áö´Ï¾î¸µ ¹®¼­¿¡µµ Àû¿ëÀÌ °¡´ÉÇÔÀ» º¸¿´´Ù.

[±¹³»³í¹®]

±âÁ¸ÀÇ ¹®¼­ ±ºÁýÈ­ ±â¹ý NSTCÀº ¹®¼­ ±ºÁýÈ­ °úÁ¤ ³»¿¡¼­ TF-IDF¸¦ ÀÌ¿ëÇÏ¿© ¹®¼­°£ À¯»çµµ¸¦ ÃøÁ¤ÇÑ´Ù. º» ³í¹®¿¡¼­´Â TF-IDF°¡ ¾Æ´Ñ, °øÅë PhraseÀÇ °ü°è ±×·¡ÇÁ¸¦ ÀÌ¿ëÇÑ »õ·Î¿î ¹®¼­°£ À¯»çµµ ÃøÁ¤À» Á¦¾ÈÇÑ´Ù. ÀÌ ¹æ¹ýÀº ¹®¼­ ÁýÇÕ ³»ÀÇ °øÅë PhraseµéÀÇ °ü°è¸¦ ³ªÅ¸³½ °ü°è ±×·¡ÇÁ¸¦ ÅëÇØ °øÅë PhraseÀÇ °¡ÁßÄ¡¸¦ ºÎ¿©ÇÏ´Â ¹æ¹ýÀ» Á¦½ÃÇÑ´Ù. ¶ÇÇÑ ½ÇÇèÀ» ÅëÇØ NSTC¿Í ºñ±³ÇÏ¿© º» ³í¹®¿¡¼­ Á¦¾ÈÇÑ ¹®¼­°£ À¯»çµµ ÃøÁ¤ ±â¹ýÀÌ ¹®¼­ ±ºÁýÈ­¿¡ ´õ¿í È¿°úÀûÀÓÀ» º¸¿´´Ù.

/ 825

Filters

º¸±âÇü½Ä

Á¤·Ä¼ø¼­

Æ÷¸Ë

¸®½ºÆ® ¼ö