HOME Ä¿¹Â´ÏƼ ÀÚÀ¯°Ô½ÃÆÇ
ÀÛ¼ºÀÚ | À̽°ü | ÀÛ¼ºÀÏ | 2020-12-04 |
---|---|---|---|
Á¦¸ñ | »ê¾÷Ä«¿î½½·¯ÀÇ ¿ªÇÒ°ú ±â´ë (167) : Text Language Processing | Á¶È¸¼ö | 1293 |
÷ºÎÆÄÀÏ | |||
ÅؽºÆ® ¾ð¾îó¸®(Text Language Processing) 1. ÀÇÀÇ ÀΰøÁö´É¿¡ ¾²ÀÌ´Â ¼ö¸¹Àº µ¥ÀÌÅÍ´Â Àΰ£ÀÇ ¸»À̳ª ±ÛÀÌ´Ù. ƯÈ÷ ¸¹Àº ¹®¼, ó¹æÀü, ½Å¹®´º½º µîÀº ÅؽºÆ®·Î ÀÛ¼ºµÇ¾î ÀÖ´Ù. ÀÌ·¯ÇÑ ÅؽºÆ®¸¦ ÀÎÅÍ³Ý °Ë»ö, À½¼ºÀÎ½Ä ½ºÇÇÄ¿, ½ºÆÔ¸ÞÀÏ ºÐ·ù µî¿¡ »ç¿ëÇÏ°í ÀÖ´Ù. 2. ³»¿ë ÀÚ¿¬¾î ÀΰøÁö´É´Â ÀϹÝÀûÀÎ ¼Ò¸®³ª À̹ÌÁö, ¿µ»ó µîÀÌ ¾Æ´Ñ ¾ð¾î·Î ±¸¼ºµÈ ´ëȳª ÅؽºÆ®·Î ÀÌ·ç¾îÁø µ¥ÀÌÅÍ°¡ ÁÖ¿ä ¼Ò½º´Ù. ÅؽºÆ® ¸¶ÀÌ´×°ú ÀÚ¿¬¾î ó¸®(Natural Language Processing/NLP)´Â ƯÈ÷ ÅؽºÆ®·Î ÀÛ¼ºµÈ µ¥ÀÌÅ͸¦ ó¸®ÇÏ´Â °ÍÀÌ´Ù. ÅؽºÆ® ¸¶ÀÌ´×Àº ÀÚ¿¬¾î ÀÔ·Â ÅؽºÆ®¸¦ ±¸Á¶ÈÇÏ°í, ÆÐÅÏÀ» ¹ß°ßÇϸç, »êÃâ °á°ú¹°À» Æò°¡ÇÏ°í Çؼ®Çϸç Àǹ̰¡ ÀÖ´Â Á¤º¸¸¦ »Ì¾Æ³»´Â ±â¹ýÀÌ°í, ÀÚ¿¬¾î ó¸®(NLP)´Â ÅؽºÆ®¸¦ »ç¿ëÇÏ¿© ±â°èÇнÀÀ» ÇÏ´Â ÀΰøÁö´É ¹æ½ÄÀÌ´Ù. 3. È¿°ú ÅؽºÆ®·Î µÈ ÀÚ¿¬¾î 󸮸¦ À§ÇÑ È帧Àº ÅäÅ«È(°¡Àå ÀÛÀº ¾ð¾î´ÜÀ§·Î ¹®Àå ³»ÀÇ ÅؽºÆ®¸¦ ¼ø¼´ë·Î ³ª´®), ¾î°£ ó¸®(stemming, »ç¶ûÇÏ´Â »ç¶û½º·¯¿î »ç¶ûÀ» ¹Þ´Â »ç¶ûÀ» ÁÖ·Á°í -> »ç¶ûÇÏ´Ù), Ç¥Á¦¾î ã±â(goes, went, gone -> go), Ç°»ç/ÇüÅÂ¼Ò ºÐ¼®(part-of-speech tagging, ¹®Àå ³»¿¡¼ Ç°»ç¸¦ ±¸ºÐ), °³Ã¼¸í ºÐ¼®(Named entity recognition), ÀçÁ¶ÇÕ(Chunking, °³º° Á¤º¸¸¦ ¸ð¾Æ¼ Çϳª·Î ÀçÁ¶ÇÕ)ÀÇ ÀÚ¿¬¾î ó¸®(NLP)°¡ °¡´ÉÇÏ°Ô µÈ´Ù. À̽°ü ¼º³²»ê¾÷´ÜÁö°ü¸®°ø´Ü ¼ö¼®Àü¹®À§¿ø °æ¿µÇÐ¹Ú»ç °æ¿µÁöµµ»ç »ê¾÷Ä«¿î½½·¯ 1±Þ ¼º³²ÇÏÀÌÅ×Å©¹ë¸® À¶ÇÕÇõ½Å±â¼úÁö¿ø¼¾ÅÍ °æ¿µÇõ½ÅºÐ°úÀ§¿øÀå |