ÀÚÀ¯°Ô½ÃÆÇ

  HOME     Ä¿¹Â´ÏƼ     ÀÚÀ¯°Ô½ÃÆÇ

ÀÛ¼ºÀÚ À̽°ü ÀÛ¼ºÀÏ 2020-12-04
Á¦¸ñ »ê¾÷Ä«¿î½½·¯ÀÇ ¿ªÇÒ°ú ±â´ë (167) : Text Language Processing Á¶È¸¼ö 1284
÷ºÎÆÄÀÏ  


 

ÅؽºÆ® ¾ð¾îó¸®(Text Language Processing)

1. ÀÇÀÇ

ÀΰøÁö´É¿¡ ¾²ÀÌ´Â ¼ö¸¹Àº µ¥ÀÌÅÍ´Â Àΰ£ÀÇ ¸»À̳ª ±ÛÀÌ´Ù. ƯÈ÷ ¸¹Àº ¹®¼­, ó¹æÀü, ½Å¹®´º½º µîÀº ÅؽºÆ®·Î ÀÛ¼ºµÇ¾î ÀÖ´Ù. ÀÌ·¯ÇÑ ÅؽºÆ®¸¦ ÀÎÅÍ³Ý °Ë»ö, À½¼ºÀÎ½Ä ½ºÇÇÄ¿, ½ºÆÔ¸ÞÀÏ ºÐ·ù µî¿¡ »ç¿ëÇÏ°í ÀÖ´Ù.

2. ³»¿ë

ÀÚ¿¬¾î ÀΰøÁö´É´Â ÀϹÝÀûÀÎ ¼Ò¸®³ª À̹ÌÁö, ¿µ»ó µîÀÌ ¾Æ´Ñ ¾ð¾î·Î ±¸¼ºµÈ ´ëÈ­³ª ÅؽºÆ®·Î ÀÌ·ç¾îÁø µ¥ÀÌÅÍ°¡ ÁÖ¿ä ¼Ò½º´Ù. ÅؽºÆ® ¸¶ÀÌ´×°ú ÀÚ¿¬¾î ó¸®(Natural Language Processing/NLP)´Â ƯÈ÷ ÅؽºÆ®·Î ÀÛ¼ºµÈ µ¥ÀÌÅ͸¦ ó¸®ÇÏ´Â °ÍÀÌ´Ù.

ÅؽºÆ® ¸¶ÀÌ´×Àº ÀÚ¿¬¾î ÀÔ·Â ÅؽºÆ®¸¦ ±¸Á¶È­ÇÏ°í, ÆÐÅÏÀ» ¹ß°ßÇϸç, »êÃâ °á°ú¹°À» Æò°¡ÇÏ°í Çؼ®Çϸç Àǹ̰¡ ÀÖ´Â Á¤º¸¸¦ »Ì¾Æ³»´Â ±â¹ýÀÌ°í, ÀÚ¿¬¾î ó¸®(NLP)´Â ÅؽºÆ®¸¦ »ç¿ëÇÏ¿© ±â°èÇнÀÀ» ÇÏ´Â ÀΰøÁö´É ¹æ½ÄÀÌ´Ù.

3. È¿°ú

ÅؽºÆ®·Î µÈ ÀÚ¿¬¾î 󸮸¦ À§ÇÑ È帧Àº ÅäÅ«È­(°¡Àå ÀÛÀº ¾ð¾î´ÜÀ§·Î ¹®Àå ³»ÀÇ ÅؽºÆ®¸¦ ¼ø¼­´ë·Î ³ª´®), ¾î°£ ó¸®(stemming, »ç¶ûÇÏ´Â »ç¶û½º·¯¿î »ç¶ûÀ» ¹Þ´Â »ç¶ûÀ» ÁÖ·Á°í -> »ç¶ûÇÏ´Ù), Ç¥Á¦¾î ã±â(goes, went, gone -> go), Ç°»ç/ÇüÅÂ¼Ò ºÐ¼®(part-of-speech tagging, ¹®Àå ³»¿¡¼­ Ç°»ç¸¦ ±¸ºÐ), °³Ã¼¸í ºÐ¼®(Named entity recognition), ÀçÁ¶ÇÕ(Chunking, °³º° Á¤º¸¸¦ ¸ð¾Æ¼­ Çϳª·Î ÀçÁ¶ÇÕ)ÀÇ ÀÚ¿¬¾î ó¸®(NLP)°¡ °¡´ÉÇÏ°Ô µÈ´Ù.

À̽°ü ¼º³²»ê¾÷´ÜÁö°ü¸®°ø´Ü ¼ö¼®Àü¹®À§¿ø °æ¿µÇÐ¹Ú»ç °æ¿µÁöµµ»ç »ê¾÷Ä«¿î½½·¯ 1±Þ ¼º³²ÇÏÀÌÅ×Å©¹ë¸® À¶ÇÕÇõ½Å±â¼úÁö¿ø¼¾ÅÍ °æ¿µÇõ½ÅºÐ°úÀ§¿øÀå