Products & Solutions / Text Mining

SAS¢çText Miner¸¦ ÀÌ¿ëÇÑ ÅØ½ºÆ® ¸¶ÀÌ´×

ÅØ½ºÆ® Á¤º¸¿¡ ¼û¾î ÀÖ´Â °¡Ä¡¸¦ Àç¹ß°ßÇÏ´Â ¾ÆÁÖ Æ¯º°ÇÑ ¼Ö·ç¼Ç

SAS Text Miner´Â ÅØ½ºÆ® ¹®¼­¿¡¼­ À¯¿ëÇÑ Á¤º¸¸¦ ã¾Æ³»¾î ÃßÃâÇÒ ¼ö ÀÖµµ·Ï ÇÏ´Â µ¶Ã¢ÀûÀÎ Åø ½ºÀ§Æ®¸¦ Á¦°øÇÕ´Ï´Ù. ÀÌ ¼Ö·ç¼ÇÀº ÅØ½ºÆ® µ¥ÀÌÅ͸¦ ÀÌÇØÇϱ⠽±°í À¯¿ëÇÑ Çü½ÄÀ¸·Î º¯È¯ÇÔÀ¸·Î½á »ç¿ëÀÚ°¡ ¹®¼­ ºÐ·ù, ¹®¼­ °£ÀÇ ¿¬°ü¼º ÆÄ¾Ç, Ä«Å×°í¸®º° ¹®¼­ Ŭ·¯½ºÅ͸µÀ» ¿ëÀÌÇÏ°Ô ÇÒ ¼ö ÀÖµµ·Ï µµ¿ÍÁÝ´Ï´Ù. ÃÖÃÊÀÇ ¸¶ÀÌ´× ¼Ö·ç¼ÇÀÎ SAS Text Miner´Â ÅØ½ºÆ® ±â¹Ý Á¤º¸¸¦ ±¸Á¶È­µÈ µ¥ÀÌÅÍ¿Í ¿Ïº®ÇÏ°Ô ÅëÇÕÇÔÀ¸·Î½á ºÐ¼® ¹× ÀÇ»ç°áÁ¤ ´É·ÂÀ» ±Ø´ëÈ­ÇÕ´Ï´Ù.

µµÀÔ È¿°ú

  • ÀÇ»ç°áÁ¤¿¡ ¼Ò¿äµÇ´Â ½Ã°£À» ȹ±âÀûÀ¸·Î ´ÜÃàÇϰí Á¶Á÷ÀÇ ½Ã¾ß¸¦ ´õ¿í Åõ¸íÇÏ°Ô ÇØÁÝ´Ï´Ù.
  • Æ®·»µå¸¦ ÆÄ¾ÇÇÏ°í ºñÁî´Ï½º ±âȸ¸¦ ¿¹ÃøÇÒ ¼ö ÀÖ°Ô ÇØÁÝ´Ï´Ù.

ÀÚ¼¼È÷

ÁÖ¿ä Æ¯Â¡

  • ±¤¹üÀ§ÇÑ µ¥ÀÌÅÍ ¾×¼¼½º ´É·Â
  • ´Ù¾çÇÑ ¾ð¾î Áö¿ø
  • ÀÚü ¹®¼­È­°¡ °¡´ÉÇÑ ÀÎÅÍÆäÀ̽º
  • Á¾ÇÕÀûÀÎ ÅØ½ºÆ® Àüó¸® ´É·Â
  • ±¤¹üÀ§ÇÑ Æ¯¼º ÃßÃâ ´É·Â
  • Â÷¿ø Ãà¼Ò(Dimension Reduction) ±â¹ý
  • ÅØ½ºÆ® Ŭ·¯½ºÅ͸µ ¾Ë°í¸®Áò

ÀÚ¼¼È÷

" ÀÌó·³ ±¤¹üÀ§ÇÏ°í ±íÀÌ ÀÖ´Â Åë°è ±â´ÉÀ» Á¦°øÇÏ´Â ¼ÒÇÁÆ®¿þ¾î´Â óÀ½ÀÔ´Ï´Ù. ¡±

Patricia Cerrito ¹Ú»ç

¼öÇÐ ¹Ú»ç

·çÀ̺ô´ëÇб³

½ºÅ©¸°¼¦

ÅëÇÕ ºñÁî´Ï½º ÀÎÅÚ¸®Àü½º Ç÷§ÆûÀ» ÀÌ¿ëÇØ ¹®¼­ ´õ¹Ì¿¡ ¼û¾î Àִ Ưº°ÇÑ °¡Ä¡¸¦ ¹ß±¼Çس¿À¸·Î½á ¿¹Ãø ¸ðµ¨ÀÇ Á¤È®µµ¸¦ ȹ±âÀûÀ¸·Î ³ô¿©ÁÝ´Ï´Ù.

ÅëÇÕ ºñÁî´Ï½º ÀÎÅÚ¸®Àü½º Ç÷§ÆûÀ» ÀÌ¿ëÇØ ¹®¼­ ´õ¹Ì¿¡ ¼û¾î Àִ Ưº°ÇÑ °¡Ä¡¸¦ ¹ß±¼Çس¿
´õ ¸¹Àº ½ºÅ©¸°¼¦ º¸±âÈ®´ë À̹ÌÁö º¸±â
 

SAS¢ç ´Â ¾î¶»°Ô ´Ù¸¥°¡?

  • ´Ù±¹¾î·Î ÀÛ¼ºµÇ´Â ´Ù¾çÇÑ ¹®¼­ Çü½Ä(¿¹: PDF, ASCII, HTML, Microsoft Word, WordPerfect)À» Áö¿øÇÕ´Ï´Ù.
  • µ¶Ã¢ÀûÀÎ ÅëÇÕ ÀÎÅÍÆäÀ̽º¸¦ ä¿ëÇϰí ÀÖÀ¸¸ç, º¹¼öÀÇ °ü·Ã µ¥ÀÌÅͺ£À̽º(±¸Á¶È­ µ¥ÀÌÅÍ)¿Í ¿¬°èÇÏ¿© ÅØ½ºÆ®(ºñ±¸Á¶È­ µ¥ÀÌÅÍ)¸¦ ºÐ¼®ÇÕ´Ï´Ù.
  • Á¤±³ÇÑ ÅØ½ºÆ® ÆÄ½Ì ±â´ÉÀ» Á¦°øÇÕ´Ï´Ù.
  • µ¥ÀÌÅ͸¦ ÄÄÆÑÆ®Çϰí dzºÎÇÑ Á¤º¸°¡ ´ã±ä ±¸Á¶·Î º¯È¯½ÃÄÑ ÁÝ´Ï´Ù.
  • ´ëÈ­Çü °á°ú ºê¶ó¿ìÀú°¡ ÀÎÅÍ·¢Æ¼ºê ¹æ½ÄÀ¸·Î ¹®¼­ °£ÀÇ ¿¬°ü¼º°ú °³³äÀ» ºÐ¼®, µ¿ÀûÀ¸·Î ¼öÁ¤ÇÔÀ¸·Î½á Ãß°¡ÀÇ ¼¼ºÎ ºÐ¼®À» °¡´ÉÇÏ°Ô ÇØÁÝ´Ï´Ù.

µµÀÔ È¿°ú

  • ÀÇ»ç°áÁ¤¿¡ ¼Ò¿äµÇ´Â ½Ã°£À» ȹ±âÀûÀ¸·Î ´ÜÃàÇϰí Á¶Á÷ÀÇ ½Ã¾ß¸¦ ´õ¿í Åõ¸íÇÏ°Ô ÇØÁÝ´Ï´Ù. SAS Text Miner´Â ±¸Á¶È­ µ¥ÀÌÅÍ¿Í ºñ±¸Á¶È­ ÅØ½ºÆ®ÀÇ ÅëÇÕ, ±×¸®°í µ¥ÀÌÅÍ ºÐ¼® ÇÁ·Î¼¼½º ÀÚµ¿È­¸¦ ÅëÇØ Á¶Á÷ÀÌ ½É¿ÀÇÑ ÅëÂû·ÂÀ» È®º¸ÇÏ°í ºñÁî´Ï½º¸¦ ¼º°øÀûÀ¸·Î À̲ø ¼ö ÀÖµµ·Ï µµ¿ÍÁÝ´Ï´Ù.
  • Æ®·»µå¸¦ ÆÄ¾ÇÇÏ°í ºñÁî´Ï½º ±âȸ¸¦ ¿¹ÃøÇÒ ¼ö ÀÖ°Ô ÇØÁÝ´Ï´Ù. °í°´ ÀǰßÀ̳ª ÄÝ ¼¾ÅÍ ±â·Ï¿¡ °üÇÑ Á¤º¸ ºÐ¼®ÀÌ °í°´ ºÒ¸¸ ¶Ç´Â ¼­ºñ½º/Á¦Ç° ´ÏÁ ²ç¶Õ¾î º¼ ¼ö ÀÖ°Ô ÇÏ´Â ¾çÁúÀÇ Á¤º¸¸¦ Á¦°øÇØÁÝ´Ï´Ù. ¶ÇÇÑ SAS Text Miner´Â ´Ù¾çÇÑ ¿¹Ãø ¸ðµ¨¸µ ÅøÀ» Á¦°øÇϹǷΠ»ç¿ëÀÚ´Â Á¤È®ÇÑ ºÐ¼® ±âȸ¸¦ Æ÷ÂøÇÒ ¼ö ÀÖ½À´Ï´Ù.

ÁÖ¿ä Æ¯Â¡

±¤¹üÀ§ÇÑ µ¥ÀÌÅÍ ¾×¼¼½º ´É·Â
  • ´Ù¾çÇÑ ÅØ½ºÆ® µ¥ÀÌÅÍ Çü½Ä(PDF, È®Àå ASCII ÅØ½ºÆ®, HTML, Microsoft Word)À» Áö¿øÇÕ´Ï´Ù.
  • À¥ Å©·Î¿ï¸µ(Web Crawling) ±â´É.
  • ¸¶ÀÌ´× ÀÛ¾÷À» À§ÇØ ÅØ½ºÆ® µ¥ÀÌÅ͸¦ SAS µ¥ÀÌÅÍ ¼¼Æ®·Î ÃßÃâ, º¯È¯, ·ÎµùÇÕ´Ï´Ù.
´Ù¾çÇÑ ¾ð¾î Áö¿ø
  • Àüü Áö¿ø ¾ð¾î: µ§¸¶Å©¾î, ³×´ú¶õµå¾î, ¿µ¾î, Çɶõµå¾î, ÇÁ¶û½º¾î, µ¶ÀϾî, ÀÌÅ»¸®¾Æ¾î, ÀϺ»¾î, Çѱ¹¾î, ³ë¸£¿þÀ̾î(Bokmal), Æ÷¸£Åõ°¥¾î, ½ºÆäÀξî, ½º¿þµ§¾î, Áß±¹¾î ¹øÃ¼/°£Ã¼.
  • Latin-1, 2 Byte ¹®ÀÚ ¹× UTF-8 ÀÎÄÚµù Áö¿ø.
  • À¯·´¾î(Latin-1 ÀÎÄÚµù): µ§¸¶Å©¾î, ³×´ú¶õµå¾î, ¿µ¾î, Çɶõµå¾î, ÇÁ¶û½º¾î, µ¶ÀϾî, ÀÌÅ»¸®¾Æ¾î, ³ë¸£¿þÀ̾î(Bokmal), Æ÷¸£Åõ°¥¾î, ½ºÆäÀξî, ½º¿þµ§¾î.
  • µ¿¾Æ½Ã¾Æ ¾ð¾î(2 Byte ¹®ÀÚ Áö¿ø): ÀϺ»¾î, Çѱ¹¾î, Áß±¹¾î °£Ã¼/¹øÃ¼.
  • Unicode UTF-8 ÀÎÄÚµù Áö¿ø.
ÀÚü ¹®¼­È­°¡ °¡´ÉÇÑ ÀÎÅÍÆäÀ̽º
  • »ç¿ëÀÚ Ä£È­Àû ÀÎÅÍÆäÀ̽º°¡ ºñÁÖ¾ó ´ÙÀ̾î±×·¥À¸·Î ¼öµ¿ ÄÚµù ÀÛ¾÷ÀÇ Çʿ伺À» ÀϼҽÃÄÑ ÁÝ´Ï´Ù.
  • ÇÁ·Î¼¼½º Ç÷Π´ÙÀ̾î±×·¥¿¡ ´ëÇÑ ¼öÁ¤, ÀúÀå, °øÀ¯°¡ °¡´ÉÇÕ´Ï´Ù.
  • À¯¿¬ÇÑ ¸®Æ÷ÆÃ ±â´ÉÀÌ Áö¿øµÇ¹Ç·Î »ç¿ëÀÚ´Â °á°ú¹°À» °£°áÇÑ HTML Çü½ÄÀ¸·Î ³»º¸³¾ ¼ö ÀÖ½À´Ï´Ù.
Á¾ÇÕÀûÀÎ ÅØ½ºÆ® Àüó¸® ´É·Â
  • ¹®¼­ ´õ¹Ì¿¡¼­ ¼û°ÜÁ® ÀÖ´Â Áß¿ä Á¤º¸¸¦ ã¾Æ³»¾î ÃßÃâÇÕ´Ï´Ù.
  • °¢ ¾ð¾îº°·Î ±âº» ¶Ç´Â »ç¿ëÀÚÁ¤ÀÇ ºÒ¿ë¾î ¸®½ºÆ®°¡ Á¦°øµÇ¹Ç·Î »ç¿ëÀÚ´Â Á¤º¸ Â÷¿ø¿¡¼­ À¯¿ëÇÏÁö ¾ÊÀº ¿ë¾îµéÀ» Á¦°ÅÇÒ ¼ö ÀÖ½À´Ï´Ù.
  • ÀÚµ¿ öÀÚ ±³Á¤ ±â´É.
  • Stemming ±â´ÉÀ» ÀÌ¿ëÇÑ ¾î±Ù ÆÄ¾Ç.
  • ¹®Àå ÄÁÅØ½ºÆ® ±â¹ÝÀÇ Ç°»ç űë.
  • ±¸(Ï£) ´ÜÀ§ °³³ä(¿¹: "competitive intelligence") ÆÄ¾ÇÀ» À§ÇÑ ¸í»ç±¸ ÃßÃâ ±â´É.
  • »ç¿ëÀÚÁ¤ÀÇ ±â´ÉÀ» Áö¿øÇÏ´Â º¹ÇÕ¾î ÅäÅ«(¿¹: "point and click").
  • ±âº» µ¿ÀÇ¾î ¸ñ·Ï(»ç¿ëÀÚÁ¤ÀÇ ±â´É Áö¿ø)
  • ÇÕ¼º¾î¸¦ °³º° ÇÏÀ§ ¿ë¾î·Î ºÐ¸®.
±¤¹üÀ§ÇÑ Æ¯¼º ÃßÃâ ´É·Â
  • ±¤¹üÀ§ÇÑ »ç¿ëÀÚÁ¤ÀÇ µ¥ÀÌÅÍ »çÀü - Àθí, Á¦Ç°, Á¶Á÷, URL, ÁÖ¼Ò µî Ç׸ñº°·Î ƯÁ¤ Á¤º¸¸¦ ÃßÃâÇÒ ¼ö ÀÖ°Ô ÇØÁÝ´Ï´Ù.
  • ÃßÃâÇÑ Ç׸ñÀ» ÅëÀÏÇÏ¿© Çà·Ä Å×ÀÌºí¿¡ »ðÀÔÇÒ ¼ö ÀÖ½À´Ï´Ù.
  • ¿µ¾î, ÇÁ¶û½º¾î, µ¶ÀϾî, ½ºÆäÀÎ¾î ¾ð¾î·Î ¿£Æ¼Æ¼ ÃßÃâÀÌ °¡´ÉÇÕ´Ï´Ù.
Â÷¿ø Ãà¼Ò(Dimension Reduction) ±â¹ý
  • ÅØ½ºÆ® µ¥ÀÌÅ͸¦ Information-Rich(Á¤º¸°¡ dzºÎÇÑ) Çà·Ä·Î Àüó¸®ÇÒ ¼ö ÀÖÀ¸¸ç, À̸¦ °­·ÂÇÑ Â÷¿ø Ãà¼Ò ±â¹ý ¾ÖÇø®ÄÉÀ̼ǿ¡ Ȱ¿ëÇÒ ¼ö ÀÖ½À´Ï´Ù.
  • ·Ñ¾÷ ¿ë¾î°¡ ÀÚµ¿À¸·Î ¹®¼­¿¡¼­ n ÃÖ°í °¡ÁßÄ¡ ¿ë¾î¸¦ ½Äº°ÇØÁÝ´Ï´Ù.
  • SVD(Singular value decomposition)°¡ °¢ ¹®¼­¸¦ n-Â÷¿ø ºÎºÐ°ø°£À¸·Î º¯È¯ÇÏ¿© ÁÝ´Ï´Ù.
ÅØ½ºÆ® Ŭ·¯½ºÅ͸µ ¾Ë°í¸®Áò
  • °¢ ÄÜÅÙÆ®¸¦ ±â¹ÝÀ¸·Î ÇÏ´Â ±×·ì ¹®¼­.
  • EM(expectation-maximization) Ŭ·¯½ºÅ͸µ - °ø°£ Ŭ·¯½ºÅ͸µ ±â¹ýÀ» ÀÌ¿ëÇØ ¹®¼­¸¦ ±×·ìÈ­ÇÕ´Ï´Ù.
  • °èÃþÀû Ŭ·¯½ºÅ͸µ - WardÀÇ Áý±«¹ýÀ» ÀÌ¿ëÇØ ¹®¼­¸¦ ºÐ·ùÇÐÀûÀ¸·Î ÀÚµ¿ ±×·ìÈ­ÇÒ ¼ö ÀÖ½À´Ï´Ù. ÀÌ ¶§, °èÃþÀû Ŭ·¯½ºÅÍ·Î ±×·ìÈ­µÈ ¹®¼­µéÀº ÇϳªÀÇ ¸»´Ü ±ºÁý¿¡ ¼ÓÇÏ°Ô µË´Ï´Ù(±× »óÀ§ Ŭ·¯½ºÅÍ¿Í ¸¶Âù°¡Áö·Î).
  • K-means ¶Ç´Â SOM/Kohonen Ŭ·¯½ºÅ͸µÀ» ÀÌ¿ëÇØ Ŭ·¯½ºÅÍ ¹®¼­¸¦ Process Flow DiagramÀ¸·Î ´Ù¿î½ºÆ®¸²ÇÒ ¼ö ÀÖ½À´Ï´Ù.
  • ÇÁ·ÎÆÄÀÏ Å¬·¯½ºÅͰ¡ ¿øº» ¹®¼­ÀÇ Ãß°¡ ±¸Á¶È­ µ¥ÀÌÅÍ(¿¬·É, ±¸¸Å ¼ºÇâ µî)¸¦ ÀÌ¿ëÇÕ´Ï´Ù.

½ºÅ©¸°¼¦

ÅëÇÕ ºñÁî´Ï½º ÀÎÅÚ¸®Àü½º Ç÷§ÆûÀ» ÀÌ¿ëÇØ ¹®¼­ ´õ¹Ì¿¡ ¼û¾î Àִ Ưº°ÇÑ °¡Ä¡¸¦ ¹ß±¼Çس¿

ÅëÇÕ ºñÁî´Ï½º ÀÎÅÚ¸®Àü½º Ç÷§ÆûÀ» ÀÌ¿ëÇØ ¹®¼­ ´õ¹Ì¿¡ ¼û¾î Àִ Ưº°ÇÑ °¡Ä¡¸¦ ¹ß±¼Çس¿À¸·Î½á ¿¹Ãø ¸ðµ¨ÀÇ Á¤È®µµ¸¦ ȹ±âÀûÀ¸·Î ³ô¿©ÁÝ´Ï´Ù.

È®´ë À̹ÌÁö º¸±â

½Ã½ºÅÛ ¿ä±¸»ç¾ç

Ŭ¶óÀÌ¾ðÆ® È¯°æ
  • Windows(x86-32 ºñÆ®): Windows 2000 Professional, Windows XP Professional, Windows NT 4 Workstation
  • Internet Explorer 5.5 ¶Ç´Â 6
¼­¹ö ȯ°æ
  • AIX: ¸±¸®Áî 5.1, 5.2, 5.3(POWER)
  • Solaris(SPARC¿ë): ¹öÀü 8, 9, 10
  • Solaris(X64¿ë): ¹öÀü 10
  • Windows(x86-32 ºñÆ®): Windows NT 4 Server, Windows 2000 Professional, Windows Server 2003
ÇÊ¿äÇÑ ±âŸ ¼ÒÇÁÆ®¿þ¾î

±â¼ú ¿ä±¸»çÇ׿¡ °üÇÑ ÀÚ¼¼ÇÑ Á¤º¸´Â SAS ´ë¸®Á¡¿¡ Á÷Á¢ ¹®ÀÇÇϽñ⠹ٶø´Ï´Ù.

´õ ÀÚ¼¼ÇÑ ³»¿ëÀ» ¿øÇϼ¼¿ä?

°ü·Ã »ó¼¼ Á¤º¸´Â ¾Æ·¡ ¿¬¶ôó(SAS ÄÚ¸®¾Æ) ·Î ¹®ÀÇÇÏ¿© Áֽðųª ÀϹݹ®ÀÇ ÆäÀÌÁö¿¡ ¹®ÀÇÇÏ¿© ÁÖ¼¼¿ä.

´ëÇ¥ÀüÈ­ : 02-2191-7000
±³À°¹®ÀÇ : 02-2191-7002
±â¼ú¹®ÀÇ : 02-2191-7003