Products & Solutions / Content Categorization

SAS® Content Categorization

ÀÚµ¿ ÄÜÅÙÆ® ºÐ·ù ±â´ÉÀ» ÀÌ¿ëÇÏ¿© Á¤º¸ ±¸¼º, ¾×¼¼½º, Ž»öÀÇ È¿À²¼º°ú ¼Óµµ¸¦ °³¼±ÇÕ´Ï´Ù.

Teragram ±â¼úÀÌ º¸°­µÈ SAS Content CategorizationÀº ÀÚ¿¬ ¾ð¾î ó¸® ¹× °í±Þ ¾ð¾î ±â¹ýÀ» ÅëÇØ ȹµæ »ý¼ºµÇ°Å³ª ¸®Æ÷ÁöÅ丮¿¡ Á¸ÀçÇÏ´Â ´ë¿ë·®ÀÇ ´Ù±¹¾î ÄÜÅÙÆ®¸¦ ÀÚµ¿À¸·Î ºÐ·ùÇØÁÝ´Ï´Ù. ÀÌ ¼Ö·ç¼ÇÀº ¿£Æ¼Æ¼¿Í À̺¥Æ®ÀÇ ÄÜÅÙÆ®¸¦ Á¤È®ÇÏ°Ô ÆÄ½Ì ºÐ¼®Çϸç, ÀÌ´Â ´Ù½Ã ¸ÞŸµ¥ÀÌÅ͸¦ »ý¼ºÇÏ°í ºñÁî´Ï½º ÇÁ·Î¼¼½º¸¦ ÃßÁøÇÏ´Â µ¥ »ç¿ëµË´Ï´Ù. µû¶ó¼­ »ç¿ëÀÚ´Â Á¤º¸ ±¸¼º, ¾×¼¼½º, Ž»öÀÇ ¼Óµµ¿Í È¿À²¼ºÀ» ³ôÀÏ ¼ö ÀÖÀ» »Ó ¾Æ´Ï¶ó ÄÜÅÙÆ® ºÐ·ù ÀÛ¾÷À¸·Î ÀÎÇØ ¹ß»ýÇÏ´Â °£Á¢ºñ¸¦ ȹ±âÀûÀ¸·Î ÁÙÀÏ ¼ö ÀÖ½À´Ï´Ù.

µµÀÔ È¿°ú

  • º¹¼öÀÇ ±â¾÷ ¸®Æ÷ÁöÅ丮¿¡ »êÀçµÈ ÄÜÅÙÆ®ÀÇ È¥ÀâÀ» ÀϼÒÇÕ´Ï´Ù.
  • »ç¿ëÀÚ°¡ ÇÊ¿äÇÑ Á¤º¸¸¦ ½Å¼ÓÈ÷ ãÀ» ¼ö ÀÖµµ·Ï ÇØÁÝ´Ï´Ù.

ÀÚ¼¼È÷

ÁÖ¿ä Æ¯Â¡

  • Åüҳë¹Ì(ºÐ·ù±â¹ý) »ý¼º
  • Ä«Å×°í¸® ºÐ·ù
  • ¿£Æ¼Æ¼ ÃßÃâ
  • 30¿© °¡Áö ÀÌ»óÀÇ ¾ð¾î Áö¿ø
  • Çù¾÷

ÀÚ¼¼È÷

½ºÅ©¸°¼¦

SAS Content CategorizationÀÌ ¿£Æ¼Æ¼¿Í À̺¥Æ® ÄÜÅÙÆ®¸¦ ÆÄ½Ì ºÐ¼®ÇÕ´Ï´Ù. ±×¸®°í ÀÌ´Â ´Ù½Ã ¸ÞŸµ¥ÀÌÅ͸¦ »ý¼ºÇÏ°í ºñÁî´Ï½º ÇÁ·Î¼¼½º¸¦ ÃßÁøÇÏ´Â µ¥ »ç¿ëµË´Ï´Ù.

SAS Content CategorizationÀÌ ¿£Æ¼Æ¼¿Í À̺¥Æ® ÄÜÅÙÆ®¸¦ ÆÄ½Ì, ºÐ¼®ÇÕ´Ï´Ù
´õ ¸¹Àº ½ºÅ©¸°¼¦ º¸±âÈ®´ë À̹ÌÁö º¸±â
 

SAS¢ç´Â ¾î¶»°Ô ´Ù¸¥°¡?

  • Teragram ±â¼úÀÌ º¸°­µÈ SAS Content CategorizationÀº ´ë¿ë·®ÀÇ ÄÜÅÙÆ®¸¦ ó¸®ÇÏ°í ¼öÀÛ¾÷ÀÌ ¿ä±¸µÇ´Â °úµµÇÑ ÄÜÅÙÆ® űë ÀÛ¾÷À» »ý·«ÇÔÀ¸·Î½á Á¤º¸ ±¸¼º ¹× ¾×¼¼½ºÀÇ ¼Óµµ¿Í È¿À²¼ºÀ» ³ô¿©ÁÝ´Ï´Ù.
  • °í±Þ ¾ð¾î ¹× ÀÚ¿¬ ¾ð¾î ó¸® ±â¹ýÀ» Ȱ¿ëÇÏ´Â SAS Content CategorizationÀº 30¿© °¡Áö°¡ ³Ñ´Â ¾ð¾îÀÇ Ç°»ç¸¦ ÀÎ½Ä ºÐ¼®ÇÔÀ¸·Î½á ´Ù±¹¾î ÄÜÅÙÆ®¸¦ º¸´Ù È¿°úÀûÀ¸·Î °ü¸®ÇÒ ¼ö ÀÖ°Ô ÇØÁÝ´Ï´Ù.
  • SAS¸¦ ÀÌ¿ëÇϸé ÄÜÅÙÆ® ÀÚ»êÀ» ÃÖ´ëÇÑ È°¿ëÇÒ ¼ö ÀÖÀ» »Ó¸¸ ¾Æ´Ï¶ó ÄÜÅÙÆ® ¼ÒÀ¯ÀÚ³ª Ãâó¿¡ °ü°è¾øÀÌ ´Ù¾çÇÑ ºÎ¼­ÀÇ ¸®Æ÷ÁöÅ丮¿¡¼­ Àç»ç¿ëÀÌ °¡´ÉÇÕ´Ï´Ù.

µµÀÔ È¿°ú

  • º¹¼öÀÇ ±â¾÷ ¸®Æ÷ÁöÅ丮¿¡ »êÀçµÈ ÄÁÅÙÆ®ÀÇ È¥ÀâÀ» ÀϼÒÇÕ´Ï´Ù. ±â¾÷ Á¤º¸´Â ¼­·Î ´Ù¸¥ À¯ÇüÀÇ µ¥ÀÌÅÍ, ½ºÅ丮Áö, Ư¡ µî¿¡ ±Ù°ÅÇØ »çÀϷο¡¼­ °ü¸®µÇ´Â °æ¿ì°¡ ´ëºÎºÐÀÔ´Ï´Ù. ÇÏÁö¸¸ ÄÜÅÙÆ®°¡ ƯÁ¤ÇÑ À¯¿ë¼ºÀ» Áö´Ò ¼ö ÀÖÀ¸·Á¸é ¹Ýµå½Ã ÀÚµ¿È­µÈ ÄÜÅÙÆ® ºÐ·ù ±â´ÉÀ» ÅëÇØ ÅëÇÕ, ±¸¼º, °ü¸®µÇ¾î¾ß ÇÕ´Ï´Ù. SAS Content CategorizationÀº °íÀ¯ÀÇ ½Äº° Á¶°Ç¿¡ ´ëÇØ ¾ð¾î ±ÔÄ¢À» Àû¿ëÄÉ ÇÏ´Â À¯¿¬¼º°ú Ä«Å×°í¸® ±ÔÄ¢À» Á¤ÀÇÇØÁÙ »Ó ¾Æ´Ï¶ó ÇØ´ç ±ÔÄ¢¿¡ ÀÏÄ¡ÇÏ´Â ¹®¼­¸¦ ºÐ·ùÇÏ´Â ´É·ÂÀ» Á¦°øÇϹǷΠ»ç¿ëÀÚ´Â ÄÜÅÙÆ® ºÐ·ù ÀÛ¾÷ÀÇ °£Á¢ºñ¸¦ ȹ±âÀûÀ¸·Î ÁÙÀÏ ¼ö ÀÖ½À´Ï´Ù.
  • ÇÊ¿äÇÑ Á¤º¸¸¦ ½Å¼ÓÈ÷ ãÀ» ¼ö ÀÖ½À´Ï´Ù. ÆÄÀδõºô¸®Æ¼(findability)´Â ¾ðÁ¦ ¾îµð¼­µç ÇÊ¿äÇÑ Á¤º¸¸¦ ãÀ» ¼ö ÀÖ´Â ´É·ÂÀ» ¸»ÇÕ´Ï´Ù. È¿°úÀûÀÎ ÆÄÀδõºô¸®Æ¼¶ó¸é ¹®¸Æ ¼Ó¿¡¼­ ÄÜÅÙÆ®¸¦ °Ë»öÇÏ°í »ç¿ëÀÚ¿Í ÄÜÅÙÆ® °£¿¡ Á÷°üÀûÀÎ »óÈ£ÀÛ¿ëÀÌ ÀÌ·ç¾îÁú ¼ö ÀÖµµ·Ï ÇØ¾ß Çϴµ¥, ¿©±â¿¡´Â ´Ù¾çÇÑ ¸ÂÃãÇü °Ë»ö ±â¹ý°ú ÇʼöÀûÀÎ º¸¾È ±â´ÉÀÌ Æ÷ÇԵ˴ϴÙ. SAS Content CategorizationÀº ´ë¿ë·®ÀÇ ÄÜÅÙÆ®¸¦ ó¸®ÇÏ°í ¼öÀÛ¾÷À¸·Î ÀÌ·ç¾îÁö´Â °úµµÇÑ ÄÜÅÙÆ® űë ÀÛ¾÷À» »ý·«ÇÔÀ¸·Î½á Á¤º¸ ±¸¼º ¹× ¾×¼¼½ºÀÇ ¼Óµµ¿Í È¿À²¼ºÀ» ³ô¿©ÁÝ´Ï´Ù..

ÁÖ¿ä Æ¯Â¡

Åüҳë¹Ì(ºÐ·ù±â¹ý) »ý¼º
  • Á÷°üÀû ÀÎÅÍÆäÀ̽º Åüҳë¹Ì °³¹ß. ±×¸®°í Åüҳë¹Ì ³ëµå ±¸ºÐÀ» À§ÇÑ Ä«Å×°í¸® ±ÔÄ¢/°³³ä Á¤ÀÇ »ý¼º.
  • »ý¼ºµÈ Ä«Å×°í¸®¿Í °³³äÀ» ´ë·®ÀÇ ÀÔ·Â ¹®¼­¿¡ Àû¿ëÇÏ´Â ¹«Á¦ÇÑÀÇ Åüҳë¹Ì ³ëµå.
  • °ü·Ã ÁÖÁ¦µéÀ» Çϳª·Î ¹­¾îÁÖ´Â °èÃþ(hierarchical) Åüҳë¹Ì, ¶Ç´Â Åüҳë¹Ì Æ®¸®ÀÇ ³ëµåµé °£¿¡ °ü·Ã¼ºÀÌ Á¸ÀçÇÏÁö ¾Ê´Â ¼öÆò(flat) Åüҳë¹ÌÀÇ °³¹ß.
  • ¾ð·Ð/ÃâÆÇ ±â°ü, µµ¼­°ü ¹× ±â¾÷À» À§ÇØ »çÀü ±¸¼ºµÈ Åüҳë¹Ì.
  • Åüҳë¹Ì ¼­ºñ½º¿¡´Â ´ÙÀ½ Ç׸ñÀÌ Æ÷ÇԵ˴ϴÙ:
    • ¸ÞŸµ¥ÀÌÅÍ »ý¼º ¹× °³¹ß ºÐ¼®À» À§ÇÑ Æ©Å丮¾ó.
    • Åüҳë¹Ì »ý¼º, ¹®¼­ ºÐ·ù¸¦ À§ÇÑ ±ÔÄ¢, ±×¸®°í ¿£Æ¼Æ¼ ÃßÃâÀ» À§ÇÑ Á¤ÀÇ µî°ú °ü·ÃµÈ ¼­ºñ½º.
    • ÀÛ¾÷ È帧 ºÐ¼® ¹× ±¸ÇöÀ» Æ÷ÇÔÇÏ´Â ÅëÇÕ ¿ä±¸»çÇ×.
    • °¢ °í°´ÀÇ È¯°æ¿¡¼­ ¼öÇàµÇ´Â º¥Ä¡¸¶Å© ¹× ¾²·çDz ºÐ¼®.
    • ÅõÀÚ¼öÀÍ·ü(ROI) ºÐ¼®.
Ä«Å×°í¸® ºÐ·ù
  • ±ÔÄ¢¿¡ ÀÏÄ¡ÇÏ´Â ¹®¼­´Â Æ÷ÇÔ½Ã۰í ÀÏÄ¡ÇÏÁö ¾Ê´Â ÅØ½ºÆ®´Â Á¦¿Ü½ÃŰ´Â Ä«Å×°í¸® ±ÔÄ¢ Á¤ÀÇ.
  • ÀÚ¿¬ ¾ð¾î ó¸® ¹× °í±Þ ¾ð¾î ±â¼úÀ» ÀÚµ¿À¸·Î Àû¿ëÇÏ¿© ÁÖ¿ä Á¤º¸¸¦ ºÐ·ù ½Äº°.
  • Á¤È®¼º Çâ»ó¿¡ µµ¿òÀÌ µÇ´Â ¾ð¾î ±ÔÄ¢ ¹× ºÎ¿ï(Boolean) ¿¬»êÀÚ.
  • ´Ü¼øÇϰųª º¹ÀâÇÑ Ä«Å×°í¸® ±ÔÄ¢ ¹× °³³ä Á¤ÀÇÀÇ »ý¼º.
  • °¢ Ä«Å×°í¸® ±ÔÄ¢¿¡ ´ëÇØ °íÀ¯ÇÑ ½Äº° Á¶°ÇÀÇ ¸ñ·Ï »ý¼º.
  • º¸´Ù °í±ÞÀÇ ¸â¹ö½Ê ¿ä±¸»çÇ×À» »ý¼ºÇϱâ À§ÇÑ °¡Áß ¼±º° Á¶°Ç ¶Ç´Â Ä«Å×°í¸®.
  • ¹èÄ¡(batch), Àüü ¶Ç´Â ÄÜÅÙÆ® ±¸¼º¿ä¼Ò¿¡ Àû¿ëµÇ´Â ±ÔÄ¢°ú Á¤ÀǸ¦ °ËÁõÇϱâ À§ÇÑ Å×½ºÆ®¿Í ¹®¼­ ÀÎÅÍÆäÀ̽º.
  • C, C++, C#.NET, Java, Perl, Python µîÀÇ Å¬¶óÀÌ¾ðÆ® API¸¦ ÅëÇØ µé¾î¿À´Â ÅØ½ºÆ®¿¡ ±ÔÄ¢°ú Á¤ÀǸ¦ ÀÚµ¿À¸·Î Àû¿ë.
¿£Æ¼Æ¼ ÃßÃâ
  • ¹æ´ëÇÑ ¾çÀÇ Á¤º¸¸¦ ÀÌÇØÇϱ⠽¬¿î ¼Ò·®ÀÇ Á¤º¸·Î ÃßÃâ.
  • °ü·Ã µ¥ÀÌÅÍÀÇ °Ë»ö °úÁ¤À» °£¼ÒÈ­½ÃÄÑ ÁÖ´Â »çÀü ±â¹Ý, ¹®¹ý ±â¹Ý, Á¤±Ô½Ä(regular expression) ±â¹ÝÀÇ °³³ä.
  • º¹ÀâÇÑ Á¤º¸ ŽºÅ© ¼öÇàÀ» À§ÇÑ Á÷°üÀû GUI.
  • ´ë·®ÀÇ ´Ù±¹¾î ÄÜÅÙÆ®¿¡ ´ëÇÑ ¸ÂÃãÇü ºÐ·ù ¹× ¿£Æ¼Æ¼ Àû¿ë ÀÚµ¿È­.
30¿© °¡Áö ÀÌ»óÀÇ ¾ð¾î Áö¿ø
  • ¾ð¾î Åø: º» ¼Ö·ç¼ÇÀÇ °í±Þ ¾ð¾î ±â¼úÀÌ Áö¿øÇÏ´Â ±â´ÉÀº ´ÙÀ½°ú °°½À´Ï´Ù:
    • ǰ»ç ÀÎ½Ä ¹× űë: ¸í»ç, µ¿»ç, Çü¿ë»ç µî ÀνÄ.
    • ½ºÅ×¹Ö(Stemming): ´Ù¾çÇÑ ÇüÅÂÀÇ ÀÔ·Â ¸í»ç ¶Ç´Â µ¿»ç¸¦ °Ë»ö.
    • ´ë¼Ò¹®ÀÚ ±¸ºÐ: °³³ä¿¡ ´ëÇÑ ´ë¹®ÀÚ/¼Ò¹®ÀÚ ÀνÄ.
  • °Ô¸£¸¸¾î¿Í ¾Æ½Ã¾Æ ¾ð¾î¸¦ À§ÇÑ º¹ÇÕ¾î ÀÎ½Ä ¹× ºÐ¼®.
  • ¾Æ½Ã¾Æ ¾ð¾î¸¦ À§ÇÑ ºÐÀý ±â´É.
Çù¾÷
  • °³ÀÎ ¶Ç´Â ÆÀ ´ÜÀ§·Î ÀÛ¾÷À» ¼öÇàÇÏ´Â ºÐ·ùÇÐÀÚ(taxonomist)¿Í °³¹ßÀÚ°¡ ¾ÈÀüÇÏ°Ô ÇÁ·ÎÁ§Æ®¿¡ ¾×¼¼½ºÇÒ ¼ö ÀÖ½À´Ï´Ù.
  • º¹¼ö »ç¿ëÀÚ°¡ °³¹ßÁßÀÎ ÇÁ·ÎÁ§Æ®¿¡ ¾×¼¼½ºÇÒ ¼ö ÀÖ½À´Ï´Ù.
  • Çã°¡ ·¹º§¿¡´Â Àбâ, ¾²±â, Ä«Å×°í¸® ±ÔÄ¢ ¹× °³³ä Á¤Àǰ¡ Æ÷ÇԵ˴ϴÙ.

½ºÅ©¸°¼¦

SAS Content CategorizationÀÌ ¿£Æ¼Æ¼¿Í À̺¥Æ® ÄÜÅÙÆ®¸¦ ÆÄ½Ì, ºÐ¼®ÇÕ´Ï´Ù

SAS Content Categorization ¼Ö·ç¼ÇÀº ¿£Æ¼Æ¼¿Í À̺¥Æ®ÀÇ ÄÁÅÙÆ®¸¦ Á¤È®ÇÏ°Ô ÆÄ½Ì ºÐ¼®ÇÕ´Ï´Ù. ±×¸®°í ÀÌ´Â ´Ù½Ã ¸ÞŸµ¥ÀÌÅ͸¦ »ý¼ºÇÏ°í ºñÁî´Ï½º ÇÁ·Î¼¼½º¸¦ ÃßÁøÇÏ´Â µ¥ »ç¿ëµË´Ï´Ù. ¶ÇÇÑ Á÷°üÀûÀÎ GUI°¡ ¸ÞŸµ¥ÀÌÅ͸¦ ¼Õ½±°Ô Á¤ÀÇ Å×½ºÆ®ÇÒ ¼ö ÀÖ°Ô ÇØÁÝ´Ï´Ù. ±×¸²¿¡¼­ º¸µíÀÌ ¸ÞŸµ¥ÀÌÅÍ¿Í ÀÏÄ¡ÇÏ´Â ¾îÈÖ°¡ Àû»öÀ¸·Î °­Á¶ Ç¥½ÃµË´Ï´Ù.

È®´ë À̹ÌÁö º¸±â

½Ã½ºÅÛ ¿ä±¸»ç¾ç

Teragram ±â¼úÀÌ º¸°­µÈ SAS Content CategorizationÀº ´Ù¸¥ SAS ¸ðµâÀÌ ÇÊ¿äÄ¡ ¾ÊÀº µ¶¸³Çü Á¦Ç°ÀÔ´Ï´Ù.

Ŭ¶óÀÌ¾ðÆ® È¯°æ
  • Microsoft Windows(x86-32ºñÆ®): Windows 2000 Professional, Windows XP Professional, Windows Vista*, Windows Server 2003 °è¿­

¼­¹ö ȯ°æ
  • AIX: POWER ¾ÆÅ°ÅØÃ³¿ë ¹öÀü 4.3(x86-32ºñÆ®), ¹öÀü 5.3 ¹× 6.1(x64)
  • FreeBSD 4.8(x86-32ºñÆ®) ¹× 6.0(x64)
  • HP-UX PA-RISC: HP-UX 11iv2 (11.23), 11iv3 (11.31)
  • HP-UX Itanium: HP-UX 11iv2 (11.23), 11iv3 (11.31)
  • Linux(x86-32ºñÆ®): RHEL 4, SuSE SLES 9
  • Linux(x64¿ë, EM64T/AMD64): RHEL 4, SuSE SLES 9
  • Macintosh: Mac OS X 10.4.8 ÀÌ»ó
  • Microsoft Windows(x86-32ºñÆ®): Windows 2000, Windows XP Professional, Windows Server 2003, Windows Vista*
  • Microsoft Windows(64ºñÆ®¿ë, EM64T/AMD64): Windows XP Professional, Windows Vista*, Windows Server 2003(64ºñÆ®¿ë)
  • Solaris(SPARC¿ë): ¹öÀü 6, 8, 9, 10
  • Solaris(X64¿ë): ¹öÀü 8,10

*ÁÖ: Áö¿øµÇ´Â Windows Vista Editions¿¡´Â Enterprise, Business ¹× Ultimate°¡ Æ÷ÇԵǾî ÀÖ½À´Ï´Ù.

´õ ÀÚ¼¼ÇÑ ³»¿ëÀ» ¿øÇϼ¼¿ä?

°ü·Ã »ó¼¼ Á¤º¸´Â ¾Æ·¡ ¿¬¶ôó(SAS ÄÚ¸®¾Æ) ·Î ¹®ÀÇÇÏ¿© Áֽðųª ÀϹݹ®ÀÇ ÆäÀÌÁö¿¡ ¹®ÀÇÇÏ¿© ÁÖ¼¼¿ä.

´ëÇ¥ÀüÈ­ : 02-2191-7000
±³À°¹®ÀÇ : 02-2191-7002
±â¼ú¹®ÀÇ : 02-2191-7003