SAS® Content Categorization
ÀÚµ¿ ÄÜÅÙÆ® ºÐ·ù ±â´ÉÀ» ÀÌ¿ëÇÏ¿© Á¤º¸ ±¸¼º, ¾×¼¼½º, Ž»öÀÇ È¿À²¼º°ú ¼Óµµ¸¦ °³¼±ÇÕ´Ï´Ù.
µµÀÔ È¿°ú
- º¹¼öÀÇ ±â¾÷ ¸®Æ÷ÁöÅ丮¿¡ »êÀçµÈ ÄÜÅÙÆ®ÀÇ È¥ÀâÀ» ÀϼÒÇÕ´Ï´Ù.
- »ç¿ëÀÚ°¡ ÇÊ¿äÇÑ Á¤º¸¸¦ ½Å¼ÓÈ÷ ãÀ» ¼ö ÀÖµµ·Ï ÇØÁÝ´Ï´Ù.
½ºÅ©¸°¼¦
SAS Content CategorizationÀÌ ¿£Æ¼Æ¼¿Í À̺¥Æ® ÄÜÅÙÆ®¸¦ ÆÄ½Ì ºÐ¼®ÇÕ´Ï´Ù. ±×¸®°í ÀÌ´Â ´Ù½Ã ¸ÞŸµ¥ÀÌÅ͸¦ »ý¼ºÇÏ°í ºñÁî´Ï½º ÇÁ·Î¼¼½º¸¦ ÃßÁøÇÏ´Â µ¥ »ç¿ëµË´Ï´Ù.
´õ ¸¹Àº ½ºÅ©¸°¼¦ º¸±âÈ®´ë À̹ÌÁö º¸±âSAS¢ç´Â ¾î¶»°Ô ´Ù¸¥°¡?
- Teragram ±â¼úÀÌ º¸°µÈ SAS Content CategorizationÀº ´ë¿ë·®ÀÇ ÄÜÅÙÆ®¸¦ ó¸®ÇÏ°í ¼öÀÛ¾÷ÀÌ ¿ä±¸µÇ´Â °úµµÇÑ ÄÜÅÙÆ® űë ÀÛ¾÷À» »ý·«ÇÔÀ¸·Î½á Á¤º¸ ±¸¼º ¹× ¾×¼¼½ºÀÇ ¼Óµµ¿Í È¿À²¼ºÀ» ³ô¿©ÁÝ´Ï´Ù.
- °í±Þ ¾ð¾î ¹× ÀÚ¿¬ ¾ð¾î ó¸® ±â¹ýÀ» Ȱ¿ëÇÏ´Â SAS Content CategorizationÀº 30¿© °¡Áö°¡ ³Ñ´Â ¾ð¾îÀÇ Ç°»ç¸¦ ÀÎ½Ä ºÐ¼®ÇÔÀ¸·Î½á ´Ù±¹¾î ÄÜÅÙÆ®¸¦ º¸´Ù È¿°úÀûÀ¸·Î °ü¸®ÇÒ ¼ö ÀÖ°Ô ÇØÁÝ´Ï´Ù.
- SAS¸¦ ÀÌ¿ëÇϸé ÄÜÅÙÆ® ÀÚ»êÀ» ÃÖ´ëÇÑ È°¿ëÇÒ ¼ö ÀÖÀ» »Ó¸¸ ¾Æ´Ï¶ó ÄÜÅÙÆ® ¼ÒÀ¯ÀÚ³ª Ãâó¿¡ °ü°è¾øÀÌ ´Ù¾çÇÑ ºÎ¼ÀÇ ¸®Æ÷ÁöÅ丮¿¡¼ Àç»ç¿ëÀÌ °¡´ÉÇÕ´Ï´Ù.
µµÀÔ È¿°ú
- º¹¼öÀÇ ±â¾÷ ¸®Æ÷ÁöÅ丮¿¡ »êÀçµÈ ÄÁÅÙÆ®ÀÇ È¥ÀâÀ» ÀϼÒÇÕ´Ï´Ù. ±â¾÷ Á¤º¸´Â ¼·Î ´Ù¸¥ À¯ÇüÀÇ µ¥ÀÌÅÍ, ½ºÅ丮Áö, Ư¡ µî¿¡ ±Ù°ÅÇØ »çÀϷο¡¼ °ü¸®µÇ´Â °æ¿ì°¡ ´ëºÎºÐÀÔ´Ï´Ù. ÇÏÁö¸¸ ÄÜÅÙÆ®°¡ ƯÁ¤ÇÑ À¯¿ë¼ºÀ» Áö´Ò ¼ö ÀÖÀ¸·Á¸é ¹Ýµå½Ã ÀÚµ¿ÈµÈ ÄÜÅÙÆ® ºÐ·ù ±â´ÉÀ» ÅëÇØ ÅëÇÕ, ±¸¼º, °ü¸®µÇ¾î¾ß ÇÕ´Ï´Ù. SAS Content CategorizationÀº °íÀ¯ÀÇ ½Äº° Á¶°Ç¿¡ ´ëÇØ ¾ð¾î ±ÔÄ¢À» Àû¿ëÄÉ ÇÏ´Â À¯¿¬¼º°ú Ä«Å×°í¸® ±ÔÄ¢À» Á¤ÀÇÇØÁÙ »Ó ¾Æ´Ï¶ó ÇØ´ç ±ÔÄ¢¿¡ ÀÏÄ¡ÇÏ´Â ¹®¼¸¦ ºÐ·ùÇÏ´Â ´É·ÂÀ» Á¦°øÇϹǷΠ»ç¿ëÀÚ´Â ÄÜÅÙÆ® ºÐ·ù ÀÛ¾÷ÀÇ °£Á¢ºñ¸¦ ȹ±âÀûÀ¸·Î ÁÙÀÏ ¼ö ÀÖ½À´Ï´Ù.
- ÇÊ¿äÇÑ Á¤º¸¸¦ ½Å¼ÓÈ÷ ãÀ» ¼ö ÀÖ½À´Ï´Ù. ÆÄÀδõºô¸®Æ¼(findability)´Â ¾ðÁ¦ ¾îµð¼µç ÇÊ¿äÇÑ Á¤º¸¸¦ ãÀ» ¼ö ÀÖ´Â ´É·ÂÀ» ¸»ÇÕ´Ï´Ù. È¿°úÀûÀÎ ÆÄÀδõºô¸®Æ¼¶ó¸é ¹®¸Æ ¼Ó¿¡¼ ÄÜÅÙÆ®¸¦ °Ë»öÇÏ°í »ç¿ëÀÚ¿Í ÄÜÅÙÆ® °£¿¡ Á÷°üÀûÀÎ »óÈ£ÀÛ¿ëÀÌ ÀÌ·ç¾îÁú ¼ö ÀÖµµ·Ï ÇØ¾ß Çϴµ¥, ¿©±â¿¡´Â ´Ù¾çÇÑ ¸ÂÃãÇü °Ë»ö ±â¹ý°ú ÇʼöÀûÀÎ º¸¾È ±â´ÉÀÌ Æ÷ÇԵ˴ϴÙ. SAS Content CategorizationÀº ´ë¿ë·®ÀÇ ÄÜÅÙÆ®¸¦ ó¸®ÇÏ°í ¼öÀÛ¾÷À¸·Î ÀÌ·ç¾îÁö´Â °úµµÇÑ ÄÜÅÙÆ® űë ÀÛ¾÷À» »ý·«ÇÔÀ¸·Î½á Á¤º¸ ±¸¼º ¹× ¾×¼¼½ºÀÇ ¼Óµµ¿Í È¿À²¼ºÀ» ³ô¿©ÁÝ´Ï´Ù..
ÁÖ¿ä Æ¯Â¡
- Åüҳë¹Ì(ºÐ·ù±â¹ý) »ý¼º
-
- Á÷°üÀû ÀÎÅÍÆäÀ̽º Åüҳë¹Ì °³¹ß. ±×¸®°í Åüҳë¹Ì ³ëµå ±¸ºÐÀ» À§ÇÑ Ä«Å×°í¸® ±ÔÄ¢/°³³ä Á¤ÀÇ »ý¼º.
- »ý¼ºµÈ Ä«Å×°í¸®¿Í °³³äÀ» ´ë·®ÀÇ ÀÔ·Â ¹®¼¿¡ Àû¿ëÇÏ´Â ¹«Á¦ÇÑÀÇ Åüҳë¹Ì ³ëµå.
- °ü·Ã ÁÖÁ¦µéÀ» Çϳª·Î ¹¾îÁÖ´Â °èÃþ(hierarchical) Åüҳë¹Ì, ¶Ç´Â Åüҳë¹Ì Æ®¸®ÀÇ ³ëµåµé °£¿¡ °ü·Ã¼ºÀÌ Á¸ÀçÇÏÁö ¾Ê´Â ¼öÆò(flat) Åüҳë¹ÌÀÇ °³¹ß.
- ¾ð·Ð/ÃâÆÇ ±â°ü, µµ¼°ü ¹× ±â¾÷À» À§ÇØ »çÀü ±¸¼ºµÈ Åüҳë¹Ì.
- Åüҳë¹Ì ¼ºñ½º¿¡´Â ´ÙÀ½ Ç׸ñÀÌ Æ÷ÇԵ˴ϴÙ:
- ¸ÞŸµ¥ÀÌÅÍ »ý¼º ¹× °³¹ß ºÐ¼®À» À§ÇÑ Æ©Å丮¾ó.
- Åüҳë¹Ì »ý¼º, ¹®¼ ºÐ·ù¸¦ À§ÇÑ ±ÔÄ¢, ±×¸®°í ¿£Æ¼Æ¼ ÃßÃâÀ» À§ÇÑ Á¤ÀÇ µî°ú °ü·ÃµÈ ¼ºñ½º.
- ÀÛ¾÷ È帧 ºÐ¼® ¹× ±¸ÇöÀ» Æ÷ÇÔÇÏ´Â ÅëÇÕ ¿ä±¸»çÇ×.
- °¢ °í°´ÀÇ È¯°æ¿¡¼ ¼öÇàµÇ´Â º¥Ä¡¸¶Å© ¹× ¾²·çDz ºÐ¼®.
- ÅõÀÚ¼öÀÍ·ü(ROI) ºÐ¼®.
- Ä«Å×°í¸® ºÐ·ù
-
- ±ÔÄ¢¿¡ ÀÏÄ¡ÇÏ´Â ¹®¼´Â Æ÷ÇÔ½Ã۰í ÀÏÄ¡ÇÏÁö ¾Ê´Â ÅØ½ºÆ®´Â Á¦¿Ü½ÃŰ´Â Ä«Å×°í¸® ±ÔÄ¢ Á¤ÀÇ.
- ÀÚ¿¬ ¾ð¾î ó¸® ¹× °í±Þ ¾ð¾î ±â¼úÀ» ÀÚµ¿À¸·Î Àû¿ëÇÏ¿© ÁÖ¿ä Á¤º¸¸¦ ºÐ·ù ½Äº°.
- Á¤È®¼º Çâ»ó¿¡ µµ¿òÀÌ µÇ´Â ¾ð¾î ±ÔÄ¢ ¹× ºÎ¿ï(Boolean) ¿¬»êÀÚ.
- ´Ü¼øÇϰųª º¹ÀâÇÑ Ä«Å×°í¸® ±ÔÄ¢ ¹× °³³ä Á¤ÀÇÀÇ »ý¼º.
- °¢ Ä«Å×°í¸® ±ÔÄ¢¿¡ ´ëÇØ °íÀ¯ÇÑ ½Äº° Á¶°ÇÀÇ ¸ñ·Ï »ý¼º.
- º¸´Ù °í±ÞÀÇ ¸â¹ö½Ê ¿ä±¸»çÇ×À» »ý¼ºÇϱâ À§ÇÑ °¡Áß ¼±º° Á¶°Ç ¶Ç´Â Ä«Å×°í¸®.
- ¹èÄ¡(batch), Àüü ¶Ç´Â ÄÜÅÙÆ® ±¸¼º¿ä¼Ò¿¡ Àû¿ëµÇ´Â ±ÔÄ¢°ú Á¤ÀǸ¦ °ËÁõÇϱâ À§ÇÑ Å×½ºÆ®¿Í ¹®¼ ÀÎÅÍÆäÀ̽º.
- C, C++, C#.NET, Java, Perl, Python µîÀÇ Å¬¶óÀÌ¾ðÆ® API¸¦ ÅëÇØ µé¾î¿À´Â ÅØ½ºÆ®¿¡ ±ÔÄ¢°ú Á¤ÀǸ¦ ÀÚµ¿À¸·Î Àû¿ë.
- ¿£Æ¼Æ¼ ÃßÃâ
-
- ¹æ´ëÇÑ ¾çÀÇ Á¤º¸¸¦ ÀÌÇØÇϱ⠽¬¿î ¼Ò·®ÀÇ Á¤º¸·Î ÃßÃâ.
- °ü·Ã µ¥ÀÌÅÍÀÇ °Ë»ö °úÁ¤À» °£¼ÒȽÃÄÑ ÁÖ´Â »çÀü ±â¹Ý, ¹®¹ý ±â¹Ý, Á¤±Ô½Ä(regular expression) ±â¹ÝÀÇ °³³ä.
- º¹ÀâÇÑ Á¤º¸ ŽºÅ© ¼öÇàÀ» À§ÇÑ Á÷°üÀû GUI.
- ´ë·®ÀÇ ´Ù±¹¾î ÄÜÅÙÆ®¿¡ ´ëÇÑ ¸ÂÃãÇü ºÐ·ù ¹× ¿£Æ¼Æ¼ Àû¿ë ÀÚµ¿È.
- 30¿© °¡Áö ÀÌ»óÀÇ ¾ð¾î Áö¿ø
-
- ¾ð¾î Åø: º» ¼Ö·ç¼ÇÀÇ °í±Þ ¾ð¾î ±â¼úÀÌ Áö¿øÇÏ´Â ±â´ÉÀº ´ÙÀ½°ú °°½À´Ï´Ù:
- ǰ»ç ÀÎ½Ä ¹× űë: ¸í»ç, µ¿»ç, Çü¿ë»ç µî ÀνÄ.
- ½ºÅ×¹Ö(Stemming): ´Ù¾çÇÑ ÇüÅÂÀÇ ÀÔ·Â ¸í»ç ¶Ç´Â µ¿»ç¸¦ °Ë»ö.
- ´ë¼Ò¹®ÀÚ ±¸ºÐ: °³³ä¿¡ ´ëÇÑ ´ë¹®ÀÚ/¼Ò¹®ÀÚ ÀνÄ.
- °Ô¸£¸¸¾î¿Í ¾Æ½Ã¾Æ ¾ð¾î¸¦ À§ÇÑ º¹ÇÕ¾î ÀÎ½Ä ¹× ºÐ¼®.
- ¾Æ½Ã¾Æ ¾ð¾î¸¦ À§ÇÑ ºÐÀý ±â´É.
- ¾ð¾î Åø: º» ¼Ö·ç¼ÇÀÇ °í±Þ ¾ð¾î ±â¼úÀÌ Áö¿øÇÏ´Â ±â´ÉÀº ´ÙÀ½°ú °°½À´Ï´Ù:
- Çù¾÷
-
- °³ÀÎ ¶Ç´Â ÆÀ ´ÜÀ§·Î ÀÛ¾÷À» ¼öÇàÇÏ´Â ºÐ·ùÇÐÀÚ(taxonomist)¿Í °³¹ßÀÚ°¡ ¾ÈÀüÇÏ°Ô ÇÁ·ÎÁ§Æ®¿¡ ¾×¼¼½ºÇÒ ¼ö ÀÖ½À´Ï´Ù.
- º¹¼ö »ç¿ëÀÚ°¡ °³¹ßÁßÀÎ ÇÁ·ÎÁ§Æ®¿¡ ¾×¼¼½ºÇÒ ¼ö ÀÖ½À´Ï´Ù.
- Çã°¡ ·¹º§¿¡´Â Àбâ, ¾²±â, Ä«Å×°í¸® ±ÔÄ¢ ¹× °³³ä Á¤Àǰ¡ Æ÷ÇԵ˴ϴÙ.
½ºÅ©¸°¼¦
SAS Content Categorization ¼Ö·ç¼ÇÀº ¿£Æ¼Æ¼¿Í À̺¥Æ®ÀÇ ÄÁÅÙÆ®¸¦ Á¤È®ÇÏ°Ô ÆÄ½Ì ºÐ¼®ÇÕ´Ï´Ù. ±×¸®°í ÀÌ´Â ´Ù½Ã ¸ÞŸµ¥ÀÌÅ͸¦ »ý¼ºÇÏ°í ºñÁî´Ï½º ÇÁ·Î¼¼½º¸¦ ÃßÁøÇÏ´Â µ¥ »ç¿ëµË´Ï´Ù. ¶ÇÇÑ Á÷°üÀûÀÎ GUI°¡ ¸ÞŸµ¥ÀÌÅ͸¦ ¼Õ½±°Ô Á¤ÀÇ Å×½ºÆ®ÇÒ ¼ö ÀÖ°Ô ÇØÁÝ´Ï´Ù. ±×¸²¿¡¼ º¸µíÀÌ ¸ÞŸµ¥ÀÌÅÍ¿Í ÀÏÄ¡ÇÏ´Â ¾îÈÖ°¡ Àû»öÀ¸·Î °Á¶ Ç¥½ÃµË´Ï´Ù.
½Ã½ºÅÛ ¿ä±¸»ç¾ç
Teragram ±â¼úÀÌ º¸°µÈ SAS Content CategorizationÀº ´Ù¸¥ SAS ¸ðµâÀÌ ÇÊ¿äÄ¡ ¾ÊÀº µ¶¸³Çü Á¦Ç°ÀÔ´Ï´Ù.
Ŭ¶óÀÌ¾ðÆ® È¯°æ
- Microsoft Windows(x86-32ºñÆ®): Windows 2000 Professional, Windows XP Professional, Windows Vista*, Windows Server 2003 °è¿
¼¹ö ȯ°æ
- AIX: POWER ¾ÆÅ°ÅØÃ³¿ë ¹öÀü 4.3(x86-32ºñÆ®), ¹öÀü 5.3 ¹× 6.1(x64)
- FreeBSD 4.8(x86-32ºñÆ®) ¹× 6.0(x64)
- HP-UX PA-RISC: HP-UX 11iv2 (11.23), 11iv3 (11.31)
- HP-UX Itanium: HP-UX 11iv2 (11.23), 11iv3 (11.31)
- Linux(x86-32ºñÆ®): RHEL 4, SuSE SLES 9
- Linux(x64¿ë, EM64T/AMD64): RHEL 4, SuSE SLES 9
- Macintosh: Mac OS X 10.4.8 ÀÌ»ó
- Microsoft Windows(x86-32ºñÆ®): Windows 2000, Windows XP Professional, Windows Server 2003, Windows Vista*
- Microsoft Windows(64ºñÆ®¿ë, EM64T/AMD64): Windows XP Professional, Windows Vista*, Windows Server 2003(64ºñÆ®¿ë)
- Solaris(SPARC¿ë): ¹öÀü 6, 8, 9, 10
- Solaris(X64¿ë): ¹öÀü 8,10
*ÁÖ: Áö¿øµÇ´Â Windows Vista Editions¿¡´Â Enterprise, Business ¹× Ultimate°¡ Æ÷ÇԵǾî ÀÖ½À´Ï´Ù.
´õ ÀÚ¼¼ÇÑ ³»¿ëÀ» ¿øÇϼ¼¿ä?
°ü·Ã »ó¼¼ Á¤º¸´Â ¾Æ·¡ ¿¬¶ôó(SAS ÄÚ¸®¾Æ) ·Î ¹®ÀÇÇÏ¿© Áֽðųª ÀϹݹ®ÀÇ ÆäÀÌÁö¿¡ ¹®ÀÇÇÏ¿© ÁÖ¼¼¿ä.
±³À°¹®ÀÇ : 02-2191-7002
±â¼ú¹®ÀÇ : 02-2191-7003



