SAS® Text Miner
Analyser les sources de données non structurées grâce au Text Mining
Bénéfices
- Des décisions plus rapides grâce aux processus automatisés
- Un processus de découverte optimisé par la mise en évidence d'associations et de relations
- Vision globale des données permettant de retrouver des locutions spécifiques dans les documents
- Repérage des tendances et des opportunités commerciales
Fonctionnalités
- Accès universel aux données
- Prise en charge multilingue
- Interface souple et conviviale
- Nœud d’analyse de texte (nouveauté de SAS® Text Miner 4.2)
- Techniques de réduction des dimensions
- Nœud des thématiques de texte (nouveauté de SAS® Text Miner 4.2)
- Algorithmes de classification de texte
- Nœud de filtrage de texte (nouveauté de SAS® Text Miner 4.2)
- Vision des données à 360°
Capture d'écran
La fenêtre de conceptualisation des liens regroupe les termes par classification
Captures d'écran
Les atouts de SAS
- SAS Text Miner offre une série complète d'outils de modélisation linguistique et analytique permettant d'extraire de l'information de nombreux documents textuels. Dotée d'une fonction de recherche très performante et d'un correcteur orthographique optimisé, la version 4.2 permet de traiter plusieurs thèmes par document.
- Une fois le texte transformé pour alimenter les moteurs de data mining, les thèmes sont identifiés sous forme d'associations explicites pour permettre la classification des documents en groupes corrélés utiles pour le scoring de la modélisation prédictive.
- L'explorateur de résultats de SAS Text Miner permet d'explorer les concepts et les relations entre les documents et d'effectuer des modifications dynamiques.
- Que les résultats proviennent de SAS Enterprise Content Categorization ou du module complémentaire SAS® Concept Creation pour SAS Text Miner, ils s'intègrent directement au text mining pour compléter les entités personnalisées.
Bénéfices
- Des décisions plus rapides grâce aux processus automatisés
Les algorithmes intelligents et les techniques de traitement du lexique vous libèrent des tâches manuelles fastidieuses, désormais automatisées : catégorisation, balisage ou encore constitution de bibliothèques thématiques et d'index documentaires.
- Un processus de découverte optimisé par la mise en évidence d'associations et de relations
Lorsque vous analysez du texte, ne vous contentez plus de rechercher des termes ou d'interroger des éléments connus. Identifiez les nouveaux concepts à l'aide de la méthode orientée données de SAS Text Miner qui, grâce à son interface interactive, met en évidence les chemins et les liens pour des analyses documentaires approfondies.
- Vision globale des données permettant de retrouver des locutions spécifiques dans les documents
SAS Text Miner présente l'intégralité du processus de data mining et propose d'explorer les détails pertinents au niveau des connexions ainsi que les liens entre les éléments d'une série de documents.
- Repérage des tendances et des opportunités commerciales
Le courrier des utilisateurs et les commentaires des centres d'appels sont de précieuses sources d'informations sur la satisfaction des clients ou la demande de produits et services.
Fonctionnalités
- Accès universel aux données
-
- Accès à de nombreux formats de données textuelles : PDF, texte ASCII étendu, HTML, Microsoft Office, feuilles de calcul, présentations, e-mails et bases de données.
- Fonctions d'indexation web étendues aux réseaux sociaux comme Twitter et les fils d'actualité.
- Extraction, transformation et chargement des données textuelles dans une table SAS pour le data mining.
- Prise en charge multilingue
-
- Prise en charge des codages de caractères Latin-1, sur deux octets et UTF-8.
- Langues européennes (codage Latin-1) : allemand, anglais, espagnol, français, italien, néerlandais, polonais, portugais et suédois.
- Langues orientales (prise en charge du codage sur deux octets) : arabe, chinois, coréen et japonais.
- Interface souple et conviviale
-
- La fonction de text mining est encapsulée dans quatre nœuds correspondant aux tâches courantes. Ces nœuds se combinent différemment selon la tâche concernée.
- Fonctionnant directement avec les nombreux nœuds proposés par SAS Enterprise Miner, ils peuvent être développés à l’aide d’algorithmes ou de règles définis par l’utilisateur à des fins de modélisation prédictive, classification, visualisation et reporting, et déployés sous la forme de scripts de scoring SAS.
- Les diagrammes de text mining peuvent être modifiés, enregistrés et partagés.
- Les rapports peuvent être publiés au format HTML pour plus de concision.
- Un diagramme de conceptualisation affiche les relations entre les termes sous forme graphique.
- Nœud d’analyse de texte (nouveauté de SAS® Text Miner 4.2)
-
- Grâce à des listes d'exclusion par défaut ou personnalisées, vous éliminez de votre analyse les termes sans valeur informationnelle.
- Correction orthographique automatisée.
- Indexation par radicaux pour identifier les mots-racines.
- Balisage des parties du discours en fonction du contexte.
- Extraction des groupes nominaux pour repérer les concepts au niveau de la locution, pour analyser la concurrence, par exemple.
- Prise en charge instantanée de nombreux types d'entité : noms de personne et de société, lieux, dates, adresses, évaluations, e-mails et URL. Ces entités sont personnalisables pour chacune des langues gérées.
- Occurrences d'expressions définies par l'utilisateur, telles que « pointer-cliquer ».
- Listes de synonymes par défaut et personnalisables.
- Fonctionnalités complètes, comme la décomposition des mots composés.
- Techniques de réduction des dimensions
-
- Le cumul permet d'identifier automatiquement les n termes dont la pondération est la plus élevée dans un document.
- La décomposition en valeurs singulières transforme chaque document en sous-espace à n dimensions, où les documents les plus proches sont ceux présentant le plus de similitudes.
- Nœud des thématiques de texte (nouveauté de SAS® Text Miner 4.2)
-
- La fonction d'exploration taxinomique affiche les thèmes par défaut générés automatiquement, ainsi que ceux définis par l'utilisateur.
- Les documents peuvent être catégorisés selon qu'ils appartiennent à aucun, un ou plusieurs thèmes.
- Pour rendre l'environnement plus intuitif, ces thèmes peuvent être personnalisés de façon interactive.
- Algorithmes de classification de texte
-
- L'algorithme espérance-maximisation regroupe les documents pour produire des classifications discrètes, sans chevauchement, à l'aide de techniques de classification spatiale.
- La classification hiérarchique facilite le regroupement automatique des documents en taxinomies.
- Classifications et thèmes sont profilés par l'ajout de données structurées des documents originaux pour optimiser l'analyse générale.
- Nœud de filtrage de texte (nouveauté de SAS® Text Miner 4.2)
-
- Contient une vue concise des documents et du lexique ou l'ensemble des termes identifiés pendant l'analyse.
- Corrige automatiquement l'orthographe en mettant en relation les termes mal orthographiés et les termes corrects.
- Applique des recherches de type Google ou des clauses SQL WHERE pour décomposer l'analyse en sous-ensembles.
- Permet de distinguer et de filtrer des termes peu pertinents par l'interaction ou la programmation, de mettre des abréviations en correspondance et de représenter d'autres termes équivalents.
- Vision des données à 360°
-
- Associez des données textuelles au data mining classique des données structurées pour automatiser, visualiser, classifier et déployer les résultats de la modélisation prédictive.
- Optimisez les prévisions en couplant les données quantitatives et qualitatives à l'analyse du texte.
- Les techniques avancées telles que les réseaux neuronaux, raisonnement à base de cas, modèles de régression et arbres décisionnels peuvent évoluer via le nœud SAS Enterprise Miner Code, qui favorise les innovations et accélère le déploiement, tout en limitant les risques.
- Les performances sont présentées côte à côte pour vous permettre de sélectionner le meilleur modèle à déployer comme script de scoring pour catégoriser les nouveaux documents.
- Vous pouvez intégrer les résultats générés par SAS® Enterprise Content Categorization directement dans l'analyse de text mining.
Captures d'écran
La fenêtre de conceptualisation des liens regroupe les termes par classification
La fenêtre de conceptualisation des liens présente les groupes de termes en les classifiant en fonction de leurs associations.
Outil interactif de visualisation des filtres
Grâce à la puissance de sa syntaxe de recherche, l’outil interactif de visualisation des filtres retrouve des termes ou des locutions dans les documents en décomposant l’analyse en sous-ensembles.
Quelques nouveautés : l’analyse et le filtrage de texte, et l’identification des thématiques de texte
SAS Text Miner 4.2 comprend trois nouveaux nœuds : l’analyse, le filtrage et les thématiques de texte. Parmi les nombreuses nouveautés figurent les locutions, la recherche de texte intégral et les entités personnalisées.
Filtrage (sur le terme « accelerate » dans cet exemple) permettant à SAS Text Miner de détecter automatiquement toutes les variantes possibles
Configuration requise
Supported platforms
- AIX: Version 5.3 and Version 6.1 on POWER architectures
- HP-UX Itanium: HP-UX 11iv2 (11.23), 11iv3 (11.31)
- Linux for x64 (EM64T/AMD64): RHEL 4 and 5, SuSE SLES 9 and 10
- Microsoft Windows (x86-32): Windows XP Professional, Windows Vista*, Windows Server 2003 family
- Microsoft Windows on x64 (EM64T/AMD64): Windows XP Professional for x64, Windows Vista* for x64, Windows Server 2003 for x64
- Solaris on SPARC: Version 9, 10
- Solaris on x64: Version 10
*NOTE: Windows Vista Editions that are supported include Enterprise, Business and Ultimate
Supported Web browsers
- Internet Explorer 6 on Windows XP Pro
- Internet Explorer 7 on Windows XP Pro and Windows Vista*
- Firefox 2.0 on Windows XP Pro, Windows Vista* and Linux x86 (SuSE and RHEL)
Middle tier required/optional software
- SAS client and middle tier require Sun JRE 1.5
Required software
- SAS Enterprise Miner is required and must be installed on the same machine as SAS Text Miner; or SAS Enterprise Miner for Desktop is required and must be installed on the same machine as SAS Text Miner for Desktop
Plus d'informations sur nos services et solutions ?
Contactez SAS France au +33 1 60 62 11 11 ou utilisez le formulaire en ligne.


