SAS® Dataflux® Data Management Studio

 

Interface user-friendly que combina as diferentes funcionalidades de qualidade de dados, desde as análises mais simples, definição de regras de negócio, até à criação de processos mais complexos de workflow de correcção.

Data Profiling

 

Permite ao utilizador/organização obter um melhor entendimento dos problemas existentes nas suas estruturas de dados e relações entre elas, de forma a poder correctamente planear e projectar a sua correcção/manutenção. Inclui também uma componente de reporting que permite de forma simples a validação dos resultados obtidos.

Limpeza e Standartização

 

Permite aos utilizadores a análise e prototipagem dos processos de qualidade dos dados, e a aplicação de correcções para melhorar a eficiência dos mesmos. Exemplos: separação das diferentes componentes de uma morada (tipo, nome, andar, código postal, etc…) ou nome (próprio, apelido, prefixo, etc…), aplicação de conversões automáticas para determinados padrões encontrados (Lx para Lisboa, Pt para Portugal, av para Avenida, etc..), ou ainda a validação de determinados conteúdos (morada vs código postal).

Matching e Deduplicação

 

Os algoritmos de matching disponíveis permitem emparelhar dados com múltiplas origens e com formatos diferentes através de análises complexas heurísticas e de fonética. Desta forma, é possível eliminar a subjectividade do processo manual e identificar semelhanças entre entidades aparentemente distintas. São gerados códigos chave de matching que permitem agrupar estas entidades de forma correcta (Exemplo: Avenida da Liberdade e Av. Liberdade).

Após esta identificação, o utilizador pode optar por remover a informação redundante, ou criar novos registos com a junção da informação mais completa dos dados originais, reduzindo o volume de dados armazenados e garantindo uma maior consistência entre dados com diferentes proveniências.

Identificação

 

Identificação automática do género de uma pessoa através do nome, que pode ser uma característica extremamente útil aquando da sua utilização para marketing segmentado, ou a identificação de entidades, fazendo a distinção entre individuais e colectivas.

Base de Conhecimento / Algoritmos

 

Uma base de conhecimento adaptada às características da informação de Portugal, o que permite uma rápida e eficiente utilização de cada uma das anteriores componentes. Esta base de conhecimento permite controlar a capacidade dos processos analisarem correctamente a informação, tendo para isso também disponível toda uma componente de customização e edição das regras e conteúdos previamente disponíveis. Alguns exemplos são: as listas de nomes utilizados em Portugal, regras de construção de uma morada, etc.

Glossário de Dados

 

Os glossários de termos de negócio promovem um ambiente colaborativo para associar metadata operacional, técnica e de negócio. Um workflow e reporting integrado permitem aos utilizadores de negócio e de IT partilharem vocabulário comum de termos de negócio e identificarem e corrigirem os problemas à medida que vão surgindo. Inclui também relatórios pelas várias dimensões, gestão do workflow de negócio e colaboração entre utilizadores com processos de notificação.

Faça Download do White Paper