Os dois lados da moeda
 |
 |
 |

Pichatelli, do SAS: soluções conciliam o controle pela TI com a liberdade de ação para os estatísticos
|
|
Marcos Pichatelli *
Mais e mais empresas se juntam àquelas que há muito perceberam a importância de contar com profissionais especializados em análises estatísticas. Afinal, são eles que transformam números, gráficos e processos em conhecimento relevante para o negócio. Porém, a integração desses novos processos no ambiente corporativo enfrenta obstáculos. Principalmente com o pessoal de TI. Embora receba respaldo da diretoria da empresa, que enxerga no estatístico a chave para encontrar o seu diferencial de negócios e obter lucratividade, muitas vezes o profissional enfrenta um relacionamento difícil com a área de TI.
Depois de ter acrescentado, à experiência em TI, algum tempo atuando na criação arquitetura de soluções para o SAS e seus clientes, passei a entender a questão. Aprendi que, quando o pessoal de TI vai desenvolver um banco de dados para um usuário tradicional de relatorios e análises, faz o que tecnicamente é chamado de "congelamento da especificação", isto é, TI pergunta ao usuário quais são as informações desejadas. Esse é o ponto de partida para a montagem de um banco de dados, reunindo esse conjunto de informações sob uma organização adequada à forma como será consultada pelo usuário. Já se esse cliente for o estatístico, não é natural que ele consiga fornecer à TI uma lista de informações desejadas, muito menos que defina de antemão a forma como essas devem estar organizadas. No decorrer do trabalho, o estatístico vai querer interagir com os dados de um modo não-convencional, com uma autonomia que TI não precisa prover para outros tipos de usuário.
Processo inverso
Isso acontece por uma razão muito simples, mas que só fica visível para nós de TI depois que entendemos o processo todo. Como o trabalho do estatístico é exploratório, a rigor é natural que ele não saiba de antemão quais dados serão uteis e quais não serão para o processo que está desenvolvendo. Isso frustra TI, quando esta apenas desenvolveu processos para atender requisitos de usuários tradicionais de relatórios e está acostumada a pensar em "especificação de requisitos" como ponto inicial do processo. Para o pessoal estatístico, essa lista não é o início, mas sim o resultado do trabalho deles.
Quando o estatístico quer identificar alguma tendência, ele vai testando o conteúdo das variáveis de que dispõe, ao longo do seu processo investigativo. Algumas vão se revelar importantes e outras não, e ele só saberá disso depois do início do trabalho. Se ele tenta fazer um modelo levando em conta uma variável, por exemplo, data de abertura de conta do cliente, mas depois verifica que esse dado não é tão importante, pode transformá-lo em tempo de contrato em meses e perceber que, dessa forma, consegue chegar a algumas conclusões importantes.
Fome de informação
Assim, se ele vai calcular um modelo para saber quais são os clientes com maior propensão a comprar certo produto, por exemplo, quando TI pergunta a ele "de que dados você precisará?" tudo o que esse profissional consegue "especificar" de antemão é: "todos os dados de clientes que tivermos". Para a área de TI esse pedido não faz o menor sentido. E quando ela se refaz do susto e pergunta se são dados atuais ou históricos, descobre que o estatístico, nesse ponto, às vezes não tem como saber sequer qual o período mínimo de histórico necessário para produzir um modelo estatístico eficiente. Por isso, geralmente responderá: "qual o período máximo que você consegue me dar?". Novamente, isso soa absurdo para o pessoal de TI que está acostumado a trabalhar com usuários tradicionais de relatórios.
Sem conhecer essas características do trabalho estatístico, a área de TI pode acabar considerando o estatístico um cliente complicado, "que não sabe o que quer". Além disso, uma outra complicação para TI é o fato do estatístico, em seu trabalho, necessitar criar as tais "variáveis derivadas", isto é, poder gerar uma nova informação a partir daquele dado que TI forneceu a ele. Nesse ponto, a área de TI se vê tentada a chamar para si a tarefa de criar essas informações sempre que o estatístico identificar uma nova necessidade, para que TI não perca o controle sobre a diversidade e o volume dos dados usados pelos estatísticos. Afinal, esse é o procedimento padrão para atender outros tipos de usuários: dar início a um "projeto de alteração do banco de dados". Isso, no entanto, obrigará o estatístico a percorrer ciclos extremamente longos no desenvolvimento dos modelos, tornando-os inviáveis. Sem se dar conta, TI estará tentando eliminar a característica de exploração interativa que caracteriza a atividade estatística.
Para atender estatísticos, a área de TI precisa compreender a natureza do trabalho da Ciência Estatística. Trata-se de um processo de exploração, de muitas idas e vindas, desde a análise do dado bruto até a obtenção de uma conclusão que seja de fato relevante para a área de Negócios. Essa dificuldade reside particularmente na percepção de tendências. Às vezes o estatístico precisa se debruçar sobre dados provenientes de um histórico de vários anos, para identificar movimentos mais amplos, nas diferentes áreas de negócios. Deveríamos ficar felizes por eles não poderem saber de antemão que informações vão usar e que informações vão descartar. Afinal, descobrir que variáveis são essas é exatamento o trabalho para o qual eles foram contratados para fazer.
Da mesma forma, os estatísticos têm dificuldade para entender porque TI anseia por requisitos congelados, processos padronizados e, se fosse possível, uma perfeita e eterna estabilidade dos sistemas e modelos de dados. Pelo meu background em TI, tenho conseguido passar a esses profissionais uma visão menos apaixonada dessa questão, mostrando quanto o pessoal de TI é dependente de obter ambientes estáveis, seguros, confiáveis e robustos.
Soluções e convergência
O caminho entre os mundos de TI e de Estatística, no entanto, não é feito somente de pedras. Com o uso das soluções do SAS, pode ficar mais suave, graças à criação de ambientes que mantenham a segurança e controle nas mãos do pessoal de TI, sem eliminar a agilidade e a autonomia do pessoal estatístico. Existem soluções do SAS divididas em duas partes: uma usada por TI e outra usada pelos estatísticos. Na parte usada por TI os processos são estruturados e executados em regime regular e periódico. Há controle do que está sendo gerado, a partir de que fontes, com que regras, quando e para quem. Ou seja, um ambiente coerente com as necessidades e particularidade da missão de TI .
Na parte usada pelos estatísticos, o SAS cria um ambiente em que eles podem explorar os dados e gerar os dados derivados que se mostrarem necessários. Esse ambiente fica também sob certo controle de TI, mas não num nível em que, para criar um campo em uma tabela, o estatístico precise aguardar dias (semanas?) para que um completo ciclo de change management seja realizado pelo pessoal de TI (administradores de bancos de Dados, programadores, etc).
Ao adquirir essa visão mais completa do processo e o conhecimento sobre a natureza da atividade de uma e de outra área, os profissionais de ambos os lados podem promover a eliminação ou redução do conflito e se beneficiarem muito disso. O SAS lida há 30 anos com esse problema e consegue transformar essa discussão em uma conversa, promovendo a harmonia entre as áreas.
* Marcos Pichatelli é especialista em arquitetura de dados e gerente de pré-vendas do SAS Brasil
Veja a íntegra dessa matéria com depoimentos da Brasil Telecom sobre o complexo diálogo entre TI e estatística
|