Sociedade Portuguesa de Autores

A Sociedade Portuguesa de Autores aposta na implementação das Soluções SAS para superar os desafios decorrentes do Big Data e da atual Era Digital.

Assistimos, de dia para dia, a um célere aparecimento e acumulação de dados essenciais à óptima execução das nossas funções, vindos de diferentes fontes, o que nos coloca perante o desafio de os conseguir armazenar e tratar, de forma eficiente. No entanto, a complexidade do Big Data sobressai quando nos apercebemos de que o objetivo vai mais além do que o simples tratamento analítico desse grande volume de dados. Na verdade, falamos da criação de processos e ferramentas que garantam não só a qualidade e acuidade da informação, mas também que os negócios usufruam dos resultados então obtidos.

A par disto e com o aumento do uso de plataformas on-line de streaming, registado nos últimos anos a nível mundial, a SPA - Sociedade Portuguesa de Autores tem vindo a deparar-se com cada vez maiores desafios na recolha e registo dos direitos dos autores.

O desafio passa por gerir toda a informação que é recebida - oriunda de diversos Digital Service Provider e em diferentes formatos e tamanhos - garantindo que cada um recebe os devidos direitos no tempo suposto. Em resposta ao desafio, a SPA resolveu então investir na qualidade e tratamento de dados através da implementação do SAS Data Quality e do SAS Data Loader, duas soluções de fácil integração e altamente escaláveis, que permitem assegurar, de forma rápida, eficiente e com baixos custos, os processos de armazenamento, transformação, validação e enriquecimento de dados. 

Com o antigo sistema, cada relatório de vendas demorava 15 dias até ficar pronto, agora com a implementação do Cluster Hadoop demora duas horas. Estas ferramentas aceleram a entrega de dados fiáveis… e vão precisamente ao encontro das necessidades do nosso negócio.

Cláudia Moreira
Coordenadora do Núcleo de Projetos e Desenvolvimento Tecnológico na SPA

SPA, Uma História de Sucesso.

Até muito recentemente a SPA processava em plataformas tradicionais toda a informação que recebia dos diversos autores. Esta informação chegava, tal como acontece agora, em diferentes formatos (XML, arquivos de texto, etc.) por vezes muito pesados. Ora, para fazer este trabalho de introdução de dados nos devidos relatórios, os responsáveis pela recolha dos direitos de autor chegavam a demorar vários dias, dificultando desta forma o cumprimento dos prazos em que os autores deveriam receber os seus direitos.

A par deste grande volume de dados, Big Data, nos últimos tempos, com o aumento do uso de plataformas on-line de streaming, a nível mundial, o consequente aumento do número de relatórios de vendas gerados por cada prestador de serviço digital e com o constante aparecimento de novas plataformas com relatórios de vendas acrescidos, a recolha dos direitos de autor tem vindo a tornar-se cada vez mais difícil. Razões que levaram a SPA a procurar o SAS, como explica Cláudia Moreira, Coordenadora do Núcleo de Projetos e Desenvolvimento Tecnológico na SPA “Vivemos numa realidade altamente tecnológica, onde diariamente é partilhada muita informação e dados. E o que aconteceu foi que começámos a perceber que, com o sistema tradicional, demorávamos muitos dias na recolha e processamento dos direitos de autor. Resolvemos, por isso, adotar uma solução aberta que nos ajudasse a processar todos os dados, de forma eficiente”.

O desafio estava lançado e, olhando para os números, percebe-se de facto a necessidade de implementação de ferramentas flexíveis e eficazes: só em 5 anos a SPA recebeu mais de 80 000 relatórios de vendas. Desta forma, a SPA optou pela implementação do SAS Data Quality, para uma rápida visualização, exploração e análise dos dados, e do SAS Data Loader para Hadoop, que garante um acesso seguro, uma integração de dados simplificada e qualidade na informação a analisar.

Foi implementado um cluster Hadoop, gerido pelo software Cloudera, que é escalável e flexível o suficiente para crescer, tendo em conta as necessidades de processamento. O SAS Data Loader, com uma interface intuitiva baseada em aplicações gráficas, permitiu à SPA, de forma simples, carregar e tratar grandes volumes de dados; estabelecer correspondência entre os dados recebidos e aqueles já existentes na sua base de dados; calcular a representatividade das gravações e o valor final a cobrar; gerar detalhes da fatura, ficheiros de distribuição, auditoria dos dados, etc. Sendo de referir que o processo de implementação destas duas ferramentas foi acompanhado pela Timestamp, que como parceiro ajudou na integração do sistema na SPA.

Quanto às vantagens pode realçar-se o facto de o Hadoop ser uma plataforma de armazenamento altamente escalável e rápida; ser um sistema de baixo custo de manutenção e permitir aceder facilmente a novas fontes de dados e em diferentes tipos de dados, sejam eles estruturados ou não. Por sua vez, o SAS Data Loader permite que os utilizadores funcionais utilizem o Hadoop de forma simplificada e reduz o tempo de execução dos processos de dias para horas, o que se traduz numa maior capacidade de processamento a baixo custo e/ou disponibilidade para colmatar os atrasos. 

“Os benefícios são na verdade muitos, sendo de referir a alta capacidade de processamento a baixo custo que se conseguiu e o tempo de processamento que, tal como já referi anteriormente, baixou consideravelmente. Para se ter uma ideia, antigamente eram processados por ano 800 relatórios de vendas, sendo que atualmente, para o mesmo número de dias, temos previsto processar 4368 relatórios.” conclui Cláudia Moreira.

 

Sobre a SPA Sociedade Portuguesa de Autores

A SPA, Sociedade Portuguesa de Autores, é uma cooperativa de responsabilidade limitada, fundada em 1925 para a Gestão do Direito de Autor. Entre as várias funções que desempenha, é de realçar a autorização da utilização das obras pelos titulares de direitos de autor que representa (nacionais e estrangeiros, quer sejam autores, seus sucessores ou cessionários), bem como a determinação das condições dessa utilização e a cobrança dos direitos a ela correspondentes, entre outros. A SPA representa os autores portugueses de todas as disciplinas literárias e artísticas, seus sucessores e cessionários, que nela estejam inscritos, cujo número hoje ultrapassa já os 25.000. A SPA representa ainda os autores, sucessores e cessionários inscritos em quase 200 sociedades congéneres existentes em aproximadamente 90 países, de todos os continentes.

Desafios

  • Recolher e processar, eficientemente, todos os dados referentes aos direitos de autor no tempo devido
  • Qualidade de dados

Soluções

SAS Data Quality

SAS Data Loader para Hadoop

Benefícios

  • Capacidade de análise e exploração de dados
  • Capacidade de gestão da informação
  • Redução do tempo execução dos processos de dias para horas
  • Custos reduzidos
  • Maior produtividade 

About SAS

SAS is a global leader in data and AI. With SAS software and industry-specific solutions, organizations transform data into trusted decisions. SAS gives you THE POWER TO KNOW®.