Muito além do BI

bi

O número de dados gerados nas empresas, e que estão à disposição delas em fontes externas, cresce de forma acelerada. Notas fiscais eletrônicas de entrada, cupons fiscais e outros documentos usados para cumprir demandas do governo geram as informações do SPED (Sistema Público de Escrituração Digital) e muitas outras. Por isso há um acúmulo de novas informações geradas a partir das consolidações pelas quais esses documentos passaram em todo o processo. Tais dados podem ser somados àqueles oriundos das estatísticas de visitas ao website da empresa: quem são os visitantes do site? Qual a sua localização? Como chegaram até nós?

As redes sociais também são fontes preciosas de informação e importantes ferramentas de interação com clientes, fornecedores e parceiros. Até não muito tempo atrás, para comunicarem-se com os clientes, as empresas contavam apenas com os tradicionais SACs (Serviços de Atendimento ao Consumidor), recebendo ligações de forma passiva para só depois atuarem pela solução. Mas essa realidade vai ficando para trás.

É necessário que as empresas atuem de forma ativa nas redes sociais, que monitorem os clientes em busca da solução de problemas antes que eles tomem proporções indesejadas. Ao mesmo tempo é preciso colher informações e impressões que possam ser convertidas em novos negócios pela área comercial. Assim, um acompanhamento das manifestações do cliente em redes sociais como Facebook, Twitter, Foursquare e Instagram, feito por pessoal especializado, é essencial na descoberta de oportunidades e na previsão de demandas para que se haja antecipadamente, evitando que os problemas apareçam ou aumentem de tamanho.

Além daquelas fontes de dados que exemplifiquei, existem outras possibilidades. Os cartões de fidelidade, por exemplo, oferecem ao cliente benefícios em contrapartida à obtenção de cadastros. Os hábitos de consumo e bases de dados públicas, além de serviços de fornecimento de informações pagas, podem ajudar muito no enriquecimento de dados gerados internamente. Está comprovado que as empresas têm essas oportunidades, mas também sujeitam-se a riscos, ambos associados à imensidão de dados que as cercam. Mas quais tipos de oportunidades estão, mais precisamente, ao alcance delas?

Área fiscal e comercial

Com a progressiva implantação do SPED, o governo gerou para si mesmo um gigantesco poder de controle, no que diz respeito ao conhecimento, quase em tempo real sobre a realidade das empresas. Se, por um lado, as notas fiscais eletrônicas, o SPED Fiscal, EFD-Contribuições, SPED Contábil e e-Social significam a presença do governo de forma muito próxima no dia-a-dia das empresas e com ganhos significativos na arrecadação, também geram possibilidades que não devem ser ignoradas e desperdiçadas pelos contribuintes. O SPED agiliza a análise das informações para o governo, mas também gera um volume precioso de dados para as empresas. Até então, a disponibilidade dessas informações dependia quase exclusivamente dos softwares de gestão. Essa limitação deixou de existir, visto que as informações do SPED estão disponíveis a partir de layouts padrão, o que obrigou as empresas a organizarem-se para entregá-las. Ao mesmo tempo, o layout possibilitou a análise dos dados através de softwares de auditoria que podem gerar uma série de diagnósticos e prevenir problemas fiscais.

Oportunidades com a mineração de dados

É na área comercial que estão algumas das oportunidades mais interessantes quando os dados disponíveis são utilizados como matéria-prima para a geração de conhecimento útil. O bom aproveitamento desses dados, porém, não é possível através do exame de relatórios ou análises convencionais, já que estamos falando de grandes quantidades de dados, com relevante diversidade entre si. Um supermercado típico, por exemplo, terá em seus tickets dezenas de milhares de produtos, em milhares de transações sendo realizadas todos os dias. São necessárias técnicas especiais para gerar informações relevantes partir desse volume de dados. Tais informações não denotam utilidade alguma a não ser mediante o uso de técnicas que compõem a “mineração de dados” ou data mining. O data mining faz parte de um processo maior, chamado KDD – Knowledge-Discovery in Databases. Esse processo é uma sequência de vários passos que envolve preparação de dados, pesquisa de padrões, avaliação de conhecimento e refinamento, envolvendo interação e modificação.

“É na área comercial que estão algumas das oportunidades mais interessantes quando os dados são utilizados como matéria-prima para a geração de conhecimento útil”

No âmbito da mineração de dados várias técnicas de análise estão disponíveis, dependendo dos objetivos a serem alcançados. Neste artigo, me refiro ao objetivo de dar aos clientes algo além das análises convencionais, realizadas por meio dos clássicos relatórios e ferramentas de BI (Business Intelligence). Estas, de uma forma geral, estão concentradas apenas em analisar fatos passados. Aqui em nosso contexto a chave é a “análise preditiva”, que nada mais é do que possibilitar, a partir de padrões de comportamento dos consumidores, consumo e outros padrões conhecidos, prever o futuro com níveis satisfatórios de certeza para aplicação a novas situações.

Clusters e árvores de decisão

Vamos supor que sua empresa queira fazer uma campanha de vendas para um determinado produto e que ela atingirá 300 mil clientes, cujos dados estão em sua base de dados. Antes de iniciar a campanha, um levantamento mostrará que a maior parte dos clientes que já adquiriram o produto é composta por homens com renda entre seis e sete salários mínimos, idade entre 35 e 40 anos, moradores da região sul da cidade.

Fundamentado em tais informações, geradas por um algoritmo de “árvore de decisão”, o processo de mineração de dados irá analisar a base de informações de 300 mil nomes e apontar aqueles com maior chance de se tornarem compradores, ou seja, muito semelhantes ao “comprador típico”. Provavelmente, com essa estratégia a campanha de vendas terá mais eficácia e menos custos. Em vez de tentarmos atingir todo o cadastro, nos concentraremos em um público menor, com chances de resposta positiva muito maior.

Análise de cesta de produtos

A propósito, um caso bastante conhecido é aquele em que uma importante rede de supermercados constatou uma relação interessante entre as vendas de fraldas e de cervejas nos finais de semana, à noite. Essa constatação foi obtida com a análise de milhares de tickets de vendas e com o uso de algoritmos computacionais, para descobrir padrões impossíveis de serem observados em análises não automáticas e não especializadas. A partir daquela constatação saiu-se em busca de informações que permitissem explicar a relação entre as fraldas e a cerveja.

Descobriu-se que, quando as fraldas acabavam nos fins de semana, era o marido quem ia ao mercado comprá-las, na maior parte dos casos. Aproveitando a saída, os papais também repunham seu estoque de cerveja. A partir daí o supermercado passou a disponibilizar fraldas e cervejas em gôndolas mais próximas, favorecendo a visualização e, consequentemente, a venda do produto.

Outro exemplo corriqueiro desse tipo de abordagem pode ser observado em sites de comércio eletrônico: ao manifestar a intenção de compra de um produto o comprador em potencial recebe sugestões de outros itens, os quais também foram adquiridos por quem comprou o produto em questão anteriormente. Assim, aumenta-se a chance do internauta adquirir mais de um produto ou de não sair dali sem levar alguma coisa.

Redes neurais

As redes neurais são algoritmos computacionais que buscam recriar, mesmo que de forma menos complexa, a estrutura básica do cérebro humano, através de neurônios artificiais modelados por um software. Conectados entre si, esses neurônios são capazes de “aprender” com repetitivos processos de leitura de padrões de dados conhecidos. A partir daí eles se credenciam a dar respostas a novas situações.

Exemplos clássicos do uso das redes neurais são as avaliações de crédito em bancos e a detecção de fraudes em cartões de crédito. Diante de uma tentativa de compra feita com cartão, sistemas desse tipo avaliam se parâmetros como o horário, valor, localização e outros estão dentro dos padrões esperados para o portador do crédito. Um comportamento fora dos padrões pode definir o bloqueio da compra ou gerar um telefonema de confirmação, por parte da administradora do cartão, ao titular. O procedimento evita, por fim, operações de compra fraudulenta.

Ao leitor, citei apenas três exemplos de algoritmos (análise de cesta de produtos, árvores de decisão e redes neurais). Mas há uma quantidade bastante ampla deles, visando a suprir necessidades variadas no processo de mineração de dados. Dependendo da necessidade, pode-se aplicar mais de uma dessas soluções ao mesmo tempo para obter uma estratégia ainda mais aprimorada.

O que vem por aí

O universo de dados disponíveis tende a aumentar cada vez mais. Um exemplo é a chamada “internet das coisas”. Equipamentos de todos os tipos, tais como geladeiras, fogões, sensores residenciais e automóveis irão gerar informações e comunicar-se de forma contínua com seus proprietários através de smartphones e outros aparelhos. Nos Estados Unidos já existem seguradoras que instalam sensores nos automóveis dos clientes para definir o valor da apólice mediante os padrões de condução detectados.

Outra tendência muito forte é a da utilização de ferramentas e algoritmos que possibilitem a análise de informações de bancos de dados internos, redes sociais e meios de informação em geral, em tempo real, possibilitando a geração de conclusões com base no conjunto dos dados obtidos. Por exemplo: um empresário constata que suas lojas apresentam queda de 20% nas vendas sem razão aparente. Um desses sistemas de análise conclui que há deficiência na assistência técnica por conta de um número anormal de chamados abertos no CRM (Customer Relationship Management). Também conclui que os chamados com prazo longo para a solução consistem em número preocupante. Detecta, ainda, um número de reclamações acima do padrão em sites de consumidores insatisfeitos, como o “Reclame Aqui”, e a alta incidência de comentários desfavoráveis no Twitter. Somando-se a isto, o empresário obtém notícias de que um importante concorrente abriu nova filial, próxima à sua maior loja, com promoções e preços abaixo da média praticada pelo seu estabelecimento. Esse exemplo demonstra todo um cenário desfavorável, mas, nele, o empresário possui todas as informações necessárias para um diagnóstico preciso da situação, o que possibilita a criação de novas estratégias.

É fortíssima, também, a tendência do aparecimento das smart-machines ou “máquinas inteligentes”. A IBM criou uma divisão especial para possibilitar o surgimento de um ecossistema de serviços através do Watson, um computador com “processamento cognitivo”. Esse computador venceu provas de conhecimentos gerais nos EUA, competindo diretamente com humanos. Atualmente ele é usado como ferramenta de apoio em tratamentos médicos de alta complexidade, como o do câncer. Esse tipo de computador é capaz de absorver quantidades imensas de dados e gerar conhecimento em um nível de inteligência elevadíssimo, levando as possibilidades de utilização dos dados a níveis até agora desconhecidos. São máquinas que poderão trabalhar como assistentes de profissionais humanos e, em muitos casos, substituí-los. O impacto não será restrito a profissões menos sofisticadas e tende a ameaçar profissionais das mais diversas áreas. Há estimativas prevendo que 90% dos empregos como conhecemos hoje serão afetados ou desaparecerão nos próximos 15 a 20 anos.

Fica a constatação de que as empresas serão forçadas a olhar para seus dados como uma valiosa e indispensável matéria-prima, um componente para a tomada de decisões estratégicas e essenciais para o sucesso no mercado. Aquelas que não o fizerem terão de lidar apenas com as ameaças, sem usufruir das crescentes oportunidades ao alcance delas.

“As empresas serão forçadas a olhar para seus dados como matéria-prima indispensável. Quem não o fizer terá de lidar apenas com as ameaças, sem usufruir das oportunidades.”