O mundo está se transformando em alta velocidade. Estamos sendo testemunhas de uma revolução tecnológica de dimensões nunca antes vistas.
Data Science
Não se trata de um fato conjuntural. O índice de mudança de paradigma (a velocidade de adoção de novas idéias) está duplicando a cada década: enquanto demorou quase meio século para adotarmos o telefone e várias décadas para aceitarmos a televisão e o rádio, a instauração do computador, da Internet e dos telefones celulares ocorreu em menos de 10 anos. Em 2014, o número de telefones celulares já se equiparava ao número de pessoas no mundo, 7 bilhões, um terço dos quais smartphones; e o número de usuários de Internet alcançou quase os 3 bilhões.
As tecnologias da informação duplicam a cada ano sua capacidade e a relação qualidade/preço, como previu a Lei de Moore, que tem sido cumprida até hoje. A consequência disso é um crescimento exponencial na disponibilidade da tecnologia e uma redução equivalente no seu custo, indiferente às crises vividas nos últimos anos, que previsivelmente continuará a evoluir nas próximas décadas.
Mas esta revolução tecnológica está adquirindo uma nova dimensão nos últimos anos: ao aumentar as funcionalidades técnicas, também está aumentando a capacidade de criar, armazenar e processar informação, com uma taxa também exponencial, o que resultou na designação do fenômeno «big data». Algumas evidências a esse respeito:
- O volume total de dados no mundo duplica a cada 18 meses.
- Mais de 90% dos dados que existem hoje foram gerados nos dois últimos anos.
- A capacidade per capita de armazenar informação duplicou a cada 40 meses desde 1980, e o custo foi reduzido em mais de 90%6.
- A capacidade de processamento foi multiplicada por 300 desde o ano 2000, permitindo o processamento de milhões de transações por minuto.
O impacto desta transformação tecnológica está sendo especialmente relevante no setor financeiro, que soma-se a outras quatro grandes tendências que estão marcando sua evolução:
-
Uma conjuntura macroeconômica caracterizada por um crescimento fraco, taxas de inflação baixas e taxas de juros reduzidas, que penalizou as margens de lucro do setor bancário nas economias maduras durante um prolongado período de tempo; e um comportamento díspar nos países emergentes, com uma tendência para a desaceleração do crescimento e o aumento da inadimplência.
-
Um ambiente normativo mais exigente e intrusivo, onde a regulação adquire um caráter global em termos de governança corporativa, solvência, liquidez, limitação do resgate financeiro de instituições, proteção do consumidor, prevenção da fraude e requisitos de informação e reporte, entre outros.
-
Uma mudança profunda no comportamento do cliente, que agora tem maior cultura financeira, espera e exige excelência nos serviços, enquanto manifesta uma crescente confusão perante a complexidade e disparidade da oferta, o que o torna mais dependente dos líderes de opinião.
-
A entrada de novos concorrentes no mercado financeiro, alguns deles com novos modelos de negócio que afetam o status quo.
O efeito combinado destes quatro fatores, juntamente com a transformação tecnológica, está fazendo com que, entre outras questões, nos enfoquemos no uso eficiente da informação, possibilitando, assim, a entrada de uma disciplina no setor financeiro até agora mais enfocada no setor tecnológico: data science.
Data science, ou ciência dos dados, é o estudo da extração generalizável de conhecimento a partir dos dados por meio do uso combinado de técnicas de aprendizagem automática, inteligência artificial, matemática, estatística, bancos de dados e otimização, em conjunto com uma compreensão profunda do contexto de negócios.
Todas estas questões já eram empregadas no âmbito financeiro em graus distintos, mas esta disciplina tem características que a tornam indispensável para enfrentar a transformação do setor que já está ocorrendo.
Especificamente, todos os elementos do complexo contexto enfrentado pelo setor financeiro mencionado anteriormente requerem dados abundantes e técnicas analíticas complexas para que sejam enfrentados, que é exatamente o campo de especialidade da data science. Além disso, data science é uma disciplina potencializada como consequência do fenômeno big data e, portanto, os data scientists são profissionais qualificados para lidar com quantidades massivas de dados desestruturados (como por exemplo, os provenientes de redes sociais), cada vez mais relevantes para as instituições.
Por outro lado, esta explosão na geração, no acesso, no processamento e no armazenamento dos dados, e na tomada de decisões baseadas nos mesmos, somada a outros fatores conjunturais descritos, não passou despercebida por parte dos reguladores. De fato, há uma tendência global sustentada, entre outros, pelo Comitê de Supervisão Bancária de Basileia (por meio da norma BCBS 239), para a exigência de um framework robusto de governança de dados, que garanta sua qualidade, integridade, rastreabilidade, consistência e replicabilidade para a tomada de decisões, especialmente (mas não apenas) no âmbito de Riscos.
Esta tendência é complementada com a promovida pela Federal Reserve e a OCC dos EUA, que exige das instituições um framework robusto de governança dos modelos, para controlar e mitigar o risco derivado de sua utilização, conhecido como «risco de modelo»9.
As instituições financeiras estão avançando de forma decisiva no desenvolvimento destes frameworks de governança (dados e modelos) que, conjuntamente, formam a governança das capacidades da data science.
Diante deste ambiente em constante mudança, a transformação das instituições financeiras não é uma possibilidade; é uma necessidade para assegurar a sobrevivência. Uma transformação intimamente ligada à inteligência, que, em suma, é a capacidade de receber, processar e armazenar informação para resolver problemas.
Neste contexto, o presente estudo pretende descrever, de forma prática, o papel desempenhado pela disciplina de data science, mais especificamente, no setor financeiro. Para tal, o documento está estruturado em três seções, que respondem a três objetivos:
- Descrever a revolução tecnológica em que o setor financeiro está imerso e suas consequências.
- Introduzir a disciplina de data science, descrever as características do data scientist e analisar as tendências observadas a esse respeito, assim como seu impacto nos frameworks de governança dos dados e dos modelos nas instituições financeiras.
- Expor um estudo de caso para ilustrar a aplicação da data science no setor financeiro, que consiste no desenvolvimento de um modelo de scoring de crédito para pessoas físicas utilizando dados extraídos de redes sociais.
Para mais informações, acesse o documento completo em PDF clicando aqui (também disponível em Espanhol e Inglês).