Análise preditiva do mercado de ações com processamento de linguagem natural
Abstract
Este projeto tem o objetivo de prever o valor de ações diversas no mercado de
ações brasileira (B3) utilizando notícias disponibilizadas em sites online sobre a
empresa as quais pertencem. Para tal, foi desenvolvido uma solução utilizando a
linguagem Python no ambiente do Google Colab, nele o usuário define o nome da
empresa que deseja pesquisar e um Web Crawler automaticamente retorna os links
das notícias desta empresa, estes links são então acessados e o seu conteúdo é
copiado, resumido e gravado em um arquivo de texto. Em seguida, estes dados foram
submetidos por um processo de análise de linguagem natural que permitiu definir o
sentimento de cada frase e então classificá-las, em relação ao desempenho da
empresa, em “positivo”, “negativo” e “neutro”. Esta classificação é feita com o auxílio
de um banco de dados gravado em um arquivo no formato json, que contém frases já
atribuídas à suas classificações. Este arquivo é utilizado no treinamento da rede
neural e diretamente impacta no desempenho da avaliação. De forma geral, este
projeto alcançou seu objetivo, o código funcionou corretamente em todas as etapas e
os resultados encontrados foram condizentes com as expectativas: notícias sobre
quedas na bolsa retornam sentimentos negativos, notícias sobre valorização do ativo
comercializado pela empresa são compreendidos como sentimentos positivos.