Acadêmico apresenta pesquisa sobre classificação automática dos textos

Postado por: Gabriele Silva

O acadêmico Marcos Gôlo, do curso de Sistemas de Informação no Campus de Três Lagoas (CPTL), desenvolve desde 2017 o projeto “Aprendizado de máquina semissupervisionado baseado em uma única classe para a classificação automática de textos”, orientado pelo professor Rafael Geraldeli Rossi. O acadêmico estará presente na terceira edição do Integra UFMS. 

Marcos Gôlo, acadêmico do curso de Sistemas de Informação do Campus de Três Lagoas.

O projeto é vinculado ao Programa de Iniciação Cientifica (PIBIC) e surgiu devido a quantidade massiva de documentos e dados na internet que impossibilitam a seleção, organização e a obtenção do conhecimento por meio da análise manual dos textos. A partir dessa problemática, o discente iniciou sua pesquisa, primeiramente bibliográfica, estudando sobre inteligência artificial e aprendizado de máquina baseado em uma única classe para posteriormente iniciar a efetiva implementação da proposta. 

“O objetivo do trabalho é fazer com que o computador aprenda a distinguir textos de uma determinada categoria, por exemplo, esportes, corrupção na Petrobras, etc., porém o tipo de aprendizado utilizado aqui considerará que o usuário fornecerá exemplos apenas da categoria de interesse para que o algoritmo aprenda e não exemplos de todas as categorias de um domínio, como ocorre comumente na literatura.  Com isso, será possível criar sensoriamentos na internet ou sistemas de recomendação de maneira mais simples e rápida”, explica Marcos. 

Foram reunidas coleções de textos de diferentes domínios, como páginas web, postagens em redes sociais, artigos científicos e documentos médicos, para ao final serem implementados algoritmos formulados pelo acadêmico e seu orientador. O projeto fora executado no Laboratório de Inovação em Engenharia de Software (LIVES) e foram implementados os algoritmos de aprendizado de máquina baseados em uma única classe supervisionados, aprendem apenas considerando textos que tenham sua categoria informada e semissupervisionados, os algoritmos aprendem considerando tanto os textos rotulados quando não rotulados.

O estudante espera que o evento seja uma grande oportunidade de aprimorar seu projeto, seja na apresentação oral, seja com sugestões dos ouvintes que estarão prestigiando o acontecimento. Marcos foi selecionado para representar a Universidade no 16º Prêmio Destaque na Iniciação Cientifica e Tecnológica do CNPq, além de ter exposto seus estudos no SIICUSP, evento cientifico que ocorreu na USP em São Carlos, ambos no ano de 2018.

O acadêmico deseja ampliar seu projeto futuramente, que agregou amplamente em sua vida acadêmica e na próxima semana representará o melhor curso de Sistemas de Informação do estado e o 11ª do Brasil no Integra UFMS.

Texto: Evelyn da Costa Souza (estagiária do CPTL) e Gabriele Cássia ( Monitora Integra UFMS).