Ciência da Computação detecta hiperônimos com uso de algoritmos
O hiperônimo é uma das partes da semântica mais comuns na internet. Hiperônimos são palavras de sentido mais genérico, enquanto hipônimo é oposto, ou seja, palavras de sentido mais especifico. Pensando na aplicação de hiperônimos na inteligência artificial, o acadêmico do mestrado em ciência da computação Gabriel Escobar Paes produziu o projeto ‘Detecção de hiperônimos em português’.
Para detectar as relações entre hipônimos e hiperônimos o estudante utiliza o DIVE (distributional inclusion vector embedding), um algoritmo não supervisionado para a descoberta de hiperônimos em um corpus. No trabalho foram realizados a implementação do algoritmo DIVE utilizando o framework PyTorch, criação de datasets em português para a avaliação de modelos de descoberta de hiperônimos, coleta de corpus em português para o treinamento do DIVE não supervisionado e a realização e análise de experimentos para verificar a capacidade do DIVE em português.
“Fizemos a coleta de um corpus para um treinamento não supervisionado, de textos da Wikipédia, e fizemos experimentos comparando o DIVE com outro algoritmo não supervisionado chamado word2vec, que não é especifico para este tipo de relação. E entre os resultados dos experimentos, concluímos que o DIVE é comparável com word2vec nos datasets mais fáceis, e supera o word2vec nos datasets mais difíceis. Ainda estamos com andamento do uso de uma ferramenta BERT para identificar padrões em palavras”, concluiu.
João Barbosa Marques – Estagiário em Jornalismo