Banca de DEFESA: ELISALVO ALVES RIBEIRO
20/07/2015 10:58
Base de dados com valores faltantes é uma situação frequentemente encontrada no mundo
real, sendo as causas deste problema originadas por motivos diversos (falha no equipamento
que transmite e armazena os dados, falha do manipulador, falha de quem fornece a informação,
etc.). Tal situação pode tornar os dados inconsistentes e inaptos de serem analisados,
conduzindo à conclusões muito viesadas. A maioria das ferramentas utilizadas nos softwares
estatísticos é simples, não conseguindo resolver da forma mais adequada tal problema. Esta
dissertação tem como objetivo explorar o emprego de Redes Neurais Artificiais MLP, com
novas funções de ativação, considerando duas abordagens (imputação única e imputação
múltipla). Primeiramente, é proposto o uso do Método de Estimativa de Máxima
Verossimilhança na função de ativação de cada neurônio da rede, em contrapartida à abordagem
utilizada atualmente, que é sem o uso de tal método, ou quando o utiliza é apenas na função de
custo (na saída da rede). Em seguida, são analisados os resultados destas abordagens em
comparação com o algoritmo EM que é o estado da arte para tratar dados faltantes. Os resultados
obtidos indicam que ao utilizar a Rede Neural Artificial MLP com o Método de Estimativa de
Máxima Verossimilhança, tanto em todos os neurônios como apenas na função de saída, pode
auxilia a reduzir o erro de imputação. Estes resultados foram mensurados via algumas métricas,
sendo as principais o MAE (Mean Absolute Error) e RMSE (Root Mean Square Error), as quais
apresentaram melhores resultados na maioria dos experimentos quando se utiliza a RNA MLP
abordada neste trabalho para fazer imputação única e múltipla.
SIGAA | Superintendência de Tecnologia da Informação/UFS | Telefonista/UFS (79)3194-6600 | Copyright © 2009-2024 - UFRN v3.5.16 -r19130-f2d2efc73e