Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: ELISALVO ALVES RIBEIRO
DATA: 14/08/2015
HORA: 15:00
LOCAL: Auditorio da ADUFS
TÍTULO: Imputação de Dados Faltantes via Algoritmo EM e Rede Neural MLP com o método de Estimativa de Máxima Verossimilhança
para aumentar a acurácia das estimativas
PALAVRAS-CHAVES: Redes Neurais Artificiais MLP, Método de Estimativa de Máxima Verossimilhança, Algoritmo EM, imputação de dados, imputação única, imputação múltipla, dados faltantes.
PÁGINAS: 160
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Matemática da Computação
ESPECIALIDADE: Modelos Analíticos e de Simulação
RESUMO:
Base de dados com valores faltantes é uma situação frequentemente encontrada no mundo
real, sendo as causas deste problema originadas por motivos diversos (falha no equipamento
que transmite e armazena os dados, falha do manipulador, falha de quem fornece a informação,
etc.). Tal situação pode tornar os dados inconsistentes e inaptos de serem analisados,
conduzindo à conclusões muito viesadas. A maioria das ferramentas utilizadas nos softwares
estatísticos é simples, não conseguindo resolver da forma mais adequada tal problema. Esta
dissertação tem como objetivo explorar o emprego de Redes Neurais Artificiais MLP, com
novas funções de ativação, considerando duas abordagens (imputação única e imputação
múltipla). Primeiramente, é proposto o uso do Método de Estimativa de Máxima
Verossimilhança na função de ativação de cada neurônio da rede, em contrapartida à abordagem
utilizada atualmente, que é sem o uso de tal método, ou quando o utiliza é apenas na função de
custo (na saída da rede). Em seguida, são analisados os resultados destas abordagens em
comparação com o algoritmo EM que é o estado da arte para tratar dados faltantes. Os resultados
obtidos indicam que ao utilizar a Rede Neural Artificial MLP com o Método de Estimativa de
Máxima Verossimilhança, tanto em todos os neurônios como apenas na função de saída, pode
auxilia a reduzir o erro de imputação. Estes resultados foram mensurados via algumas métricas,
sendo as principais o MAE (Mean Absolute Error) e RMSE (Root Mean Square Error), as quais
apresentaram melhores resultados na maioria dos experimentos quando se utiliza a RNA MLP
abordada neste trabalho para fazer imputação única e múltipla.