Banca de DEFESA: LUCIANA MAIARA QUEIROZ DE SANTANA
06/07/2017 08:30
Inúmeras tarefas de aprendizagem exigem lidar com dados sequenciais, a exemplo de tradutores de textos, geradores de músicas, entre outros. Os sistemas que utilizam redes neurais profundas (DNN) têm mostrado resultados promissores no reconhecimento automático de fala (ASR), onde um dos maiores desafios é o reconhecimento em sinais de voz contaminados com ruído. Para este trabalho, combinamos duas arquiteturas conhecidas de aprendizagem profunda, as redes neurais convolucionais (CNN) para abordagem acústica e uma arquitetura recorrente com classificação temporal conexionista (CTC) para modelagem sequencial. As redes neurais recorrentes são modelos que capturam a dinâmica da sequência através de uma topologia que contém ciclos, ao contrário das redes neurais acíclicas ou de alimentação direta (feedforward). O modelo estudado neste trabalho é um caso particular de rede recorrente profunda que, ao contrário de seus correlatos de arquitetura rasa, é capaz de reter um estado que pode representar informações de uma janela de contexto arbitrariamente longa. Os resultados experimentais mostraram que a arquitetura proposta alcançou um desempenho superior quando comparado ao modelos clássico, modelo oculto de Markov (HMM), em testes realizados sobre as mesmas bases de dados.
SIGAA | Superintendência de Tecnologia da Informação/UFS | Telefonista/UFS (79)3194-6600 | Copyright © 2009-2024 - UFRN v3.5.16 -r19110-7eaa891a10