Fala Brasil - Laboratório de Processamento de Sinais

F a l a B r a s i l

Reconhecimento de Voz para o Português Brasileiro

 

 

 
Notice: Undefined index: logado in /web/falabrasil/status.php on line 50 Fala Brasil - Laboratório de Processamento de Sinais
  SimonBR

Última atualização: 29/10/2009

Em Desenvolvimento:

  • Tornar o Coruja SAPI compliant.
  • Criação de um novo corpus de texto através de crawling da web.
  • Expansão do LapsStory para 50 horas.
  • Construção do corpus LegislacaoBR com base em áudios da Constituição Federal.
  • Criação de modelos acústicos dependentes de gênero.
  • Implementação de sistemas de diálogos adaptativos: ambientes inteligentes.

 

Etapas concluídas:

  • Construção de um dicionário fonético para o PB com 32 fonemas.
  • Simulações com o corpus Spoltech.
  • Simulações com o corpus OGI-22.
  • Formatação do CETENFolha para o formato XML.
  • Criação da árvore de decisão fonética para o PB.
  • Simulações com modelos de linguagem bigrama.
  • Simulações com modelos de linguagem trigrama.
  • Simulações com modelos de linguagem 4-grama através de rescoring.
  • Construção de um dicionário fonético com 38 fonemas e identificação de vogal tônica.
  • Simulações com o corpus WestPoint.
  • Criação do corpus LapsBenchmark para avaliação de sistemas LVCSR.
  • Criação de um novo corpus de voz baseado em audiobooks - LapsStory com 5 horas.
  • Adaptação de locutor utilizando MAP e MLLR.
  • Testes em tempo-real.
  • Utilização do decodificador Julius.
  • Criação de um sistema ASR baseado em gramáticas.
  • Construção do software (API+Engine+modelos acústicos) Coruja ASR para PB.

 

Fala Brasil - Laboratório de Processamento de Sinais
Grupos do Google
Coruja Users
Visitar este grupo
FalaBrasil - www.laps.ufpa.br/falabrasil - Desenvolvido e mantido por Carlos Patrick Alves