Fala Brasil - Laboratório de Processamento de Sinais

F a l a B r a s i l

Reconhecimento de Voz para o Português Brasileiro

 

 

 
Notice: Undefined index: logado in /web/falabrasil/descricao.php on line 50 Fala Brasil - Laboratório de Processamento de Sinais
  SimonBR

 

Descrição

O grupo concentra-se prioritariamente em ações visando desenvolver e disponibilizar recursos para a construção de sistemas de reconhecimento automático de voz para o Português Brasileiro. Vários recursos já foram desenvolvidos: dicionários fonéticos, modelos de linguagem, modelos acústicos, novos corpora de voz e texto, entre outros.

Novos recursos e ferramentas estão sendo desenvolvidos. Dentre os quais destacam-se:

  • Coruja: um sistema de reconhecimento de voz com suporte a “ditado”. Em contraste com sistemas mais simples, baseados em gramáticas, tal sistema permitirá o desenvolvimento de aplicativos como transcrição forense, criação automática de legenda, entre outros.
  • Tornar o sistema Coruja compatível com a interface de programação SAPI (Speech API) da Microsoft. Essa iniciativa visa facilitar a utilização do Coruja em aplicativos destinados a plataforma Windows.
  • Criar um procedimento simples que permita ao usuário fazer o “down-sizing” do Coruja, criando versões customizadas para os aplicativos a serem desenvolvidos. Esse processo consiste em reduzir o vocabulário e o modelo acústico, baseando-se na gramática fornecida pelo usuário.
  • Implementar um algoritmo para estimar a confiança (“confidence”) de reconhecimento. Permitir que o sistema rejeite hipóteses com baixa confiança. Isso evita que o sistema reaja a palavras que sequer pertençam ao seu vocabulário.
  • Construir aplicativos como “prova-de-conceito” tendo em vista pessoas sem formação específica em processamento de voz e que precisem usar a tecnologia. Fomentar a formação de recursos humanos para o desenvolvimento tanto de sistemas de reconhecimento de voz, quanto para aplicativos com interface aural.
  • Desenvolver o SimonBR, um sistema para comando e controle em Português Brasileiro que funcione tanto no Linux quanto no Windows. Esse sistema será baseado no projeto Simon, um open-source speech recognition, e permitirá que usuários possam utilizar a voz navegar em aplicativos de ambos sistemas operacionais.
  • Com base no Coruja, disponibilizar um sistema de criação automática de legendas para programas televisivos.
  • Desenvolver novos algoritmos visando incrementar o desempenho do sistema de reconhecimento de voz. Uma das prioridades consiste no melhoramento do dicionário fonético através do estudo das variações da fala no Brasil e da modelagem acústica através do uso de técnicas para treinamento discriminativo das cadeias escondidas de Markov (HMMs).

 

 

Fala Brasil - Laboratório de Processamento de Sinais
Grupos do Google
Coruja Users
Visitar este grupo
FalaBrasil - www.laps.ufpa.br/falabrasil - Desenvolvido e mantido por Carlos Patrick Alves