SOMENTE NO ACERVO
DA REVISTA CH
 
   
   
   
   
   
   
   
 

 

 NOTÍCIAS :: CIÊNCIA DA COMPUTAÇÃO

Reconhecimento de voz com 95% de acerto
Técnica permitiria reforçar segurança em sistemas de identificação por computador

Se você detesta a tinta preta grudada em seus dedos quando tira impressões digitais, ou se apavora com a possibilidade de ver o dinheiro de sua conta transferido para a Suíça por um hacker, pode se animar: foi desenvolvida uma técnica de reconhecimento de voz por computadores com índice de acerto de até 95%. Elaborado pelo engenheiro Roberto Sória em sua tese de mestrado pela Universidade de São Paulo (USP), o sistema poderá aumentar o nível de segurança das identificações feitas, por exemplo, na internet.

A técnica desenvolvida por Sória se divide em duas etapas: treinamento e reconhecimento. No treinamento, são gravadas frases -- foneticamente balanceadas -- ditas pelo usuário. A voz é digitalizada para que sejam extraídas suas características, como a freqüência fundamental, que dá o tom da voz, e as freqüências de ressonância do aparelho fonador. Em seguida, essas características são transformadas em conjuntos de matrizes e números, que passam por um software que simula matematicamente o funcionamento do cérebro (rede neural artificial). Surge desse processo uma nova matriz, definitiva, que vai identificar a voz de cada um.

O passo seguinte é o reconhecimento: o usuário se identifica e tem a voz analisada. Se as características extraídas forem iguais e a matriz a mesma, o sistema reconhece a voz do usuário. O processo é semelhante ao adotado em caixas eletrônicos de bancos: com um cartão, o correntista se identifica. Depois, o caixa pede a senha, para confirmar a identidade.

"Em todos os casos em que uma senha é necessária, a troca pela identificação por reconhecimento de voz aumentaria a segurança" diz Sória. Na internet, os exemplos são numerosos: compras com cartão de crédito, transferências em conta corrente, áreas de acesso restrito, correio eletrônico, entre outros. "As senhas podem ser descobertas, mas sua voz é como a impressão digital: impossível falsificar."

A singularidade de cada voz se deve à estrutura do aparelho fonador, das cordas vocais aos lábios. Como as freqüências de ressonância resultantes são diferentes para cada indivíduo, mesmo irmãos gêmeos não apresentam vozes iguais.

Sória esclarece que mesmo os melhores imitadores de vozes não poderiam burlar o sistema: "Para ser robusto, o sistema deve analisar e ser treinado com freqüências altas, que não podem ser percebidas pelo ouvido humano com facilidade e não são imitadas." Pelo mesmo motivo, o sistema pode não ser afetado por casos de resfriado ou rouquidão, pois as freqüências mais altas não são alteradas. Para aumentar a segurança, o sistema pede que o usuário diga um conjunto de palavras escolhidas aleatoriamente, o que evita que gravações sejam usadas para enganar o mecanismo.

São necessárias novas pesquisas para que o sistema de Sória esteja disponível para o consumidor. Segundo ele, o índice de 95% ainda não é ideal para o mercado. "Para ter viabilidade comercial, precisamos atingir a marca de 99% de acerto, o que ainda não foi conseguido."

Tiago Lethbridge
Ciência Hoje on-line
13/08/01

 

 
  INÍCIO O INSTITUTO CH ON-LINE REVISTA CH CH DAS CRIANÇAS APOIO À EDUCAÇÃO CONTATO