O reconhecimento de voz, a fronteira inacessível

O autor tem estado ativamente envolvido com o reconhecimento de voz por mais de dez anos. Isso inclui treinamento intensivo pela IBM com a sua tecnologia Via Voz, resultando em designação como um Speech Recognition Specialist.

Quando o reconhecimento de fala primeiro hit dos anos de PC atrás era com a promessa de um mundo controlado por voz. Nós seria capaz de executar nossos computadores e ditar para criar conteúdo com as mãos firmemente fora do teclado.

Realidade em breve definido em que se tornou claro que os computadores e os aplicativos que nos ouviu, não eram muito precisos. Não ajudou que os programas de reconhecimento de voz intensivos necessários PCs pesados ​​até mesmo trabalhar.

hardware de computação melhorado ao longo dos anos seguintes e os programas ficaram mais precisas em interpretar o que os humanos falou. Mesmo assim, não era preciso o suficiente para obter muitos para colocar as mãos em seus bolsos e falar com o computador.

Temos agora o reconhecimento de voz em smartphones, tablets e PCs, mas para além de ditar frases curtas alguns proprietários estão usando-o. introdução de Siri e sua entrada de voz-centric da Apple reacendeu o interesse brevemente na entrada de voz. Enquanto você frequentemente vê alguém falar com Siri no início, não me lembro a última vez que eu vi isso.

Mesmo a entrada de voz em um ambiente totalmente tranquilo usando um fone de ouvido de alta qualidade com cancelamento de ruído só você fica precisão de reconhecimento de 90-95 por cento.

Mesmo com mais de uma década de evolução no reconhecimento de fala, ainda não é precisa o suficiente para atrair usuários no. As empresas que fazem a tecnologia são rápidos para nos dizer os seus produtos são 90+ por cento exato em interpretar a fala, mas isso ainda não é bom o suficiente. Isso é uma admissão de que 5 a 10 de cada 100 palavras faladas não serão corretamente traduzidos em texto digital.

Não ajuda que a edição discurso interpretado incorretamente por voz é um exercício de frustração.

Conheço alguns que ditar mensagens de texto em seus telefones e eles estão felizes de fazer isso. Quando eu assisti-los, no entanto, não é incomum vê-los lixo mau reconhecimento e fazê-lo novamente. Às vezes eles fazem isso uma e outra vez. Nos casos em que teria sido mais rápido para apenas polegar tipo que mensagem curta para o telefone.

Nada mais do que uma breve mensagem tarifas ainda pior, com erros surgindo regularmente. O ruído ambiente mais pior a interpretação que resulta. Mesmo a entrada de voz em um ambiente totalmente tranquilo usando um fone de ouvido de alta qualidade com cancelamento de ruído só você fica precisão de reconhecimento de 90-95 por cento.

Então, quando é que vamos ver o reconhecimento de voz bom o suficiente para se tornar onipresente? Introduzir texto por voz é mais fácil do que escrever para algumas pessoas. Não é que eles estão evitando é, é que não é muito bom.

Eu tenho tentado usar o reconhecimento de voz para mais de uma década, eo que vejo hoje é apenas um pouco melhor do que o que vi naquela época. O hardware é muito melhor do que foi nos primeiros dias de reconhecimento de fala, mas que apenas deixa no texto interpretado incorretamente mais rápido.

Falando ao telefone ou outro dispositivo é OK para as entradas curtas, como mensagens de texto, mas mais do que isso e todas as apostas estão fora. O sonho de anos atrás ainda é um sonho, e isso é uma vergonha.

Estes iPhones e iPads serão todos se tornam obsoletos em 13 de Setembro

iPhone livre 7 a oferta da T-Mobile requer custos iniciais e muita paciência

Aqui está o que os proprietários de Android fazer quando a Apple lança um novo iPhone

Star Trek: 50 anos do futurismo positivo e comentário social bold; Microsoft de Superfície all-in-one PC disse a manchete lançamento hardware de Outubro; Hands on com o iPhone 7, novo Apple Watch, e AirPods; Google compra Apigee para $ 625.000.000

? Mercado M2M salta para trás no Brasil

A Apple; Estes iPhones e iPads serão todos se tornam obsoletos em 13 de setembro; Mobilidade; livre iPhone 7 a oferta da T-Mobile requer custos iniciais e muita paciência; iPhone; Aqui está o que os proprietários de Android fazer quando a Apple lança um novo iPhone; Inovação;? Mercado de M2M salta para trás no Brasil

entrada de voz onipresente é como o escritório sem papel