Qual será o futuro das transcrições do Youtube?

Olá! Aqui é o Jonny Ken do Infopod e do Podcast Decodificando e estou aqui a convite do sr Fernando Kanarski nesse mês especial de convidados do Undergoogle para falar um pouco de reconhecimento de voz!

Não é novidade nenhuma que muitas empresas estão trabalhando em software para reconhecimento de voz, provavelmente desde a criação da primeira placa de som. Porém, somente nos últimos anos esse tipo de aplicação começou a aparecer na internet.

Sites como o Tunatic (reconhecimento de música) ou o Podzine (reconhecimento de voz em áudio e vídeo) surgiram, mas acabaram não despontando na rede. Alguém conhecia?

Em julho, aproveitando o gancho das eleições americanas, o Google entrou nesse mercado de reconhecimento de voz com um programa que transcreveu partes dos vídeos de discursos dos candidatos à presidência, e disponibilizou-os nos bancos de dados de buscas. Por causa disso, criou-se um burburinho sobre o que esse sistema poderá fazer  para revolucionar a internet daqui para frente.

Por isso, eu resolvi colocar a minha roupa de “Jonny Mercado” e mostrar como serão os próximos meses. Qualquer semelhança com fatos ou pessoas será mera coincidência. Veja djá!

Julho de 2008 – Google lança programa que transcreve parte dos discursos dos candidatos à presidência.

Junho de 2009–  Google anuncia que transcreveu 100% dos conteúdos do Youtube e dos principais podcasts americanos, aumentando estratosfericamente sua base de dados de busca.

Setembro de 2009 – Para terminar um processo com a RIA, a Google entra em um acordo e utiliza seu novo software para eliminar todos os vídeos sob direitos autorais. Gemidos da Cicarelli são transcritos para apagar todas as cópias do vídeo proibido.

Dezembro de 2009 – O novo algoritmo de transcrição do Google atinge 60% de acerto, ultrapassando a porcentagem do Google Translator!

Janeiro de 2010 – Google inclui uma caixa por busca utilizando a voz ao lado da caixa de busca tradicional, facilitando a vida de quem tem deficiência que dificultam a utilização do teclado. IBM, enfim, abre o código-fonte do Via Voice para tentar salvar o produto, já que ninguém pagará mais a facada que custa o software.

Junho de 2010 – No aniversário de 2 anos da ferramenta, o Google anuncia que a capacidade de acerto chega a 90%. São colocadas legendas em todos os vídeos e as transcrições dos áudios são liberadas.  Com isso, deficientes auditivos não dependerão mais de pessoas para transcrever os vídeos e áudios, e pessoas insatisfeitas com o formato de podcasts pararão de torrar a paciência da Garota sem fio.

Setembro de 2010 – CEO do Google fala em entrevista que o lançamento da ferramenta de transcrição via web foi um grande passo para a utilização em 100% de um computador nas nuvens. Fugita sai nas ruas com uma placa escrito “Eu já sabia!!”.

(créditos: Original da Foto do Fugita por Fore)

Novembro de 2010 – Primeiro caso de Google Bomb usando áudio acontece na internet.

Junho de 2018 – Google anuncia no aniversário de 10 anos do programa de transcrição que, enfim, conseguiu que o Translator acerte 70% das traduções! Com isso, as transcrições poderão ser feitas em  todas as línguas. Traduções e legendas simultâneas de áudio e vídeo acontecerão imediatamente, independentemente da presença de um intérprete.

Julho de 2018 – Primeiro caso de Buffer Overflow nos servidores de transcrição do Google ao tentar processar os 2 Terabytes do Podcast Código Livre edição 217!

Agosto de 2018 – Yahoo decreta falência no mercado de sistema de busca e, finalmente, a Microsoft consegue a fusão.

Dezembro de 2018 – Google desiste do projeto de transcrição de áudios e vídeos brasileiros, alegando que a moda de podcasts e vídeos miguxos da internet 5.0 trouxe uma infinidade de termos impossíveis de transcrever.

Popularity: 16% [?]

Podcast: Visita ao Google, Developer Day e Jaiku

Esta é a terceira vez que participo do Podcast Digital Paper, com os amigos Canha e Aguinelo Pedroso. Nesta edição, falei sobre o contato com o Google Brasil e a visita que alguns blogueiros fizeram à sede da empresa.

Falamos do Google Developer Day, que acontece no próximo dia 27, em São Paulo e sobre a procura e oferta dos convites aos interessados.

Outro assunto tratado no Podcast, foi o da migração para o Jaiku, micro-blogging do Google, devido a instabilidade encontrada no Twitter durante toda a semana passada. Discutimos, num bate-papo descotraído, sobre as vantagens do Jaiku e se ele realmente pode tomar o lugar do Twitter.

Você pode acompanhar o Podcast através do Blog Oficial do Podcast Digital Paper ou ouví-lo abaixo:

Popularity: 4% [?]