Acabei de ler essa matéria na INFO Online.
É realmente impressionante!!!
Você digita uma palavra e ele indexa as ocorrencias desta nos trechos dos vídeos.
SÃO PAULO - O Google estreou um novo recurso de busca que analisa o áudio de vídeos postados no YouTube.
Apelidado de Gaudi, o Google Audio Indexing usa uma tecnologia que analisa as palavras ditas ao longo de um vídeo e as registra numa base de dados.
Assim, quando o usuário faz uma busca por um termo ou uma expressão, pode encontrar os vídeos em que estes termos são ditos e em que momento da gravação são proferidos.
Se o usuário deseja encontrar, por exemplo, uma declaração mais forte ao longo de um vídeo de muitos minutos, pode encontrar exatamente o momento em que tal declaração é dita, fazendo uma busca pela expressão.
Atualmente, o Gaudi só lê vídeos postados no canal de política do Google e no idioma inglês. Com o tempo, o Google pretende ampliar o uso da tecnologia em sua modesta missão de organizar a informação de toda a internet.
Uma busca pela palavra “Brazil” no Gaudi, por exemplo, exibe 10 resultados. Nos vídeos, políticos como o democrata Barack Obama e o ex-prefeito de Nova York Rudolph Giuliani fazem referências ao Brasil.
Na maior parte das ocorrências, o Brasil é citado como um parceiro estratégico na área da energia, em função da produção local de etanol e da descoberta de novas reservas de petróleo.
Mass… se a gente parar pra pensar, reconhecimento de voz é uma tecnologia bem antiga. A 10 anos atrás já existia o IBM Via Voice que de certa forma reconhecia corretamente o que era falado, inclusive em português.
Em hipótese alguma quero tirar os méritos do google, só quero dizer que não é uma tecnologia exclusiva do google.
É claro também que não deve ter sido fácil, visto que um vídeo pode ter o áudio de diversas maneiras freqüências e sei lá mais que dificuldade tem nesse reconhecimento.
Karaka, esses dias mesmo estava pensando se existia algo assim.
Estava precisando encontrar uma música que eu só sabia a letra.
Seria ótimo só digitar parte da letra e buscasse os arquivos de audio (em vez da letra da música), tipo mp3, que contivessem esse trecho e desse pra você escutars em precisar ficar na incerteza se é aquela mesmo.
É por essas e outras que acredito que o Google vai dominar a computação nos próximos anos.
Tenho ouvido muita gente dizer que em breve os computadores, não mais terão sistemas operacionais como conhecemos hoje que ocupa muito espaço e utiliza muita memória e sim apenas um SO leve e um browser com todas as funcionalidades necessárias.
Sinceramente, acredito muito nisso e aposto que o Google será fundamental.
[size=18]Meu, to com medo… será qu o anti-cristo é o presidente do Google? rs[/size]
Bom, sacanagem à parte, os caras são muito bons e a única diferença entre eles e a maioria dos programadores é que eles tem as mesmas idéias, mas correm atrás (devido a grana que os caras tem) para fazer funcionar…
Com certeza essas duas horas de projetos pessoais estão dando muito resultado…
Qual será o salario da galera que trabalha no Google, US$ 500,00/Hora??? rs
Mass… se a gente parar pra pensar, reconhecimento de voz é uma tecnologia bem antiga. A 10 anos atrás já existia o IBM Via Voice que de certa forma reconhecia corretamente o que era falado, inclusive em português.
Em hipótese alguma quero tirar os méritos do google, só quero dizer que não é uma tecnologia exclusiva do google.
É claro também que não deve ter sido fácil, visto que um vídeo pode ter o áudio de diversas maneiras freqüências e sei lá mais que dificuldade tem nesse reconhecimento.
:)[/quote]
Na minha opinião, o pulo do gato está em juntar as partes e gerar uma nova solução. Por isso também concordo com os créditos para o Google.
Com relação ao reconhecimento de voz, é sim uma tecnologia conhecida há um bom tempo e o IBM Via Voice já havia trazido esta tecnologia ao usuário. Agora o Google está integrando a um serviço de vídeos acessado por milhões de usuários. Também concordo que não deve ter sido fácil devido a carga de dados e aos diferentes formatos de áudio.
Apenas para finalizar, outra tecnologia que já existe há certo tempo e vem sendo inserida e integrada atualmente, é a tecnologia touch screen. Podemos notar ela no iPhone, Microsoft Surface, aquela TV do Fantástico, etc…
Caramba…fiquei impressionado com isso. Embora a tecnologia de reconhecimento de voz seja antiga, ainda hoje, principalmente o reconhecimento da fala contínua, é um desafio… são inúmeros problemas. Além disso, deve ser uma base de dados muito doideira… os algoritmos utilizados muitas vezes consumem muito tempo de processamento. Será que existe alguma forma de saber sobre quais abordagens (Redes Neurais, Quais características, Segmentação (separação das palavras ou fonemas), etc… ) eles estão usando?
Como dito pelo um colega ai sobre a IBM eu vendia esse aplicativo e cheguei a testar.Mas ele nao fazia pesquisa de audio dentro de vídeos o que é uma tecnologia melhor do que o IBM Via voice tinha.
A idéia nao é impossível de se fazer pois para se fazer parecido pode-se transcrever o que foi dito no vídeo para um Banco de dados e mostrar exatamente o tempo no video onde elas aparecem.
Já tive clientes que nos pediram algo parecido para ter em seus servidores esse tipo de pesquisa o unico problema que não quiseram pagar o que pedimos para tanto. hehehe
Acredito que seja dessa forma… um BD com palavras chaves cadastradas , seu tempo onde aparecem e isso se monta com um Select da vida no banco de dados.
Bem ainda n deve estar em servidores decentes de produção, e só com o post aqui no Guj já deve ter sido o suficente para matar o sistema! O Google agora vai abrir um processo contra o Guj por ataque DoS… :twisted:
[quote]Google Error
Server Error
The server encountered a temporary error and could not complete your request.
Please try again in 30 seconds.[/quote]
Parece ser muito interessante, um dia destes confiro… quando estiver funcionando outravez ou não…
Ou então o projeto foi para o fundo da gaveta encher de pó…
Quanto a qualidade dos servidores sao bons.Tudo Polycom.
Agora quanto a estar no ar é outra estória.Devem ter desligado.
Ou tirado o projeto do ar por outras razoes.
eu cheguei a testar e o negócio presta.