Buscadores brazucas

Pessoal bom dia!

Estava navegando de bobeira na net até que encontrei alguns buscadores brazucas, achei mto legal ter esta tecnologia aqui no nosso país, e tem um que se chama cadecar que parece ser feito em java.

Gostaria de perguntar a vcs como faço para começar a estudar esta tecnologia, pois tenho interesse em estudar esta tecnologia, quem sabe até fazer uma pós ligada ao assunto…

Tenho mta curiosidade em saber como estes caras do cadecar conseguem arrumar o que vc escreveu?? e como eles indexam os sites específicos para carros…

Vlw.

:arrow: comece por aprender [color=blue]inglês[/color] e [color=red]matemática aplicada[/color] bem.

:arrow: o que pode variar entre um sistema e outro é a implementação, e não os conceitos (conceitos estes, a saber: algoritmos, inteligência coletiva, information retrieval, inteligência artificial, search etc)!

:arrow: se quiser ir ‘brincando’ enquanto estuda [color=blue]inglês[/color] e [color=red]matemática aplicada[/color], dá uma olhada nos livros da editora manning, especialmente os de java.

Vlw pela resposta pcassiano…

Então comecei a fazer algumas pesquisas sobre o assunto… não parece ser tão simples como pensava… rs

Qto ao inglês tranquilo… agora matemática… serei o que, cálculo, algebra… etc…

Vou deixar algumas dúvidas para tentar iniciar minhas pesquisas…

Referente a este site http://www.cadecar.com.br … como os caras fazem para qdo vc escreve por ex: fist istilo ele te sugerir fiat stilo… como eles fazem para indexar os dados so para carros… isto que não entendo… pois o google indexa tudo… e pelo que andei estudando ele usa as meta-tags, descriptions e também o conteúdo da página…

Vlw pela ajuda… vou correr atras agora enquanto a empolgação esta a mil… rs.

Abraços

:arrow: dá uma olhada no lucene; pesquise também por “did you mean”, em strings de pesquisa como “how to implement did you mean + lucene” (sem as aspas), ou “java + did you mean” (novamente, sem as aspas…

:arrow: mais um conceito para você pesquisar: o conceito de (web) crawler

outra coisa:

:arrow: acho que vale à pena também estudar um pouco de perl e regex

:arrow: joga no google data scientist e leia tudo o que aparecer pela frente! :wink:

pcassiano muito obrigado pela ajuda… clariou muito agora as coisas rs…

So mais uma coisa… achei alguns crawler em java… segue a lista abaixo:
* Heritrix
* WebSPHINX
* JSpider
* WebEater
* WebLech
* Arachnid
* JoBo
* Web-Harvest
* Crawler4j
* Ex-Crawler
* Bixo

Você saberia me indicar um destes para iniciar meus estudos?

Vlw.

dá uma olhada no apache nutch. tem livro no site da editora manning. :wink: