Robo pra consulta web, web crawler, java

Ewerthon_A · Fevereiro 8, 2019, 11:20am

Blz!
Pessoal, estou precisando pegar informações de alguns sites com web crawler, porem nas pesquisas percebi que existe varios sites que possuem “CAPTCHA” antes de fazer a pesquisa no site, como posso resolver isso? reparei que tem alguns topicos parecido mas são antigos e nenhum como resolver esta questão ou como resolveram.

javaflex · Fevereiro 9, 2019, 4:15pm

Se tem captcha, ta mais do que na cara que não é permitido fazer o que deseja. Em último caso existem serviços pagos com humanos do outro lado prontos pra responder esse tipo recurso. Mas não é legal o que pretende fazer, entre em contato com o site pra ver se contrata um webservice.

Ewerthon_A · Fevereiro 9, 2019, 6:39pm

Blz @javaflex!?
Os dados são processos publicos, entrei em contato com varios tribunais 1 ainda esta analisando, alguns sem repostas e a maioria é que não existe webservice para a função,
um caso a ser analisado é que o captcha é resolvido pelo cliente porem no software próprio, assim não burlando nada, Mas o que ninguem consegue me explicar é como existe dezenas de sites onde essa função é executada, 1 desses sistemas deixa “quase claro” que utiliza bots apara ter acesso, porem tem site que é impossivel saber qual URL que é utilizada por esses bots,(URL de alguns tribunais são statica).
Será que o web crawler com java não é mais viavel ?

Robo pra consulta web, web crawler, java

Cursos de Mobile

Cursos de Programação

Cursos de Front-end

Cursos de DevOps

Cursos de Design & UX

Cursos de Business

Cursos de Data & BI