Blz!
Pessoal, estou precisando pegar informações de alguns sites com web crawler, porem nas pesquisas percebi que existe varios sites que possuem “CAPTCHA” antes de fazer a pesquisa no site, como posso resolver isso? reparei que tem alguns topicos parecido mas são antigos e nenhum como resolver esta questão ou como resolveram.
Se tem captcha, ta mais do que na cara que não é permitido fazer o que deseja. Em último caso existem serviços pagos com humanos do outro lado prontos pra responder esse tipo recurso. Mas não é legal o que pretende fazer, entre em contato com o site pra ver se contrata um webservice.
Blz @javaflex!?
Os dados são processos publicos, entrei em contato com varios tribunais 1 ainda esta analisando, alguns sem repostas e a maioria é que não existe webservice para a função,
um caso a ser analisado é que o captcha é resolvido pelo cliente porem no software próprio, assim não burlando nada, Mas o que ninguem consegue me explicar é como existe dezenas de sites onde essa função é executada, 1 desses sistemas deixa “quase claro” que utiliza bots apara ter acesso, porem tem site que é impossivel saber qual URL que é utilizada por esses bots,(URL de alguns tribunais são statica).
Será que o web crawler com java não é mais viavel ?