Pegar valores de um site que usa Javascript

Olá, estou desenvolvendo um programa que pega alguns nomes de cursos dentro do site do SENAC, mas os mesmos encontram-se dentro de javascript. Existe alguma biblioteca, como o jsoup faz com o html, que possa utilizar para este fim no meu projeto?

Obs.: Já estou utilizando JSoup para pegar alguns dados da página html, mas não consigo acessar o javascript.

Aqui vai um exemplo do conteúdo javascript, sendo que o valor que quero pegar é Bacharelado em ciências contábeis - EAD:

<td width="99%" class="item-lista-cursos-tecnicos"><script language="javascript">

 var flagExterno='T';
 var linkExterno='http://www.ead.senac.br/graduacao/bacharelado-em-ciencias-contabeis/';


 if(flagExterno=='T'){


var _arr=','+__OPEN_COURSE_GE+',';
var isEADOpen=false;
if(_arr.indexOf(',20396,')!=-1){
isEADOpen=true;
}

document.write('<a href="'+linkExterno+'" style="font-family:tahoma,arial,verdana; color:#676767; font-size:12px !important; text-decoration:none;" target="_top">'+
'Bacharelado em Ciências Contábeis – EAD'+
'</a>'+
(isEADOpen?'<span style="font-size:11px; color:#007FFF;">&nbsp;&nbsp;#inscri&ccedil;&otilde;es abertas</span>':'')+
''
);
 }else{


 if('F' == 'T' ){
document.write('<a href="/jsp/default.jsp?newsID=DYNAMIC,oracle.br.dataservers.CourseDataServer,selectCourse&course=20396&template=580.dwt&unit=NONE&testeira=980&sub=1" style="font-family:tahoma,arial,verdana; color:#676767; font-size:12px !important; text-decoration:none;" target="_top">**Bacharelado em Ciências Contábeis – EAD**</a>');
 }else{
var _tipoCurso='GE';
var _dataserver='DYNAMIC,oracle.br.dataservers.CourseDataServer,selectCourse';
var _template='1975.dwt';
if(_tipoCurso=='TE'){
 _dataserver='DYNAMIC,oracle.br.dataservers.CourseDataServer,selectCourse2';
 _template='1651.dwt';
}else if(_tipoCurso=='GE'){
 _tipoCurso='G';
}
document.write('<a href="/jsp/default.jsp?newsID='+_dataserver+'&course='+
 '20396&template='+_template+
 '&unit=NONE'+
 '&testeira=980'+
 '&type='+_tipoCurso+ 
 '&sub=1'+
 '" style="font-family:tahoma,arial,verdana; color:#676767; font-size:12px !important; text-decoration:none;" target="_top">Bacharelado em Ciências Contábeis – EAD</a>'
 );
 }

 }

 qtyCursos++;
 </script><a href="http://www.ead.senac.br/graduacao/bacharelado-em-ciencias-contabeis/" style="font-family:tahoma,arial,verdana; color:#676767; font-size:12px !important; text-decoration:none;" target="_top">Bacharelado em Ciências Contábeis – EAD</a><span style="font-size:11px; color:#007FFF;">&nbsp;&nbsp;#inscrições abertas</span><script language="JavaScript">

 var _tipoCurso='GE';


  showNovo('F'); 


 if(_tipoCurso=='T'||_tipoCurso=='TE'||_tipoCurso=='L'){
var currVagasEsgotadas='Contabilidade';
if(currVagasEsgotadas=='T'){
showVagasEsgotadas('T'); 
}else{
 showInsc('F','20396'); 
}
 }else{
if(_tipoCurso=='PE'){
 showInscPE('F','20396'); 
}else{
 showInsc('F','20396'); 
}
 showVagasEsgotadas('Contabilidade'); 
 }


 if(_tipoCurso=='TE'){
showEAD('T');
 }else{
  showEAD('F'); 
 }

 if( _tipoCurso=='T' || _tipoCurso=='T' || _tipoCurso=='L' ){
flagPSG='F';
 
flagPSG='F';

if(flagPSG=='T'){
 document.write('<img src="/imagens/flag_bolsa.gif">');
}
 }


 </script></td>

Se você quer pegar o conteudo da fonte do javascript para analisar, usando a URLConnection resolve. Já se você quer obter o resultado daquilo que o javascript está gerando em tempo de execução, o javaFX tem WebEngine e voce pode evocar o javascript atraves do metodo executeScript e realizar uma interação. Javascript e Html São coisas bem diferentes a nivel de trazer o conteudo.

Olá Danilo
Amigo eu estou começando a fazer isso com Scrapy. E uma dúvida este JSoup você consegue baixar anexo?

Tipo eu quero pegar a informação do concurso público e baixar pdf do edital, não pegar o lnk aonde ele se encontra.

Oi Olavo, não tem como, com o JSoup só dá para pegar o link do arquivo.
Acho que esta resposta tem a ver com sua dúvida:
Fazer Download de Arquivo com Java

1 curtida

Obrigado!