Bom dia,
caros estou com um problema tenho que capturar umas noticias da internet para isso estou utilizando o java para fazer a captura do html consigo percorrer o html inteiro so que a minha duvida é a seguinte como consigo capturar somente uma String que se encontra entre duas tags como no exemplo:
Coletiva sobre aniversário de Lages
quero pegar o que estra entre o “” e o “” que é a noticia do site em si.
o codigo que eu estou utilizando para fazer a captura do site é o seguinte:
public void gerarConteudo(String urlSite) {
try {
URL url = new URL(urlSite);
BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream(), “8859_1”));
String s;
System.out.println(url.toExternalForm());
System.out.println(url.getFile());
System.out.println(url.getHost());
System.out.println(url.getPath());
System.out.println(url.getProtocol());
while ((s = br.readLine()) != null) {
if (s.contains("class='tabelaAgenda'")) {
System.out.println(s);
}
}
br.close();
} catch (MalformedURLException excecao) {
System.out.println("Erro ao criar URL. Formato inválido.");
System.exit(1);
} catch (IOException ex) {
System.out.println(ex.getMessage());
}
}
Estou tentando capturar do seguinte site!
Desde já agradeço.
Samuel Mattos