Pessoal,
Criei um programinha que captura o conteúdo de páginas Web, mas estou tento problemas para capturar textos com acentuação:
public Coletor(String surl) {
vecstream = new Vector();
try{
URL url = new URL(surl);
BufferedReader in = new BufferedReader(
new InputStreamReader(
url.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
vecstream.add(inputLine);
//System.out.println(inputLine);
in.close();
}catch(Exception e){}
}
Tenho duas coleções que contém o valor que é capturado e o que ele corresponde:
Ex: À = À / ã = ã / É = É
Até aí tudo bem. É só fazer a troca.
Agora vamos ao problema:
“Á” e “Í” simplesmente corresponde ao mesmo valor que vem da URL capturada ou o openStream não consegue capturar esses valores corretamente.
Com isso não tem como descobrir se o valor é Á ou Í.
Pergunta: Existe alguma outra alternativa para capturar textos acentuados da Web?
Existe algum tipo de Decoder para traduzir automaticamente esses valores capturados para textos corretamente acentuados?
Obrigado