Boa tarde a todos.
Estou enfrentando um problema em uma aplicação que estou desenvolvendo.
Quando converto um arquivo html para .txt, os acentos não são mostrados, sendo substituidos por pequenos quadrados.
Segue abaixo meu método para converter.
Espero que possam me ajudar.
...
FileReader in = new FileReader("C:/Teste.html");
HtmlToText parser = new HtmlToText();
parser.parse(in);
in.close();
public class HtmlToText extends HTMLEditorKit.ParserCallback {
StringBuffer s;
public HtmlToText() {}
public void parse(Reader in) throws IOException {
s = new StringBuffer();
ParserDelegator delegator = new ParserDelegator();
// the third parameter is TRUE to ignore charset directive
delegator.parse(in, this, Boolean.TRUE);
}
@Override
public void handleText(char[] text, int pos) {
s.append(text);
s.append("\r\n");
}
public String getText() {
return s.toString();
}
}
Sem mais.
Obrigado.