Extração de Texto usando JakartaPOI

Olá pessoal, tudo bem?

Preciso fazer uma extração avançada de texto utilizandoo POI. Por enquanto apenas para .DOC.

O problema é que quando ele encontra um objeto (imagem, grafico, qquer coisa menos texto) a string fica suja com caracteres. Aí, quando coloco na tag CDATA o parser lança exceção.

Não tenho como retirar esses caracteres, porque cada objeto terá um caracter diferente. Essa é a última opção. Alguém ja teve que fazer isso? Alguma idéia?

Obrigado pela ajuda,


Fernando Bernardino

Nunca precisei fazer isso que você está tentando, se você não conseguir tenta depois usar o JExcel, é uma alternativa ao POI.
:slight_smile:

Abraços.