Só que não tenho experiência em programação e muito menos em Java. Só estou começando…
Ler PDF não é o problema, já estou fazendo isto. Também já consigo converter para txt.
Só que preciso de uma classe (ou biblioteca Java ou ainda um programa .exe em C/C++) que converta o arquivo PDF corretamente para XML (ou pode ser também HTML).
Assim, se vcs tiverem alguma sugestão mais direta vai me ajudar mais.