Vou fazer pesquisa e armazenar.
Eu pensei em usar o hibernate search e fazer da seguinte maneira:
Como o hibernate search indexa campos text, eu iria extrair o conteúdo text dos pdf/word e iria indexar com o hibernate search.
E em outro campo armazenaria o conteúdo binário.
Tenha em mente que se você fizer um select que envolva esse campo binário, o sistema vai ficar uma insuportável de tão lento. Se for usar mesmo, faça-o com moderação.
Esse campo vai ser usado como lazy (estou usando hibernate), mas ainda vou testar…Fazer de tudo para só trazer na hora exata de mostrar…