Existe um site que disponibiliza uma api ( biblioteca, .dll) que pode ser usada em varias linguagens para consultar os dados da receita federal, sintegra e outros sites:
Contratei aqui pra minha empresa e funciona muito bem. Usamos para confirmar dados cadastrais de clientes a partir de um CPF ou CNPJ (nome completo, razão social, situação cadastral, endereço, etc). É bom também para confirmar se a empresa existe e não apenas validar se o CNPJ ou CPF são válidos. Recomendo.