Alguém conhece alguma framework/api para parse de HTML?
Valeu!
Alguém conhece alguma framework/api para parse de HTML?
Valeu!
O HTMLParser é um dos mais robustos. Tem varias opcoes de filtro de tags: manter tais, remover tais, navegar pelo DOM…
PS: recomendo tambem considerar o uso de um “corretor” de tags pois muitos sites tem problemas de mal formacao. Ha api’s exclusivamente pra isso.
No mesmo assuntos, ha decodificadores e decodificadores tags html <-> texto padrao, tambem, que sao interessantes.
Obrigado Senhores!