Como fazer um site que reune informações de outros sites?

demetriosfernandes · Janeiro 11, 2021, 5:48pm

Eu teria que pegar os dados pelo html da página ? ai no caso se a empresa mudar a estrutura do html dela eu perco o acesso aos dados ? é assim que o trivago faz ? se for assim fica meio inviável pra ficar sempre verificando se o html dos outros sites mudaram. ou tem alguma forma mais eficiente ?

rodriguesabner · Janeiro 11, 2021, 6:16pm

Cara, eu vi sobre isso uma vez, mas faz um tempinho… Eu lembro que isso é feito por metasearch

Esse repositorio vai te ajudar a iniciar suas pesquisas

https://github.com/niyatpatel23295/kayak-backend.

renatoalencar · Janeiro 11, 2021, 6:37pm

O nome disso é scraping, e sim toda vez que a estrutura do HTML é alterada você tem que mudar a forma como você faz. Já existem bibliotecas que tentam identificar as informações baseadas no contexto semântico das informações, mas em geral é o que você vai ter que fazer.

O framework que eu conheço melhor pra fazer isso é o Scrapy, que é em Python.

Como fazer um site que reune informações de outros sites?

Cursos de Mobile

Cursos de Programação

Cursos de Front-end

Cursos de DevOps

Cursos de Design & UX

Cursos de Business

Cursos de Data & BI