Como fazer um site que reune informações de outros sites?

Eu teria que pegar os dados pelo html da página ? ai no caso se a empresa mudar a estrutura do html dela eu perco o acesso aos dados ? é assim que o trivago faz ? se for assim fica meio inviável pra ficar sempre verificando se o html dos outros sites mudaram. ou tem alguma forma mais eficiente ?

Cara, eu vi sobre isso uma vez, mas faz um tempinho… Eu lembro que isso é feito por metasearch

Esse repositorio vai te ajudar a iniciar suas pesquisas

https://github.com/niyatpatel23295/kayak-backend.

O nome disso é scraping, e sim toda vez que a estrutura do HTML é alterada você tem que mudar a forma como você faz. Já existem bibliotecas que tentam identificar as informações baseadas no contexto semântico das informações, mas em geral é o que você vai ter que fazer.

O framework que eu conheço melhor pra fazer isso é o Scrapy, que é em Python.