A raspagem da Web é um dos métodos mais comuns de recolha de dados, mas a sua legalidade continua a ser um tema muito debatido. Então, a raspagem da web é legal? Embora a resposta não seja tão simples, neste post damos uma vista de olhos ao que é a raspagem da web, as suas implicações legais e as suas melhores práticas. 👀 Vamos mergulhar!
A raspagem da Web implica a extracção de dados de um website, a informação recolhida é então exportada num formato que é mais útil para o utilizador.
Em termos mais técnicos, o raspador utiliza o código/elementos HTML, CSS ou JavaScript de uma página web e extrai todos os dados presentes ou selecciona alguma informação específica de valor. De facto, o raspador da web permite visar informação específica (ou seja, raspar uma página da Amazon para preços mas não para revisões de produtos).
🔍 Em geral, a raspagem da web é feita através de ferramentas dedicadas e automatizadas que funcionam mais rapidamente do que a raspagem manual da web.
Embora a raspagem da web envolva desenvolvedores, uma vez que pode tornar-se bastante técnica, é uma ferramenta valiosa para investigadores, jornalistas, académicos, e muito mais.
A raspagem da web pode ser utilizada:
Tal como a maioria das pessoas que investigam este tópico, poderá estar a perguntar-se: será a raspagem de dados legal? Não se entusiasme demasiado, infelizmente, todo o assunto continua a ser uma área cinzenta.
A raspagem da web é geralmente permitida onde:
Em geral, a raspagem responsável da web requer que você seja cauteloso quanto à aplicação Termos de serviço, dados protegidos por direitos autorais e dados pessoais (pois os dados pessoais são normalmente protegidos por leis de privacidade).
🔍 Veja nosso guia detalhado em o que é considerado informação pessoal através das principais leis de privacidade.
As principais leis de privacidade até o momento na UE (o GDPR) ou nos EUA (o CPRA) visam proteger os dados pessoais do usuário e estabelecer uma estrutura para como esses dados podem ser usados.
Não se referem à raspagem da web ou declaram que é ilegal. No entanto, regulam a recolha de dados pessoais pelas empresas e o que podem fazer com eles. Em resumo – porque sim, a lei é muito mais complicada do que isso! – geralmente envolve:
🔍 Em resumo, se suas atividades de raspagem na web envolvem a raspagem de informações pessoais, você deve
🚀 Faça este questionário gratuito de 1 minuto para descobrir!
Alguns casos dignos de nota em que a raspagem da web é ilegal e de que deve estar ciente incluem indivíduos ou empresas que abusam da raspagem da web e violam os Termos de Serviço ou as normas de direitos de autor.
📌 Acórdão do Tribunal de Recurso da Nona Circunscrição dos EUA – LinkedIn vs. HiQ
O LinkedIn trouxe uma batalha para impedir um concorrente, HiQ, de raspar informações pessoais dos perfis públicos dos usuários do LinkedIn.
Em 2020, a decisão estabeleceu que o CFAA não foi violado já que os dados raspados do LinkedIn eram públicos (não atrás de um muro de senhas).
📌 Clearview AI Fine
A empresa de reconhecimento facial ganhou uma pesada multa por ter raspado milhões de imagens de rostos de pessoas das redes sociais.
Foi declarado que Clearview AI estava processando dados sensíveis sem uma base legal válida. Ler a história completa em nosso blog.
✅ Tenha cuidado se descarregar dados de um website que requeira o início de sessão, pois isto pode significar que concordou com os Termos de Serviço que podem proibir as actividades de raspagem da web.
✅ Certifique-se de verificar os Termos e Condições do website para garantir que não está a violar o contrato.
✅ Mesmo que sejam dados publicamente disponíveis, certifique-se de que os dados não estão protegidos por direitos de autor. Isto pode incluir artigos, vídeos, desenhos.
✅ Finalmente, e o mais importante, considerar a ética envolvida. Mesmo que uma actividade não seja ilegal, pode causar-lhe danos ou danos à reputação ou a terceiros.
Para proteger o seu sítio web de ter a sua informação raspada, pode:
🔒 Direitos autorais de seu website e escreva uma copyright clause;
🔒 Deve adicionar restrições de raspagem da web ao documento de Termos e Condições do seu sítio web. Ao fazê-lo, certifique-se de que a linguagem é específica e proíba terceiros de raspar informação e utilizá-la para fins comerciais, por exemplo.
👋 Veja como fazer isso facilmente com as soluções de software iubenda:
🚀 Use iubenda’s Gerador de términos e condições;
🚀 Crie seu documento de Termos e Condições personalizado;
🚀 Selecione nossas cláusulas pré-elaboradas (direitos autorais, etc.) ou crie uma cláusula personalizada;
🚀 Siga nossas instruções para instalar rapidamente o documento em seu website!
Attorney-level solutions to make your websites and apps compliant with the law across multiple countries and legislations.