Les autorités de protection des données du monde entier demandent aux plateformes de médias sociaux d'empêcher la récupération illégale de données

intelligence artificiellenouvelles technologies

Nov 15

Alors que l'intelligence artificielle (IA) continue de transformer les industries du monde entier, la confidentialité des données reste une préoccupation cruciale. Récemment, les autorités de protection des données (APD) de 16 juridictions mondiales, dont le Royaume-Uni, le Canada et l'Australie, ont publié une communication relative aux complexités juridiques et éthiques liées au « data scraping », autrement appelé extraction de données, moissonnage de données ou la récupération de données.

Plus précisément, ces autorités ont souligné que les entreprises qui utilisent des données à caractère personnel pour développer des Large Language Models (LLM) d'IA doivent s'aligner sur les lois relatives à la protection de la vie privée et des données. Voici ce que vous devez savoir sur cette mise à jour critique, ses implications et les attentes futures des entreprises.

Pourquoi c'est important : L'essor du « data scraping » dans l'IA

Le « data scraping », c'est-à-dire l'extraction automatisée de données à partir de sources web, y compris les plateformes de médias sociaux, est devenu une pratique de base pour les entreprises dans le développement de l'IA. Cependant, la collecte massive de données à caractère personnel soulève des inquiétudes quant à la protection de la vie privée des utilisateurs et à la sécurité des données. Les outils alimentés par l'IA et les Large Language Models s'appuyant sur de vastes ensembles de données pour la formation, il est urgent de trouver un équilibre entre l'innovation et le traitement responsable des données.

La dernière déclaration commune des ADP souligne non seulement la nécessité de la conformité, mais définit également des attentes concrètes pour que les entreprises améliorent leurs mesures de protection des données. Comme l'ont noté l'ICO, l’autorité anglaise de protection des données, et d'autres régulateurs mondiaux, ces attentes sont particulièrement pertinentes pour les géants des médias sociaux dont les plateformes sont des sources majeures de données. Leur déclaration commune appelle à une combinaison de mesures de sauvegarde et de clauses contractuelles qui garantissent une utilisation licite des données.

Principaux points à retenir : Ce que les entreprises doivent faire

Les dernières orientations servent de guide aux entreprises qui cherchent à exploiter les données de manière responsable pour l'IA sans compromettre la vie privée des utilisateurs. Voici les principales attentes formulées par les autorités de protection des données :

1. Respect des lois sur la protection de la vie privée

Les entreprises doivent respecter les lois sur la protection de la vie privée et des données lorsqu'elles utilisent des données à caractère personnel pour le développement de l'IA, même lorsqu'elles collectent des données à partir de leurs propres plateformes. Il s'agit notamment de protéger les informations des utilisateurs contre le scraping non autorisé et de s'assurer que toutes les données utilisées pour les LLM sont traitées de manière transparente et avec le consentement de l'utilisateur.

2. Évolution des techniques de protection

Conscientes de l'évolution de la sophistication de la technologie du scraping, les autorités de protection des données invitent les entreprises à adopter des mesures de protection à plusieurs niveaux et à réexaminer régulièrement leurs pratiques. Cette approche permet aux organisations de garder une longueur d'avance sur les nouvelles techniques de scraping, en combinant l'intelligence artificielle, les ajustements de la conception de la plateforme et d'autres barrières techniques pour empêcher le scraping non autorisée de données.

3. Legal and Limites juridiques et contractuelles du scraping

Lorsque le scraping de données est autorisé, par exemple pour certaines utilisations commerciales ou socialement bénéfiques, les entreprises doivent s'assurer que toutes les activités respectent des cadres juridiques stricts et sont étayées par des clauses contractuelles exécutoires. Cela permet de protéger à la fois les personnes concernées et l'intégrité de l'utilisation des données.

Cette déclaration fait suite à une année d'engagement entre les autorités de protection des données et certaines des plus grandes plateformes de médias sociaux, notamment Meta (Instagram, Facebook), ByteDance (TikTok), Microsoft (LinkedIn) et X Corp. (anciennement Twitter). Grâce à un dialogue constructif, les autorités de protection des données ont pu se faire une idée des défis auxquels sont confrontées les entreprises de médias sociaux dans leur lutte contre le scraping non autorisé, comme la différenciation entre les utilisateurs légitimes et les scrapers automatisés, et le suivi des progrès rapides de la technologie du scraping.

Mesures de sauvegarde pratiques

En réponse à ces attentes, les entreprises ont commencé à mettre en œuvre une série de mesures, dont les suivantes :

Modifications de la conception de la plateforme : Ajustement des caractéristiques de la plateforme afin de rendre le scraping automatisé plus difficile.
Mesures de protection basées sur l'IA : Exploitation d'outils d'apprentissage automatique pour détecter et bloquer les tentatives de scraping.
Solutions économiques pour les PME : introduction de mesures de protection rentables qui aident les petites entreprises à protéger leurs données avec des ressources limitées.

Principaux points à retenir pour les entreprises de médias sociaux

Le principal enseignement est que même les données accessibles au public sont protégées par les lois sur la protection de la vie privée dans la plupart des juridictions, ce qui oblige les plateformes à sécuriser les informations des utilisateurs.

Des garanties à plusieurs niveaux pour la protection contre le scraping

Les entreprises de médias sociaux sont confrontées à des défis de plus en plus importants, car les « scrapers » utilisent une intelligence artificielle avancée pour imiter le comportement des utilisateurs. En réponse, les entreprises mettent en œuvre des mesures de protection multicouches telles que les CAPTCHA, la limitation du débit et les URL aléatoires, ainsi que la surveillance des activités inhabituelles des comptes. Bien qu'efficaces, ces défenses doivent évoluer en permanence pour faire face à un scraping de plus en plus sophistiqué.

Petites et moyennes entreprises (PME)

Malgré des ressources limitées, les PME sont également censées empêcher le scraping illégal. Des outils tels que la détection des robots et la limitation du débit offrent des options abordables, et des fournisseurs tiers peuvent aider à la mise en conformité, bien que les PME conservent la responsabilité finale de la protection des données des utilisateurs.

Utilisation autorisée et contractuelle des données

Certaines entreprises autorisent le scraping à des fins commerciales par le biais de clauses contractuelles strictes, mais les contrats ne suffisent pas à garantir la légalité. Les organisations doivent contrôler la conformité des tiers et limiter l'utilisation à des fins légales.

Accès aux données pour la recherche et le développement de l'IA

Les ADP soutiennent l'utilisation responsable des données pour la recherche, en recommandant les API comme points d'accès sécurisés. Elles soulignent également que les entreprises de médias sociaux qui utilisent des données pour la formation de modèles d'IA doivent respecter des normes strictes en matière de protection de la vie privée, en conciliant l'innovation et les lois sur la protection des données.

Ces orientations des autorités de protection des données nous rappellent que les entreprises doivent être vigilantes et veiller à ce que la confidentialité des données soit au cœur de leurs politiques, en particulier à mesure que les pratiques d'utilisation de l'IA et des données évoluent.

Regarder vers l'avenir : Construire un avenir responsable pour l'IA

Alors que les régulateurs continuent de surveiller le scraping de données, la déclaration commune marque le début d'une ère d'engagement plus collaboratif et proactif avec l'industrie technologique. En s'attaquant très tôt aux risques pour la vie privée, les entreprises et les autorités chargées de la protection des données s'efforcent de jeter les bases d'un développement de l'IA qui respecte les droits des utilisateurs sans étouffer l'innovation.

Grâce à la surveillance continue des autorités de protection des données, les entreprises doivent donner la priorité à des pratiques transparentes et éthiques en matière de données. Pour les développeurs d'IA et les entreprises de médias sociaux, s'adapter à ces lignes directrices n'est pas seulement une question de conformité, c'est aussi une question de confiance et de création d'un précédent responsable pour l'avenir de l'IA.

Comment Gerrish Legal peut vous aider ?

Gerrish Legal est un cabinet juridique numérique et dynamique. Nous sommes fiers de prodiguer des conseils juridiques experts et de haute qualité à nos précieux clients. Nous sommes spécialisés dans de nombreux aspects du droit numérique tels que le RGPD, la confidentialité des données, le droit numérique et technologique, le droit commercial et la propriété intellectuelle.

Nous offrons aux entreprises le soutien dont elles ont besoin pour gérer leurs activités avec succès et en toute confiance tout en se conformant aux réglementations légales, sans avoir à se plier aux exigences numériques en constante évolution.

Nous sommes là pour vous aider, contactez-nous dès aujourd’hui pour plus d’informations.

Article de Nathalie Pouderoux, Paralegal / Consultante, pour Gerrish Legal

intelligence artificiellenouvelles technologiesdonnées personnellesdata scrapingextraction de donnéesautorités de contrôleprotection des donnéesconseils aux entreprisesconseils juridiques

Nathalie Pouderoux