04 Fév 2014 Big data, open data : quelle organisation juridique ?

(Cet article a été publié il y a 10 ans.)

On entend beaucoup parler de « big data » et « open data ». Ces termes sont utilisés à outrance, et le lecteur peut se demander s’ils ne rejoindront pas le cimetière des éléphants des termes marketing de l’informatique.

Dans ce premier article d’une série de quatre billets sur ce sujet, je tenterai de définir aussi précisément que possible ces termes, et leur intérêt potentiel.

Comme tous les mots utilisés en technologie (informatique, internet, télécommunications), il existe une sorte de fausse unanimité sur les concepts. Pourtant, dès qu’on fouille un peu, notamment quand on discute en toute discrétion, on perçoit très vite que chacun met ce qu’il veut derrière les termes. C’est la raison pour laquelle une règle essentielle de bonne pratique en matière de contrats technologiques est de commencer par définir les termes techniques employés.

Pour progresser dans ce domaine, il peut être utile de … consulter Google et Wikipédia. A la date de rédaction de ces lignes, Wikipédia nous indique le big data désigne « des ensembles de données qui deviennent tellement volumineux qu’ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l’information » (http://fr.wikipedia.org/wiki/Big_data).

On peut tenter d’aller plus loin en proposant les caractéristiques essentielles du big data.

D’abord, il s’agit de données nombreuses, lourdes, complexes.

Ensuite, c’est déjà moins évident, ces données décrivent le monde. Par exemple :

  • les données de l’institut géographique national décrivent le paysage, les routes, les immeubles sur le territoire français.
  • les données collectées par un site d’e-commerce permettent de connaître vos goûts, vos affinités.

Ces données ont aussi une très grande valeur économique. Pour fixer les idées, on peut indiquer qu’une adresse mail non qualifiée (c’est-à-dire une adresse mail brute, dont un opérateur garantit seulement qu’elle existe) vaut quelques centimes d’euros dans un fichier d’adresses vendu. En revanche, s’il s’agit d’une adresse mail qualifiée (c’est-à-dire un ensemble de données permettant de connaître l’âge, le sexe, les affinités commerciales, la catégorie socioprofessionnelle, le sport pratiqué…), le prix peut aller jusqu’à plusieurs euros par adresse !

Enfin, certaines de ces données sont publiques, mais ce terme est ambigu. Il peut signifier que la donnée est librement disponible (moyennant une recherche simple sur Internet qui peut être automatisée) ou qu’elle est contenue dans une base qui est sous le contrôle d’une autorité publique (État, collectivités territoriales, organismes de sécurité sociale…).

Dans ce contexte, la manière dont le droit appréhende ce phénomène est assez peu cohérente. Pour mettre de l’ordre dans les idées, on peut considérer qu’il existe trois types de réglementation qui organisent juridiquement la collecte, l’utilisation et la vente de ces données :

  • le droit des bases de données,
  • le droit de la vie privée (la loi informatique et libertés),
  • et le droit des données publiques.

Je consacrerai un billet à chacun de ces sujets, en résumant le droit applicable et quelques conseils pratiques. Rendez-vous dans les prochains jours !

EN SAVOIR PLUS :
Nous sommes avocats en informatique et innovation. Nous voulons vous aider à relever les défis du nouveau monde : vous faire gagner du temps, faire plus simple, être transparent sur les prix. Pour en savoir plus, cliquez ici.
Bernard Lamon
Bernard Lamon
BL@nouveaumonde-avocats.com

Avocat fondateur, spécialiste en TIC. Voir ma fiche complète.