La guerre des données fait rage, de chaque côté de l’Atlantique. L’enjeu de cette guerre, ce sont les données judiciaires. Disposer d’un maximum de données est indispensable, pour entraîner les outils d’intelligence artificielle. La bataille qui oppose éditeurs ou legaltechs est particulièrement sévère.

En France, la guerre pour les données entre Doctrine et les éditeurs juridiques

Plusieurs grands éditeurs juridiques ont engagé contre Doctrine une action, devant le tribunal de commerce de Paris. On retrouve, dans la liste des demandeurs, les plus grands noms de l’édition juridique, parfaitement connus des avocats : LexisNexis, Dalloz, Lexbase, Lextenso et Wolters Kluwer. Le contentieux tourne autour des données de jurisprudence et de leur collecte.

Doctrine est notamment accusé d’avoir réalisé cette collecte de manière « déloyale ». Les données judiciaires sont certes en accès libre. Cependant, les greffes, n’ont aucune envie de se mettre au service des éditeurs et de répondre à des demandes massives, car ils estiment n’avoir ni le temps, ni les moyens de rendre effectif ce droit d’accès. Pour contourner la difficulté, Doctrine aurait présenté des demandes sous des fausses « identités » en imitant des adresses email de cabinets d’avocats.

Aux USA, la guerre pour les données engagée par Thomsom Reuters et Westlaw contre Ross Intelligence

Une plainte a été déposée par Thomson Reuters et Westlaw, le 6 mai 2020, devant une cour du Delaware, contre Ross Intelligence.

La société LegalEase, aurait été payée par Ross pour lui fournir des données. Elle aurait utilisée son abonnement à Westlaw. Elle aurait posé des centaines de milliers de questions à la base de Westlaw (plus de 200 000 par mois). Un logiciel lui aurait permis de poser les questions de manière répétée. Elle aurait récupéré, non seulement les données de la base mais aussi sa structuration. Il est possible d’interroger Westlaw en langage naturel. Le destinataire final aurait été la société Ross Intelligence, qui ne pouvait pas s’abonner directement aux services de son concurrent, Westlaw.

Les propriétaires de la base Westlaw soutiennent que LegalEase a outrepassé les droits que lui conférait son abonnement à la base de données.

Ross, par l’intermédiaire d’Andrew Arruda, a répliqué que LegalEase avait seulement été chargée de récupérer les données judiciaires brutes. Ces données ne sont pas couvertes par le copyright. Il a publié un échange de courriels entre Ross et LegalEase. Ross signalait à son partenaire qu’il ne voulait pas recevoir autre chose que des données brutes.

Dans son communiqué, Ross n’a pas manqué de viser la décision de la Cour suprême des USA (SCOTUS) dans Georgia v. Public.Resource.Org.

Pas de copyright sur les données judiciaires

La guerre des donnéesLe 27 avril 2020 SCOTUS a en effet précisé que ni les agences gouvernementales, ni les juges, ni les organes législatifs ne sont des « auteurs ». En conséquence leurs publications, lorsqu’elles interviennent dans le cadre de l’exercice de leurs compétences, ne peuvent faire l’objet d’un copyright. Personne n’est propriétaire de la loi, et tout ce qui peut être intégré au concept de loi, doit être en libre accès.

Le litige portait sur le code annoté publié par le sénat de Géorgie, en réalité réalisé par LexisNexis, mais pour le compte du Sénat, c’est à dire du législateur.

« Instead of examining whether given material carries “the force of law,” we ask only whether the author of the work is a judge or a legislator. If so, then whatever work that judge or legislator produces in the course of his judicial or legislative duties is not copyrightable. That is the framework our precedents long ago established, and we adhere to those precedents today.”