Les cuisines de la surveillance automatisée, par Thomas Jusquiame (Le Monde diplomatique, février 2023)


JPEG - 85.6 ko

Quentin Faucompré et Cyril Pedrosa. – Objectif n° 10, « Remplacer les caméras de vidéosurveillance par des cabanes à oiseaux », de la série « Le Grand Soulagement », 2022

Directeur technique de la société XXII, M. Souheil Hanoune ne craint pas les paradoxes lorsqu’il vante les mérites de son logiciel d’analyse vidéo : « J’appelle cela “l’humanisation par l’automatisation”, ou comment l’intelligence artificielle nous permet de gagner du temps pour l’investir dans ce qui fait de nous des humains (1). » Son associé, M. William Eldin, voit encore plus loin : « Sa magie, c’est qu’elle est infinie, et votre limite d’imagination, c’est sa limite. » De quelle « magie » s’émerveille-t-il ? De la vision par ordinateur : des algorithmes traitent de manière automatique les pixels d’images issues d’une caméra afin d’en extraire diverses informations.

Arrivées sur le marché de la sécurité urbaine il y a quelques années, ces entreprises d’un nouveau genre entendent révolutionner l’utilisation de la caméra grâce à la vidéosurveillance algorithmique (VSA). Son usage rendrait les villes « plus sûres, plus durables, plus agréables », promet un slogan : il pourrait désengorger les transports en commun, décongestionner le trafic routier, réduire de 90 % la consommation de l’éclairage public, retrouver un enfant perdu dans la foule, identifier des personnes victimes d’un infarctus qui chutent dans la rue ou encore prévenir les incendies en détectant les départs de feu. Le million de caméras déployées dans l’espace public français (2), avancent les promoteurs de cette technologie, produirait une mine de données inexploitées. À condition bien sûr d’acheter ces produits à « haute valeur sociétale (3) » que vante M. Quentin Barenne, de la société Wintics.

Mais qui utilise réellement cette technologie ? Et à quels besoins précis répond-elle ? Tout commence par le déploiement de la vidéosurveillance classique en 1991, à Levallois-Perret. Légalisée en 1995 et arrosée depuis de subventions publiques (4), cette pratique fait prospérer un marché dont le chiffre d’affaires atteint 1,7 milliard d’euros en 2021 (5). Pareil engouement repose sur une croyance fausse mais inoxydable : la caméra permettrait d’endiguer la criminalité.

Or des études scientifiques de terrain menées en France et à l’étranger (6) ont démontré que la vidéosurveillance n’aidait pas significativement à résoudre les enquêtes ni ne réduisait le nombre de crimes violents, de délits liés à la drogue ou de troubles à l’ordre public dans les villes. Plusieurs raisons expliquent cette inefficacité : le manque de coordination entre les forces de sécurité (privées, régaliennes, municipales), la mauvaise qualité des images, des caméras mal orientées, sales… Mais le problème majeur tient au nombre pharaonique de flux vidéo comparé aux faibles effectifs d’agents censés les exploiter. « Si on prend un lieu comme la gare Part-Dieu à Lyon, avec un réseau de six cents caméras, vous ne pouvez pas avoir les yeux partout », explique M. Dominique Legrand, président de l’influente Association nationale de la vidéoprotection (AN2V). « Que fait-on de ces six cents flux ? Option 1, rien. Option 2, on utilise des mécanismes d’automatisation qui permettent par exemple d’afficher à l’écran dès qu’un individu court (7). »

Détecter, traquer, classer

Afin de mieux cerner l’utilisation concrète de cette nouvelle technologie, l’auteur de ces lignes a travaillé plusieurs mois durant chez l’un des acteurs de ce milieu en expansion. Les logiciels, qui utilisent la technologie de l’apprentissage profond (deep learning) et de puissantes ressources informatiques, trient des volumes d’informations très supérieurs aux capacités humaines. Le mécanisme est simple : des ingénieurs alimentent le programme avec des images d’objets sélectionnés (une voiture, un vélo, un humain, un scooter, etc.), pris sous toutes leurs coutures et dans diverses situations. Pour minimiser le taux d’erreur, un technicien « assiste » l’algorithme en lui indiquant sur l’image le moment où l’objet apparaît. Une fois ce jeu de données consolidé, on relie le logiciel au système de vidéosurveillance. Quand l’objet passera dans son champ de vision, il pourra appliquer trois actions : le détecter, le classer, le traquer.

Ces outils s’adressent prioritairement à deux types de clients qui représentent à eux seuls plus de la moitié du marché de la vidéosurveillance (8). Les grandes entreprises, tout d’abord, composées d’aéroports, de gares, de sites touristiques, de ports, d’usines, de stades, de bureaux, de gestionnaires de parkings, d’entrepôts, etc. Les villes, ensuite, avec leurs centres de supervision urbains (CSU). Ces derniers centralisent les flux vidéo des caméras municipales manipulées par des opérateurs qui scrutent en temps réel des dizaines d’écrans à la recherche d’un flagrant délit. En plus de la vidéoverbalisation, ces centres permettent aussi de guider sur le terrain les patrouilles ou les interventions ciblées de la police.

En pratique, les éditeurs de logiciels ciblent en premier lieu les policiers municipaux et les CSU. Leur argumentaire commercial a tout pour les séduire : nul besoin d’acquérir de nouvelles et coûteuses caméras, le programme s’adapte au réseau existant et s’intègre harmonieusement aux autres logiciels tel l’incontournable système de gestion vidéo qui pilote les murs d’images et les archives d’enregistrements. Mais ce qui impressionne généralement le plus, c’est la simplicité d’utilisation du dispositif. Une fois le programme installé, l’agent peut en effet choisir en quelques clics une caméra disponible dans le réseau, visualiser une rue ou un carrefour, délimiter lui-même une zone dans le champ de vision, puis sélectionner dans un menu déroulant un ou plusieurs objets qu’il souhaite analyser.

Toutefois, la puissance des algorithmes réside surtout dans la détection d’événements, un cas d’usage préconfiguré et prêt à l’emploi. Prenons les exemples de l’« événement maraudage » ou de la « détection de présence prolongée », proposés par la plupart des éditeurs et particulièrement appréciés des forces de l’ordre : dans une zone préalablement délimitée dans l’espace visionné, sélectionnez l’objet « individu », indiquez une temporalité (« cinq minutes »), puis cliquez sur « valider ». Une alerte en temps réel remontera dans votre interface, et l’événement sera affiché sur l’écran. Idéal pour rapidement identifier des vendeurs à la sauvette (troisième infraction la plus verbalisée à Paris avec 9 237 amendes du 1er janvier au 31 octobre 2022) ou des mendiants faisant la manche dans des zones marchandes.

Pour conquérir de nouvelles parts de marché, certaines entreprises adaptent les fonctionnalités du logiciel à d’autres problématiques rencontrées par les municipalités. Florent Castagnino, maître de conférences de l’Institut Mines-Télécom, nous confirme cette diversification des usages de la vidéosurveillance algorithmique, devenue un « outil à tout faire pour la gestion urbaine — déchets, voirie, accident de la route, espace vert, etc. ». Si les mairies de droite et d’extrême droite plébiscitent l’aspect sécuritaire, les municipalités centristes et de gauche se montrent davantage sensibles au versant « ville intelligente » (smart cities) du logiciel, comme l’énonce la mairie de Paris sur son site : « Les statistiques récupérées permettent de mieux comprendre le trafic en temps réel afin de le fluidifier. »

Ce recodage du contrôle des habitants en service d’utilité publique oublie un peu vite que la caméra reste un outil de surveillance. Si l’on passe en revue les fonctionnalités proposées par les principaux acteurs du marché, l’usage sécuritaire et répressif domine, comme la détection de dépôts sauvages (23 388 verbalisations au cours des dix premiers mois de 2022), d’attroupements ou de regroupements, de présences « anormalement » longues, de colis abandonnés, d’intrusions dans un bâtiment, de mouvements de foule, de rixes. S’ajoute une panoplie d’analyses orientées sur les délits routiers : feux rouges grillés, usages de voies non autorisées (488 amendes à l’encontre des trottinettes en novembre 2022 à Paris), contresens, zones interdites à certains véhicules, stationnements gênants (808 627 amendes à Paris en 2020).

Certes, la loi n’autorise pas qu’une intelligence artificielle verbalise une personne — un agent assermenté doit constater l’infraction —, mais la technique dite « de l’écran noir » qu’appliquent certains CSU permet de la contourner. Plus besoin de visionner une dizaine d’écrans en attendant de constater une infraction au code de la route. Il suffit à l’agent d’activer la fonctionnalité « stationnement gênant » ou « respect des feux tricolores » sur des zones stratégiques et d’attendre qu’un écran noir s’allume, signe que l’infraction vient d’être commise. Ce processus automatisé lui génère tous les éléments nécessaires à la rédaction de la contravention : le type d’infraction, l’identification du véhicule et l’heure du délit. Des logiciels de lecture automatique des plaques d’immatriculation (LAPI), dont l’usage n’est pourtant pas prévu à cet effet (9), facilitent encore le travail. Ainsi non seulement la vidéosurveillance algorithmique permet-elle d’industrialiser la détection d’infractions, mais elle fait également miroiter un retour sur investissement généré grâce aux amendes. L’argument fait mouche auprès des mairies.

Si certaines entreprises du secteur comme XXII ou Wintics se positionnent de façon judicieuse, mais ambiguë, sur le marché de la « ville intelligente », d’autres se spécialisent dans le domaine de la sûreté. « Il faut que l’algorithme puisse prendre la personne, lui trouver des attributs et la suivre de caméra en caméra », explique le député Philippe Latombe au salon Expoprotection, le 15 novembre 2022 à Paris. Pourtant membre de la Commission nationale de l’informatique et des libertés (CNIL), il dévoile une conception très personnelle du respect de la vie privée : « Si c’est simplement pour dire à l’opérateur qu’il y a une valise abandonnée et que le monsieur fait 1,80 mètre, a une chemise blanche, une veste bleue et un jean, ça ne va pas aller. Ce dont on a besoin, c’est que l’opérateur sache exactement où est la personne, avec la capacité de retracer son chemin. »

Panoptique électronique

Sur le marché hexagonal, les entreprises les plus en vue se nomment Two-i, une société française, et Briefcam, sa concurrente israélienne rachetée par le groupe Canon, qui équipe environ deux cents villes en France.

Une collaboration étroite avec les forces de l’ordre permet aujourd’hui à Two-i de détecter un délit de fuite, mais aussi la couleur, la plaque et, grâce à la reconnaissance du logo, une centaine de marques de véhicules. Le nombre de filtres applicables à l’« objet humain » proposé par Briefcam croît sans cesse : le logiciel détermine si la personne qui passe devant la caméra est un homme, une femme ou un enfant, si ses manches sont longues, si elle porte un vêtement au-dessous des genoux, si elle a un couvre-chef, une cagoule, un masque, un sac à main ou à dos, une valise. Pour affiner la recherche, il est possible d’associer une couleur (parmi les quatorze disponibles) à certains de ces attributs.

Briefcam met également à disposition de ses clients une option d’analyse rapide des heures d’enregistrement qui produit un condensé de quelques minutes sur un ou plusieurs individus ciblés. Et, si les multiples caractéristiques ne suffisent pas à identifier un sujet, l’opérateur peut toujours activer la fonctionnalité de reconnaissance faciale. Quand la résolution de l’image le permet, le visage visé sera photographié puis importé dans la base de recherche et soumis à une « comparaison de visages » sur le flux vidéo. Dans le cas où la police disposerait de l’identité de la personne, le logiciel permet d’importer une photo issue des réseaux sociaux pour appliquer la comparaison faciale. En dernier recours, l’État français détient une base de données de dix-neuf millions de fiches (dont neuf millions de photos), le traitement d’antécédents judiciaires (TAJ) (10). L’éditeur a également prévu des commandes permettant d’effacer ces données biométriques en cas de contrôle inopiné…

Les occasions d’avancer les pions électroniques ne manquent pas. Déposé le 22 décembre 2022 en procédure accélérée, un projet de loi relatif aux Jeux olympiques de 2024 ouvre la voie à une expérimentation à grande échelle de la vidéosurveillance algorithmique. Motif invoqué : la « détection de mouvements de foule » — on recense un seul mouvement de foule meurtrier en France au cours des cent dernières années, à Brest, lors d’une soirée étudiante au Parc des expositions de Penfeld, en 2002.

De ces « innovations » techniques et institutionnelles ressort un troublant mélange des genres. Prétendre rendre les villes plus écologiques au moyen d’infrastructures informatiques coûteuses en énergie (11), tout en commercialisant des fonctionnalités à visée sécuritaire, trahit la volonté commune des éditeurs et des édiles de justifier une régression difficile à assumer publiquement : le décuplement de la capacité de contrôle policier qui engendre les conditions matérielles d’une surveillance généralisée et permanente de nos faits et gestes. Officiellement, le panoptique électronique chinois, aux formes plus intrusives et au fonctionnement différent (le système de notation appelé « crédit social », par exemple (12)), sert toujours d’antimodèle aux démocraties libérales. La détection automatique de comportements suspects ou interdits nous en rapproche.

• « Abou Dhabi, pôle mondial de la cybersurveillance », par Éva Thiébaud (janvier 2023).

• « Pour automatiser la censure, cliquez ici », par Clément Perarnaud (juillet 2022).

• « Feu sur les libertés », Manière de voir, n° 182, avril-mai 2022.

• « La “ville sûre” ou la gouvernance par les algorithmes », par Félix Tréguer (juin 2019).

• « Un capitalisme de surveillance », par Shoshana Zuboff (janvier 2019).

• « Bons et mauvais Chinois », par René Raphaël et Ling Xi (janvier 2019).

• « Feu vert à la surveillance de masse », par Félix Tréguer (juin 2015).

• « Sous l’œil myope des caméras », par Noé Le Blanc (septembre 2008).



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *