Une enquête menée en janvier 2023 par le magazine Time a révélé que des travailleurs kenyans payés moins de 2 dollars de l’heure avaient pour tâche de veiller à ce que les données utilisées pour former la plateforme d’IA ChatGPT soient exemptes de contenu discriminatoire.
Les modèles d’IA doivent être formés, avec l’entrée d’une énorme masse critique de données, pour qu’ils apprennent à reconnaître et à interagir avec l’environnement humain. Ces entrées doivent être collectées, triées, vérifiées et formatées. Ces tâches chronophages et sous-évaluées sont généralement sous-traitées par les entreprises technologiques à une armée de travailleurs précaires, généralement basés dans les pays du Sud.
Ce travail de données prend plusieurs formes différentes, selon l’objectif de l’algorithme final. Par exemple, il peut s’agir de décrire des personnes dans des images capturées sur une caméra vidéo pour apprendre à l’algorithme à reconnaître un humain. Ou on peut vérifier les sorties d’un outil de traitement automatique des factures et corriger les erreurs manuellement pour aider l’ordinateur dans sa tâche.
Pour explorer l’identité de ces data workers, leurs rôles et conditions de travail, et enrichir le débat autour de la régulation du secteur de l’IA, nous avons mis en place une enquête menée entre Paris et Antananarivo, capitale de Madagascar.
Notre étude montre également la réalité de l’IA à la française : d’une part, les entreprises tech françaises dépendent des services d’hébergement et de la puissance de traitement des Big Five (Google, Apple, Facebook, Amazon et Microsoft) ; d’autre part, les tâches de données effectuées par les travailleurs dans les anciennes colonies françaises, notamment à Madagascar, confirmant des tendances bien établies à l’externalisation. Il y a déjà eu des recherches, d’ailleurs, comparant le secteur de la technologie avec l’exploitation minière et le textile .
Une étude sur la mondialisation de l’IA
Notre projet de recherche a débuté à Paris en mars 2021. Nous avons d’abord cherché à comprendre quelle était l’implication des maisons françaises de l’IA dans l’activité de travail sur les données, et quels processus étaient en place pour garantir la production d’ensembles de données de qualité suffisante pour la formation de modèles informatiques. Nous avons mené des entretiens avec 30 fondateurs et salariés travaillant dans 22 entreprises parisiennes de l’écosystème de l’IA. Une découverte a rapidement émergé de cette exploration initiale – la plupart des travaux de données ont été sous-traités à des entrepreneurs malgaches.
Pour une deuxième partie de l’étude, menée d’abord à distance, puis in situ à Antananarivo, nous avons interrogé 147 ouvriers, cadres et dirigeants de dix entreprises malgaches. En parallèle, nous avons envoyé un questionnaire à 296 data workers basés à Madagascar.
Travail précaire pour les jeunes éduqués de la ville
Nos enquêtes initiales ont montré que les travailleurs des données d’IA faisaient partie d’un secteur de services informatiques beaucoup plus large, allant du personnel des centres d’appels aux modérateurs de contenu Web, en passant par les rédacteurs d’optimisation pour les moteurs de recherche (SEO).
Les réponses au questionnaire ont montré que la majorité des travailleurs employés dans le secteur sont des hommes (68%), jeunes (87% ont moins de 34 ans), urbains et éduqués (75% ont traversé, atteint ou avaient eu au moins l’enseignement supérieur). Lorsque le travail était dans l’économie formelle plutôt que dans l’économie noire ou grise, les répondants étaient généralement des employés permanents. Les protections minimales offertes par le droit du travail malgache, par opposition au droit du travail français, la méconnaissance des travailleurs de leurs droits, la faiblesse des syndicats et de la représentation des travailleurs dans les entreprises malgaches ont accru la précarité de leur position. Ils gagnaient pour la plupart entre 96 et 126 euros par mois, avec un énorme écart entre leur salaire et celui des encadrants d’équipe : eux aussi plutôt malgaches, travaillant sur place, mais rapportant 8 à 10 fois plus.
Les travailleurs de terrain se retrouvent au bout d’une chaîne de sous-traitance extrêmement longue, ce qui explique en partie le salaire infime même selon les normes malgaches. La chaîne de production de l’IA implique trois acteurs différents : les services d’hébergement de données/puissance de traitement proposés par les entreprises technologiques du Big Five, les entreprises françaises qui vendent les modèles d’IA et les entreprises offrant les services d’annotation de données délivrés par les travailleurs malgaches. Chaque niveau prend sa coupe.
Les entreprises qui brassent les données sont généralement très dépendantes de leurs clients français, qui gèrent la main-d’œuvre externalisée de manière quasi-directe, imposant des middle-managers travaillant dans l’intérêt des start-up parisiennes. La domination de ces rôles par des étrangers – qu’ils soient employés par les entreprises clientes en France ou expatriés travaillant à Antananarivo – représente un sérieux blocage dans la progression de carrière des travailleurs, qui restent ignominieusement coincés au bas de la chaîne de valeur.
Profiter des liens France-Madagascar post-coloniaux
Le secteur de l’IA bénéficie d’une politique spécifique – les « zones franches » créées en 1989 pour l’industrie textile. Depuis le début des années 1990, des entreprises françaises implantent des satellites à Madagascar, notamment pour l’industrie de l’édition numérique. Les zones spéciales, dont on trouve l’équivalent dans de nombreux autres pays en développement, attirent les investissements en offrant des exonérations fiscales très intéressantes.
Aujourd’hui, sur 48 entreprises proposant des services numériques dans les zones franches, seules neuf sont détenues par des Malgaches, contre 26 détenues par des Français. Outre la situation des entreprises formellement constituées, le secteur a développé une pratique de sous-traitance en cascade, avec des entreprises et des entrepreneurs de l’économie grise au bas de l’ordre hiérarchique, mal traités et poussés à l’action lorsqu’il y a des pénuries de main-d’œuvre ailleurs dans le secteur.
En plus d’une main-d’œuvre bon marché, cette industrie externalisée bénéficie d’une main-d’œuvre bien formée – la plupart ont été à l’université et parlent couramment le français, qu’ils ont appris à l’école, en ligne ou dans les cours de l’Institut français. Cette dernière institution d’initiation à la langue et à la culture françaises, mise en place en 1883 , était à l’origine destinée à étendre le pouvoir impérial par la langue à la population colonisée.
Ce scénario correspond à ce que le chercheur Jan Padios qualifie de « rappel colonial » . Les anciennes colonies ayant des liens linguistiques et culturels avec des pays autrefois dominants leur fournissent désormais des services commerciaux.
Rendre les travailleurs de l’IA visibles pour mieux comprendre leur fonctionnement
Derrière la récente explosion des projets d’IA commercialisés dans les pays du Nord, on découvre un nombre croissant de data workers. La récente controverse autour des « caméras de sécurité intelligentes » aux Jeux olympiques de Paris s’est principalement concentrée sur l’éthique de la surveillance généralisée. Il est nécessaire de mieux prendre en compte la composante vitale du travail humain qui entre dans la formation des modèles d’IA, notamment parce qu’elle soulève de nouvelles questions sur les conditions de travail et le droit à la vie privée.
Rendre visible le rôle de ces travailleurs, c’est poser des questions d’approfondissement sur les chaînes de production mondialisées. Ceux-ci sont plus familiers dans l’industrie manufacturière, mais sont également une caractéristique du secteur numérique. Ces travailleurs sont essentiels au fonctionnement de notre infrastructure numérique – ils sont les rouages invisibles de nos vies numériques.
Cela rend également visible l’impact de leur travail sur les modèles d’IA. Une partie du biais algorithmique réside dans la nature de la manière dont le travail sur les données est effectué, bien que la réalité soit largement tenue secrète par les sociétés d’IA . Une IA véritablement éthique doit donc fixer des normes éthiques pour les conditions de travail du secteur de l’IA .
Maxime Cornet
Doctorant en sociologie de l’IA, Télécom Paris – Institut Mines-Télécom
La mesure prise pour fluidifier le trafic routier à Kinshasa ( RDC )a capoté. Cela…
Ce mercredi au Centre financier de Kinshasa, le Président Félix Tshisekedi, en sa qualité de…
Dans de nombreux pays du monde, les animaux sauvages sont parfois tués pour être mangés,…
La victoire de Trump a provoqué un véritable frisson sur la scène internationale, et beaucoup…
La victoire de Donald Trump aux élections de 2024 et sa menace d’imposer des droits…
Qu’est-ce que cet anti-intellectualisme, cette étrange bête culturelle qui prospère en RDC ? C’est une…