Et Si… On utilisait vos données pour la Guerre ?

Savez-vous pour qui vous travaillez ?

Je ne parle de votre employeur, mais du travail que vous ne savez pas que vous faites.

Parce que oui, vous travaillez souvent pour des objectifs que vous ne connaissez pas.

Vous avez sans doute entendu parler d’intelligence artificielle.

L’intelligence artificielle est un GROS sujet de notre époque.

Et elle a souvent soif de vos données.

Pourquoi ?

Pour apprendre.

L’intelligence artificielle à besoin de voir beaucoup de photos d’humains sous des angles différents et des lumières différentes pour arriver à reconnaître un humain d’une voiture par exemple.

C’est comme ça qu’elle apprend.

Plus elle voit de photos d’humains, plus elle sait reconnaître un humain. Plus elle voit des photos de voitures, plus elle sait reconnaître des voitures.

Et elle doit voir beaucoup BEAUCOUP d’humains pour reconnaître un humain, la même chose avec les voitures.

C’est très loin d’être l’intelligence d’un nouveau-né qui fera très rapidement la différence entre un humain et une voiture sans avoir vu des milliers d’humains et des milliers de voitures.

Concernant l’intelligence artificielle, je voulais vous parler de ça :

On a tous rencontré ça.

Un Captcha. Plus précisément reCAPTCHA un service proposé par Google aux sites internet pour bloquer les robots.

Le principe, je pense que vous le connaissez :

On vous demande de cliquer sur les photos de montagnes ou des feux rouges (par exemple) parmi 9 photos.

Si vous sélectionnez les bonnes photos, on vous laisse accéder au site ou envoyer le message, sinon vous êtes considéré comme un robot et vous êtes recalé.

Quand vous faite ça, vous entraînez une intelligence artificielle pour quelle soit plus performante.

Une intelligence artificielle qui sert à quoi ?

Eh bien, on ne sait pas trop.

Probablement à améliorer les voitures sans conducteurs que développe Google.

De son côté, Google indiquait sur son site internet :

« reCAPTCHA fait une utilisation positive de cet effort humain. Le temps utilisé pour la résolution permet de numériser du texte, annoter des images, construire des datasets de machine learning. En retour, cela contribue à préserver les livres, améliorer les cartes et résoudre des problèmes difficiles dans le domaine de l’IA. »

« Préserver des livres » fait référence à la première version de reCAPTCHA qui demandait à l’utilisateur d’écrire un texte difforme qui lui était affiché, ce qui permettait d’entraîner une intelligence artificielle pour numériser des livres.

« Améliorer les cartes et résoudre des problèmes difficiles dans le domaine de l’IA » et déjà un peu plus floue.

Techniquement, Google peut faire ce qu’il veut de l’aide que vous lui donnez.

Sachez que Google avait fourni l’accès à une technologie d’intelligence artificielle au Pentagon pour l’aider à analyser ses images (par exemple, identifier un véhicule ou une personne) sur les zones de conflits.

Google avait précisé que c’était uniquement à des fins non-offensives et le contrat a été rompu sous la pression des employés de Google qui ne voulait pas être dans le business de la guerre.

Et rien n’indique que les reCAPTCHA (par exemple) ont aidé la technologie fournie au Pentagon (la technologie qu’a fournie Google est un moteur d’intelligence artificielle, pas des données à priori)

Reste que :

Qu’est-ce qui vous dit que l’algorithme que vous entraînez ne permet pas de faire des choses qui sont contraires à votre morale ou à vos valeurs ?

Rien.

Si vous fournissez des données, techniquement, l’entité qui possède ces données peut en faire ce qu’elle veut.

Là, vous allez peut-être me dire « Ok, mais cliquer sur des photos de feux tricolores, ça n’a rien à voir avec mes données personnelles ou avec ma vie privée »

Oui, c’est vrai. Mais il y a plein d’autre fois où vous entraînez des algorithmes avec vos données personnelles.

  • Vous êtes chez Gmail ? Google analyse le contenu de vos mails.
  • Vous stockez vos photos sur Google Drive ? Google analyse vos photos.
  • Vous utilisez Google Maps ? Google analyse votre trajet.

etc…

(et gardez à l’esprit que pleins d’entreprises utilisent de l’intelligence artificielle, pas que Google, Facebook, Amazon, Spotify & co)

Qu’est-ce qui vous dit que vous n’entraînez pas un algorithme (grâce à vos photos par exemple), qui va être utilisé pour des frappes de drone en zone de guerre ?

Ou bien à améliorer des casques de réalité augmentée que portent des soldats, à reconnaître des visages pour les lier à des identités ?

Microsoft Hololens et l’US Army, crédit photo : CNBC

Et même si cet algorithme ne sert pas à des choses comme la guerre, c’est problématique.

Peut-être que vous entraînez un algorithme pour rendre une voiture autonome plus performante et plus sûre. Mais êtes-vous d’accord avec les voitures autonomes ? On ne vous a même pas posé la question.

Vous entraînez un algorithme avec une finalité avec laquelle vous êtes peut-être d’accord ou peut-être pas.

Le problème c’est qu’on ne vous a jamais posé la question, et que vous n’avez jamais été au courant que vous avez servi à améliorer cette finalité.

Vous entraînez un algorithme dont vous ne connaissez pas la finalité.

Si demain, on utilise un algorithme que j’aurais entraîné, pour analyser les caissiers au supermarché, sélectionner les plus performants et virer les autres, je n’aurais eu aucun mot à dire sur ça parce que je n’aurais même pas su que je contribuais à ce système.

Pourtant, je suis peut-être contre.

On peut utiliser mes données, pour servir un objectif, avec lequel je suis peut-être en désaccord et tout ça sans que je ne le sache.

Voilà pourquoi vos données ne devrait être accessible qu’à vous :

Pour ne pas que quelqu’un en fasse ce qu’il veut avec et peut-être s’en servir pour des objectifs dont vous n’avez pas connaissance et avec lesquels vous n’êtes peut-être pas d’accord.

4
Poster un Commentaire

avatar
  S’abonner  
Notifier des
anonyme
Invité
anonyme

excellent article, clair et donnant un exemple très concret des dérives pouvant arriver avec une forte centralisation des données.
petite coquille : sélectionné les plus performants et viré <- virer

Dan
Invité
Dan

Bonjour, bon analyse. Mais maintenant les questions sont, comment éviter le reCAPTCHA? et comment savoir si je donne involontairement information à ces algorithmes?. Merci.

Fermer le menu