Aller au contenu

Impact sur les pratiques humaines⚓︎

Sources et crédits pour ce cours

Pour préparer ce cours, j'ai utilisé :

Point de cours 5

L'évolution des capacités de stockage, de traitement et de diffusion conduit à une explosion du volume de données disponibles. On parle de Big Data.

Ces données massives peuvent être exploitées gràce à l'augmentation de la puissance de calcul et aux progrès des systèmes d'Intelligence Artificielle, dont l'entraînement nécessite également de gros volumes de données.

Infographie: Le Big Bang du Big Data | Statista Source : Statista

Certaines de ces données, en particulier celles produites par les services publics, sont ouvertes (Open Data) et considérées comme des biens communs. Deux beaux exemples de réutilisation de ces données ouvertes : Covidtracker outil de visualisation de la progression de l'épidémie très populaire en 2020-2021 et Suptracker plateforme de visualisation de données sur l'orientation postbac.

alt

Source : http://action-nogent.fr

L'exploitation de données personnelles par les grandes plateformes (GAFAM) nécessite un cadre juridique transfrontalier qui commence à se mettre en place comme le Réglement Général sur la Protection des Données (RGPD) dans la communauté européenne.

L'exploitation de données personnelles par des régimes autoritaires peut constituer une menace pour les libertés individuelles, comme par exemple l'utilisation de la reconnaissance faciale à des fins d'évaluation sociale en RPC.

alt

Source : CNIL https://www.cnil.fr/fr/rgpd-de-quoi-parle-t-on

Les centres informatiques (data center) qui hébergent l'infrastructure de stockage de l'internet mondial, sont responsables de 7 à 15 % des impacts du numérique. D'après un rapport commandé par le gouvernement à l'association Green IT en 2020, l'empreinte environnementale du numérique mondial est environ trois fois celle de la France. Les équipements des data center sont négligeables en nombre par rapport aux équipements utilisateurs mais ils fonctionnent en continu et doivent être refroidis : leur consommation électrique représente environ 25 % de celle de l'ensemble du numérique.

L'engouement autour de l'Intelligence Artificielle et la concurrence entre les grandes plateformes comme Microsoft ou Google, se traduit par une consommation effrénée de microprocesseurs spécialisés dont le concepteur numéro 1 Nvidia est devenu l'une des plus grandes capitalisations boursières du numérique.

alt

alt

Source : Greenit https://www.greenit.fr/etude-empreinte-environnementale-du-numerique-mondial/

Exercice 1

Questions

QCM sur l'impact environnemental des centres de données (thème Données Structurées). Une question peut avoir plusieurs réponses possibles.

  1. Quelle part des impacts du numérique mondial est attribuée aux centres de données (data centers) ?

    • Entre 7 et 15 % environ

    • Moins de 1 %

    • Environ 50 %

    • Ils n'ont aucun impact mesurable

  2. Selon une étude Green IT de 2020, l'empreinte environnementale du numérique mondial est :

    • Trois fois celle de la France

    • Équivalente Ă  celle de la France

    • NĂ©gligeable par rapport aux pays industrialisĂ©s

    • Uniquement due Ă  la fabrication des terminaux

  3. Quels sont les principaux facteurs de l'impact environnemental des centres de données ?

    • La consommation d'Ă©lectricitĂ© pour le fonctionnement des serveurs

    • La nĂ©cessitĂ© de refroidir les machines

    • Le renouvellement du matĂ©riel (serveurs, cpu, disques, switchs)

    • L'usage massif d'eau pour le refroidissement

  4. Quel(s) lien(s) peut-on établir entre Big Data et l'impact environnemental des data centers ?

    • L'augmentation du volume de donnĂ©es entraĂ®ne une hausse des besoins en stockage et en calcul

    • Le Big Data permet de rĂ©duire la consommation Ă©nergĂ©tique des centres

    • Les data centers n'ont aucun rapport avec le Big Data

    • Le traitement des donnĂ©es massives nĂ©cessite de grandes puissances de calcul

  5. Parmi les mesures suivantes, lesquelles peuvent réduire l'empreinte environnementale des data centers ?

    • Utiliser des Ă©nergies renouvelables pour l'alimentation Ă©lectrique

    • AmĂ©liorer le refroidissement par des solutions plus efficaces

    • Multiplier le nombre de centres pour rĂ©partir la charge

    • Optimiser l'usage des serveurs grâce Ă  la virtualisation

  6. Qu'appelle-t-on Open Data ?

    • Des donnĂ©es publiques mises Ă  disposition librement pour ĂŞtre rĂ©utilisĂ©es

    • Des donnĂ©es obligatoirement gratuites et sans restriction

    • Des donnĂ©es accessibles seulement après inscription sur une plateforme

    • Des donnĂ©es qui appartiennent aux GAFAM

  7. Quels sont les bénéfices de l'Open Data ?

    • Favoriser la transparence des institutions

    • Permettre l'innovation grâce Ă  la rĂ©utilisation des donnĂ©es

    • Limiter l'accès aux donnĂ©es personnelles

    • Garantir que toutes les donnĂ©es sont fiables et exactes

  8. Quel est l'objectif principal du RGPD dans l'Union Européenne ?

    • ProtĂ©ger les donnĂ©es personnelles des citoyens

    • Encadrer juridiquement l'exploitation des donnĂ©es personnelles

    • Favoriser la libre circulation de toutes les donnĂ©es

    • EmpĂŞcher l'usage de toute base de donnĂ©es

  9. Quel impact environnemental peut avoir l'entraînement de grands modèles de langage utilisés dans les chatbots ?

    • Une consommation Ă©nergĂ©tique très Ă©levĂ©e due Ă  la puissance de calcul nĂ©cessaire

    • Aucun impact car les calculs sont virtuels

    • Une forte demande en matĂ©riel informatique spĂ©cialisĂ© (GPU, serveurs)

    • Une rĂ©duction systĂ©matique de l'empreinte carbone grâce Ă  l'IA

  10. Quels usages des outils d'IA générative ont un impact environnemental important qui pourrait être réduit ?

    • La gĂ©nĂ©ration d'images ou de vidĂ©os par curiositĂ© ou divertissement

    • Les conversations prolongĂ©es avec des chatbots sans objectif prĂ©cis

    • L'utilisation d'un chatbot comme un moteur de recherche

    • L'utilisation d'un chatbot pour faire une synthèse sur un thème avec citation des sources

Exercice 2

Objectif : Conscience des traces numériques de nos données personnelles

Répondre à ce Quizz.

Exercice 3

Objectif : Utiliser un site de données ouvertes, pour sélectionner et récupérer des données

  1. Accéder aux jeux de données concernant les résultats à Dijon du référendum de 2005 sur le traité établissant une Constitution pour l'Europe sur https://www.data.gouv.fr.
  2. Quelle est la licence de ce jeu de données ?
  3. Quels sont les formats des fichiers de données téléchargeables ?
  4. Sur les 8 critères de qualité des métadonnées combien sont remplis ?
  5. Explorer le fichier sur https://explore.data.gouv.fr :

    • Quel est le code du bureau de vote ECOLE VARENNES MATERNELLE ?
    • Combien de procurations ont-Ă©tĂ© utilisĂ©es dans ce bureau de vote ?
    • Combien de votes OUI et de votes NON ont Ă©tĂ© exprimĂ©s dans ce bureau de vote ?