Impact sur les pratiques humaines⚓︎
Sources et crédits pour ce cours
Pour préparer ce cours, j'ai utilisé :
- le programme de SNT
- le parcours thématique Données strucuturées proposé par l'association France IOI sur le site https://parcours.algorea.org
- le cours de Cédric Gouygou
Point de cours 5
L'évolution des capacités de stockage, de traitement et de diffusion conduit à une explosion du volume de données disponibles. On parle de Big Data.
Ces données massives peuvent être exploitées grà ce à l'augmentation de la puissance de calcul et aux progrès des systèmes d'Intelligence Artificielle, dont l'entraînement nécessite également de gros volumes de données.
Source : Statista
Certaines de ces données, en particulier celles produites par les services publics, sont ouvertes (Open Data) et considérées comme des biens communs. Deux beaux exemples de réutilisation de ces données ouvertes : Covidtracker outil de visualisation de la progression de l'épidémie très populaire en 2020-2021 et Suptracker plateforme de visualisation de données sur l'orientation postbac.

Source : http://action-nogent.fr
L'exploitation de données personnelles par les grandes plateformes (GAFAM) nécessite un cadre juridique transfrontalier qui commence à se mettre en place comme le Réglement Général sur la Protection des Données (RGPD) dans la communauté européenne.
L'exploitation de données personnelles par des régimes autoritaires peut constituer une menace pour les libertés individuelles, comme par exemple l'utilisation de la reconnaissance faciale à des fins d'évaluation sociale en RPC.
![]()
Source : CNIL https://www.cnil.fr/fr/rgpd-de-quoi-parle-t-on
Les centres informatiques (data center) qui hébergent l'infrastructure de stockage de l'internet mondial, sont responsables de 7 à 15 % des impacts du numérique. D'après un rapport commandé par le gouvernement à l'association Green IT en 2020, l'empreinte environnementale du numérique mondial est environ trois fois celle de la France. Les équipements des data center sont négligeables en nombre par rapport aux équipements utilisateurs mais ils fonctionnent en continu et doivent être refroidis : leur consommation électrique représente environ 25 % de celle de l'ensemble du numérique.
L'engouement autour de l'Intelligence Artificielle et la concurrence entre les grandes plateformes comme Microsoft ou Google, se traduit par une consommation effrénée de microprocesseurs spécialisés dont le concepteur numéro 1 Nvidia est devenu l'une des plus grandes capitalisations boursières du numérique.

Source : Greenit https://www.greenit.fr/etude-empreinte-environnementale-du-numerique-mondial/
Exercice 1
Questions
QCM sur l'impact environnemental des centres de données (thème Données Structurées). Une question peut avoir plusieurs réponses possibles.
-
Quelle part des impacts du numérique mondial est attribuée aux centres de données (data centers) ?
- Entre 7 et 15 % environ
- Moins de 1 %
- Environ 50 %
- Ils n'ont aucun impact mesurable
-
Selon une étude Green IT de 2020, l'empreinte environnementale du numérique mondial est :
- Trois fois celle de la France
- Équivalente à celle de la France
- Négligeable par rapport aux pays industrialisés
- Uniquement due Ă la fabrication des terminaux
-
Quels sont les principaux facteurs de l'impact environnemental des centres de données ?
- La consommation d'électricité pour le fonctionnement des serveurs
- La nécessité de refroidir les machines
- Le renouvellement du matériel (serveurs, cpu, disques, switchs)
- L'usage massif d'eau pour le refroidissement
-
Quel(s) lien(s) peut-on établir entre Big Data et l'impact environnemental des data centers ?
- L'augmentation du volume de données entraîne une hausse des besoins en stockage et en calcul
- Le Big Data permet de réduire la consommation énergétique des centres
- Les data centers n'ont aucun rapport avec le Big Data
- Le traitement des données massives nécessite de grandes puissances de calcul
-
Parmi les mesures suivantes, lesquelles peuvent réduire l'empreinte environnementale des data centers ?
- Utiliser des énergies renouvelables pour l'alimentation électrique
- Améliorer le refroidissement par des solutions plus efficaces
- Multiplier le nombre de centres pour répartir la charge
- Optimiser l'usage des serveurs grâce à la virtualisation
-
Qu'appelle-t-on Open Data ?
- Des données publiques mises à disposition librement pour être réutilisées
- Des données obligatoirement gratuites et sans restriction
- Des données accessibles seulement après inscription sur une plateforme
- Des données qui appartiennent aux GAFAM
-
Quels sont les bénéfices de l'Open Data ?
- Favoriser la transparence des institutions
- Permettre l'innovation grâce à la réutilisation des données
- Limiter l'accès aux données personnelles
- Garantir que toutes les données sont fiables et exactes
-
Quel est l'objectif principal du RGPD dans l'Union Européenne ?
- Protéger les données personnelles des citoyens
- Encadrer juridiquement l'exploitation des données personnelles
- Favoriser la libre circulation de toutes les données
- Empêcher l'usage de toute base de données
-
Quel impact environnemental peut avoir l'entraînement de grands modèles de langage utilisés dans les chatbots ?
- Une consommation énergétique très élevée due à la puissance de calcul nécessaire
- Aucun impact car les calculs sont virtuels
- Une forte demande en matériel informatique spécialisé (GPU, serveurs)
- Une réduction systématique de l'empreinte carbone grâce à l'IA
-
Quels usages des outils d'IA générative ont un impact environnemental important qui pourrait être réduit ?
- La génération d'images ou de vidéos par curiosité ou divertissement
- Les conversations prolongées avec des chatbots sans objectif précis
- L'utilisation d'un chatbot comme un moteur de recherche
- L'utilisation d'un chatbot pour faire une synthèse sur un thème avec citation des sources
Exercice 2
Objectif : Conscience des traces numériques de nos données personnelles
Répondre à ce Quizz.
Exercice 3
Objectif : Utiliser un site de données ouvertes, pour sélectionner et récupérer des données
- Accéder aux jeux de données concernant les résultats à Dijon du référendum de 2005 sur le traité établissant une Constitution pour l'Europe sur https://www.data.gouv.fr.
- Quelle est la licence de ce jeu de données ?
- Quels sont les formats des fichiers de données téléchargeables ?
- Sur les 8 critères de qualité des métadonnées combien sont remplis ?
-
Explorer le fichier sur https://explore.data.gouv.fr :
- Quel est le code du bureau de vote ECOLE VARENNES MATERNELLE ?
- Combien de procurations ont-été utilisées dans ce bureau de vote ?
- Combien de votes OUI et de votes NON ont été exprimés dans ce bureau de vote ?