Alice Drahon & Sarah Oury
Transcription
[00:00:05]
Bonjour. Voilà, vous m'entendez bien? Parfait. Bah, bonjour, bonjour. Bienvenue dans ce dans ce talk. Donc on va vous parler des sujets d'impact environnemental et d'IA. Voilà, si ça peut fonctionner ensemble.
[00:00:26]
Du coup dans la première partie, on va essayer de vous présenter les principaux impacts. On va aussi s'adapter en fonction bah de de ce qu'on apprend de vous, on va vous poser quelques questions. Après, la deuxième partie, on va vous parler de l'évaluation, de la mesure, parce que travailler sur les impacts environnementaux, c'est avant tout savoir les évaluer. Et après, dans la troisième partie, on va plus globalement vous parler des approches systémiques
[00:00:54]
qui permettent de se transformer pour essayer de faire de l'IA frugale. Voilà. Alors déjà, qui sommes-nous ?
[00:01:05]
Du coup, moi je m'appelle Sarah, je suis développeuse IA et backend à Sopra Steria et je fais partie de l'association Boa Vista que j'ai rejoint il y a un an à peu près et je suis notamment active sur le groupe Machine Learning.
[00:01:20]
Voilà, et Alice Drouin, moi je suis aussi dans l'association Boa Vista, dans le groupe Machine Learning et j'ai intégré le Conseil d'administration il y a pas longtemps et je suis consultante indépendante depuis un peu moins d'un an sur les des projets d'IA durable. C'est que je fais de la gestion de projet mais vraiment en mettant l'accent sur la maîtrise des impacts environnementaux et des droits humains. Voilà.
[00:01:52]
Alors à propos de Boa Vista, donc Boa Vista, c'est une association qui existe depuis la période du Covid, 2020 environ et qui construit des communs qui permettent de faire de l'évaluation d'impact environnemental du numérique. Donc le premier commun qui a été construit,
[00:02:14]
c'est un commun qui qui vous pouvez soit télécharger, soit que vous pouvez accéder via API qui permet globalement de faire une évaluation multicritère de l'impact environnemental d'un de vos services. Voilà. Et après du coup, comme ça a beaucoup de succès, c'est une large communauté, il y a d'autres sujets qui se sont lancés et notamment cette question de l'impact environnemental de l'intelligence artificielle. On va plus vous en parler tout à l'heure. Et aussi la façon dont on est organisé, c'est que il y a toutes les deux semaines une présentation d'outils, de méthodes, il y a vraiment une communauté qui est très active pour se partager les savoir-faire qui sont qui évoluent très vite en ce moment.
[00:03:10]
Du coup, maintenant qu'on s'est présenté, on va essayer de mieux vous connaître pour un peu adapter notre présentation. Euh, est-ce que vous pouvez lever la main si vous avez déjà réalisé votre bilan carbone ?
[00:03:23]
Individuel. Il y en a pas mal, beaucoup même. Euh et est-ce que vous avez déjà réalisé une évaluation environnementale d'un service IT ? C'est plus spécifique, il y a moins de mains levées mais il y en a. Et savez-vous ce que c'est qu'une ACV ? Donc analyse de cycle de vie dans un service IT ? Il y a quelques mains aussi.
[00:03:45]
OK. Hop.
[00:03:49]
Donc euh aujourd'hui, pourquoi est-ce qu'on parle d'IA ? Euh bah comme vous le savez, c'est un sujet dont on entend énormément parler, il y avait d'ailleurs plusieurs sujets autour de l'IA pendant la Flocon et euh c'est un sujet qui est beaucoup poussé de tous les côtés et il y a beaucoup de problématiques qui sont liées à ce déploiement très rapide de l'IA, euh notamment des aspects éthiques, sociétaux et environnementaux et donc c'est important de de les prendre en compte et de pas foncer tête baissée.
[00:04:17]
Et j'ajouterai juste un un petit point, c'est que avec l'arrivée de l'IA générative, ça a vraiment permis de démocratiser la compréhension de l'IA et des usages et c'est ça qui fait aussi beaucoup un phénomène d'accélération avec toute une idéologie qui est aussi qui nous vient de la Silicon Valley, qui est de dire bah il faut y aller, il faut y aller, il faut y aller. D'où ce schéma que je trouve génial parce que bah on est aussi ici au Flocon, on on se pose des questions sur qu'est-ce qu'on fait et comment est-ce qu'on fait les choses bien.
[00:04:47]
Et euh bah il y a vraiment cette problématique au cœur de des enjeux autour de l'IA et notamment aussi à cause des impacts environnementaux.
[00:05:00]
Du coup, on va parler plus spécifiquement des impacts sur l'environnement. Donc l'IA comme tout service numérique, euh elle a des nombreux impacts sur l'environnement qui sont liés aux infrastructures sur lesquelles elles sont basées. Donc euh pour avoir un service d'IA, on a besoin d'utiliser des serveurs, du réseau et des terminaux utilisateurs. Euh et donc pour ce faire, on a besoin de les fabriquer, ce qui a de nombreux nombreux impacts sur l'environnement et aussi pendant toutes leurs phases d'utilisation, on va avoir besoin de consommation d'électricité. Et cette électricité, elle a des impacts à la production.
[00:05:35]
Donc euh notamment sur les émissions de gaz à effet de serre qui ont des impacts sur le réchauffement climatique via la combustion d'énergie fossile. Ensuite pour fabriquer les composants notamment dans le cadre de l'IA, on a besoin de nombreuses puces assez spécifiques comme les GPU. Euh pour fabriquer ces GPU, on a besoin de minerais.
[00:05:55]
qu'on va chercher dans des mines qui sont gigantesques et qui ont du coup d'énormes impacts sur la réduction de la biodiversité et de la disponibilité des ressources abiotiques. Euh et en plus, ces mines, elles sont vraiment exploitées dans des dans des dans des conditions humaines qui sont vraiment désastreuses. Et euh enfin la troisième ressource qui est le plus touché, c'est l'eau douce.
[00:06:19]
Euh donc elle est elle peut se retrouver polluée ou évaporée lors des cycles de production d'électricité. Euh mais aussi et surtout dans les data centers pour refroidir les data centers. Et euh lors des cycles de fabrication des composants électroniques.
[00:06:36]
Euh si on se focus un peu sur la consommation électrique, euh on peut voir que depuis 2023, euh la consommation électrique dans les data centers liée à l'IA, euh elle a commencé à à devenir non négligeable. Euh et donc euh on a cette ce rapport de Deloitte qui fait des estimations et des projections sur comment va évoluer cet impact dans les années à venir. Euh et a utilisé deux scénarios différents, un scénario du standard, euh qui nous amène à une multiplication par quatre de la consommation électrique dans les data centers d'ici 2050. Et euh un deuxième scénario d'adoption forte qui nous multiplie par neuf la consommation d'électricité de 2000 d'ici 2050. Euh, il faut savoir que le scénario standard, il considère que on va avoir une une un développement plutôt raisonné de l'IA, uniquement dans des cas plutôt simples et rentables et donc en considérant une croissance qui va être plus faible que celle qu'on a pu voir entre 2020 et 2024.
[00:07:39]
Et euh le scénario de croissance élevée, lui considère que la le taux de croissance va rester le même que celui qu'on a pu observer en 2000 entre 2020 et 2024. Ce qui est très probable vu l'arrivée de l'IA générative euh qui en 2023 a explosé avec Chat GPT et donc la génération de texte, mais depuis on a aussi la génération d'audio, de vidéo et d'images qui sont encore plus consommatrice. Et cette augmentation de la consommation électrique, elle est liée du coup à la fabrication de nombreux nouveaux centres de données, euh pour bah justement pouvoir déployer plus de modèles d'IA. Euh et euh on en construit de nombreux dans les entreprises mais aussi à l'échelle des pays. Euh, on peut le voir par exemple qu'en France, euh à l'IA Summit en février, euh le président a annoncé la création d'un nouveau data center avec des investissements de 50 millions d'euros pour créer un data center d'une capacité d'un gigawatt-heure et créer l'un des plus grands campus d'IA euh d'Europe.
[00:08:39]
Mais euh cette cette augmentation du nombre de data center, elle pose aussi des problèmes, on peut le voir par exemple en Irlande où il y a tellement de nouveaux installations de data center très rapide qu'on a des conflits sur l'utilisation de l'électricité. Et en plus cette consommation hyper rapide, elle rend aussi la transition énergétique euh compliquée voire inexistante puisque toutes les nouvelles infrastructures d'énergie renouvelable qui sont développées euh elles sont censées être là pour remplacer les anciennes les anciennes installations qui sont beaucoup plus polluantes, mais comme la demande d'énergie ne cesse de croître, et ben en fait, au lieu de remplacer les anciennes infrastructures, elles viennent juste s'ajouter et donc du coup, on parle pas du tout de transition énergétique, mais d'encore plus d'impact au global.
[00:09:29]
Euh et donc face à cette augmentation de la croissance de l'électricité, il y a beaucoup d'hyperscalers qu'ont pris des engagements notamment sur leur réduction des émissions de carbone. Le problème, c'est que il existe différentes façons de calculer ces émissions de carbone. Donc par rapport à partir d'une même quantité de de gigawattheure par exemple, on peut estimer une quantité de CO2 équivalente différente en fonction des méthodes utilisées. Il y a la méthode location based. qui est donc basée qui est basée sur l'énergie consommée dans la région dans laquelle on se situe, donc par exemple pour un data center en France, on utilise le mix électrique de la France pour convertir l'énergie en quantité de CO2 équivalent. Et le market based, il est basé sur l'énergie qui est achetée par l'entreprise. Et donc euh l'entreprise peut en quelque sorte compenser ses émissions de CO2 réelles en achetant des certificats d'énergie renouvelable qu'on appelle aussi des crédits carbone. Sauf que ces certificats, il ne garantissent pas qu'on va amener créer des nouvelles infrastructures.
[00:10:33]
Ça peut être basé sur des infrastructures existantes et en plus ça ne diminue pas réellement ça n'encourage pas en tout cas les entreprises à diminuer leur consommation d'énergie et leur empreinte carbone. Et on peut voir qu'en plus les les corrélations entre location based et market based est vraiment faible, ça représente pas du tout la réalité des émissions des entreprises. Et donc on voit plein d'hyperscalers qui euh bah annoncent qu'ils sont déjà net zéro carbone et qu'ils ont atteint leurs objectifs. Mais en fait derrière, c'est en utilisant la méthode market based qui est très largement contestée par de nombreuses organisations dont Boa Vista.
[00:11:14]
Et enfin si on s'intéresse directement à l'empreinte carbone d'un modèle en particulier, euh on peut partir d'exemple de Chat GPT qui est le plus connu, on va dire. Euh, avec l'entraînement de GPT-3 qui est le modèle sur lequel était basé Chat GPT à sa sortie. Euh il y a on entend beaucoup dire que c'est l'entraînement des modèles qui est énorme et qui a énormément d'impact et que l'inférence finalement est négligeable puisque si on regarde à l'échelle d'une inférence, la consommation d'énergie, d'eau et cetera peut paraître négligeable.
[00:11:45]
Euh, c'est vrai que l'entraînement a vraiment un énorme impact quand on le voit là, 552 tonnes de CO2 équivalent émis juste pour l'entraînement de GPT-3, sachant qu'après on est passé à 3.5, 4, 4.0 et qu'il y a plein d'autres modèles d'autres providers. Euh mais en fait l'impact à l'inférence, il est aussi énorme puisque les utilisateurs, ils posent pas qu'une seule requête dans l'année. Euh et il y a des millions d'utilisateurs qui utilisent Chat GPT chaque jour, ce qui fait que l'impact carbone pour un mois d'inférence de Chat GPT, il est déjà 18 fois supérieur à celui de l'entraînement. Donc tout ça multiplié par les autres modèles qui existent et les autres cas d'application, ça fait un impact vraiment colossal.
[00:12:31]
Alors, du coup, on va faire un petit zoom sur les méthodes de d'évaluation de l'impact environnemental. Euh comme Sarah vous l'a dit au début, il y a des de nombreux impacts. Donc déjà, en général, si on veut être rigoureux, on fait de l'analyse multicritère. On va aller regarder aussi bien le CO2, mais aussi l'eau, bah la consommation énergétique, mais on peut aussi aller regarder les polluants de les émissions de polluants dans l'air, il y a énormément d'indicateurs et le choix de ces indicateurs,
[00:13:05]
euh, dépend aussi beaucoup du du business de l'entreprise qui veut faire de l'évaluation. Ça c'est un point, c'est l'aspect multicritère.
[00:13:13]
Le second point, c'est que on va aller regarder tout le cycle de vie. Parce que l'usage uniquement, aller mesurer la consommation sur l'usage n'est pas suffisant. Les études montrent que euh, du coup, toute la partie extraction minière, fabrication est une part énorme de l'impact. Donc du coup, on va aller mesurer cette extraction minière, la fabrication, le transport des équipements,
[00:13:45]
la distribution, l'usage, donc l'utilisation et enfin aussi tout ce qui est fin de vie. Donc notre capacité à recycler ou euh bah à décomposer les matériaux.
[00:14:00]
Voilà. Alors, pourquoi est-ce qu'on fait ça ? Justement parce que euh le numérique, ça a l'air d'être complètement abstrait, mais en réalité, il y a des gros impacts physiques qu'on ne voit pas. Parce que en tout cas, pour l'instant, on n'a pas de data center à côté de chez nous. Peut-être bientôt, mais pour l'instant, non. Donc en fait on ne voit pas ces énormes data center, les serveurs, tous les les équipements qui nous permettent d'avoir accès à ces services numériques. Donc aujourd'hui, la fabrication des équipements, donc l'extraction des minéraux et la fabrication des équipements, c'est la plus grande partie de l'empreinte environnementale. Et proportionnellement, cette partie, elle baisse, mais pourquoi ?
[00:14:46]
Parce qu'en fait, avec le déploiement des data center, l'usage a tellement augmenté que finalement euh la la les impacts environnementaux de l'usage des data center fait qu'il y a une plus grande proportion de l'usage, mais c'est pas forcément une très bonne nouvelle.
[00:15:05]
Pour donner un petit peu des des équivalences, euh on considère en France euh que la gestion des la consommation par an par français euh d'équipement numérique, donc ça c'est tout équipement au-delà euh de
[00:15:24]
même au-delà de de l'IA, c'est tous les équipements, c'est 1000 euh 700 tonnes, 1,7 tonnes, pardon, 1,7 tonnes. Sachant que pour les accords de Paris, on est censé passer tous en dessous de 4000. Donc déjà, si on a cette part là sur les équipements numériques, on voit que on n'est pas tout à fait sur des proportions qui nous permettent de respecter nos engagements.
[00:15:52]
Et enfin, sur la dernière partie euh de l'analyse du cycle de vie, sur la partie recyclage. Il faut savoir que aujourd'hui, on ne sait quasiment pas recycler euh les équipements. Donc c'est vraiment il y a toute une filière à construire.
[00:16:10]
Et que à ce jour, encore par exemple en France, on sait recycler 22 % euh des des déchets, puis c'est collecté et recyclé, voilà, 22 %. Donc c'est c'est très peu.
[00:16:28]
Alors pourquoi ? Déjà parce que par exemple pour faire un microprocesseur, donc là dans cet exemple une puce, une puce GPU, il y a plus de 80 métaux.
[00:16:38]
Ils sont découpés en tout petit euh donc c'est une des raisons pour lesquelles euh on a du mal à recycler ça. Et en plus, il y a un phénomène aussi qui euh inquiète les les personnes qui sont qui ont besoin de de matériel. C'est qu'on arrive dans une période de pénurie de ressources parce que le rendement des mines est de plus en plus mauvais. Donc pour extraire ces minéraux, on a besoin de d'autant plus de de creuser, donc ça accroît aussi les impacts environnementaux en terme de pollution de l'air et des sols, tout ce qui est déforestation. puisqu'on va aller chercher des nouvelles des nouveaux espaces, des nouvelles mines. Et ici on s'est focalisé sur la partie environnementale mais comme l'avait dit Sarah, l'industrie minière, c'est une c'est une des industries au monde les plus sales et euh en terme de respect des droits humains, euh bah il y a des guerres, il y a des conditions de travail qui sont proche de l'esclavagisme, enfin c'est il y a il y a des vraies conséquences systémiques et géopolitiques. Alors du coup, l'Union européenne qu'est-ce qu'elle veut faire face à ce constat et face aussi à cette dépendance géopolitique ? Et ben donc euh il y a un plan d'action qui a été mis en place et l'objectif c'est d'ouvrir déjà des mines en Europe, parce que pour jusqu'à maintenant, en fait, on externalise nos impacts environnementaux.
[00:18:13]
Donc euh ça, on verra si ça peut fonctionner ou pas. Euh l'idée, c'est d'essayer de développer le recyclage des métaux, mais on a vu que c'était très compliqué et on a on a même si on a des contraintes réglementaires, on a des difficultés à faire ça. Et euh développer donc les objets écoconçus et le quatrième axe, c'est vraiment celui dont on a envie de vous parler aujourd'hui, c'est privilégier la sobriété parce que en réalité, c'est
[00:18:42]
c'est le seul point dont on sait qu'on a des retours sur investissement environnemental très élevés et qui fonctionnent bien.
[00:18:52]
Et euh donc pour finir sur cette partie des impacts, euhm.
[00:18:59]
Qui a déjà entendu parler de l'effet rebond ?
[00:19:03]
Donc euh merci beaucoup. Donc euh le le sujet euh des impacts environnementaux et de notre façon de consommer, c'est qu'on nous dit on fait beaucoup d'optimisation. Donc on nous dit ah bah, on va optimiser par exemple, on a vraiment réussi à optimiser la consommation d'énergie des écrans, euh bah c'est formidable mais du coup, en fait, on a changé tous les écrans, on a des écrans beaucoup plus grands. Donc l'effet rebond, euh c'est ça.
[00:19:28]
C'est que là maintenant on commence à voir statistiquement que toutes les optimisations qu'on fait qu'on fait en terme d'impacts environnementaux, euh finalement, ont des impacts négatifs parce que systématiquement, on augmente nos usages derrière. Et là on est en plein dedans avec euh avec euh l'IA, l'IA générative, il y a des tas d'usages qu'on va pouvoir optimiser, mais à la fois, il y a de tels effets rebond que globalement, en fait, si on regarde globalement euh les émissions de CO2, bah elles sont en hausse et elles sont pas en petite hausse quoi. Du coup, en fait, on a changé tous les écrans, on a des écrans beaucoup plus grands. Donc l'effet rebond,
[00:19:27]
c'est ça, c'est que là maintenant on commence à voir statistiquement que toutes les optimisations qu'on fait qu'on fait en terme d'impact environnementaux finalement ont des impacts négatifs parce que systématiquement, on augmente nos usages derrière.
[00:19:43]
Et là, on est en plein dedans avec euh avec euh chat l'IA, l'IA génératif. Il y a des tas d'usages qu'on va pouvoir optimiser, on mais à la fois, il y a de tels effets rebond que globalement, en fait, si on regarde globalement euh les émissions de CO2, bah elles sont en hausse et elles sont pas en petite hausse quoi.
[00:20:09]
Et donc du coup pour continuer, on va parler de la mesure et de l'évaluation, parce que justement pour prendre des bonnes décisions de frugalité et de savoir quand c'est nécessaire ou pas, utile ou pas de créer un système d'IA, bah c'est vraiment important d'avoir en tête toutes les informations dont les impacts environnementaux, notamment dans les cas où on veut créer des des exemples de DIA pour pour IA for green. Donc IA qui est censé avoir un impact positif pour l'environnement, bah dans ce cas-là, il faut forcément estimer les impacts négatifs de la création de ce système. Euh et donc concrètement, je vais vous montrer des outils qui permettent de mesurer ou d'estimer euh l'impact environnemental et donc la consommation d'énergie des systèmes d'IA. Euh concrètement, c'est compliqué parce que comme euh pour l'IA, euh c'est encore plus compliqué que pour les services numériques plus classiques, puisqu'on a un cycle de ville lia qui est constitué de différentes étapes de d'étapes de data, de training, d'inférence qu'ont tous des impacts. Euh que les infrastructures euh elles sont variées, data center, réseau et terminaux utilisateurs. Et que comme Alice l'expliquait, le cycle de vie euh des équipements est constitué euh pas seulement de la phase d'utilisation, mais aussi euh de leur fabrication, de leur fin de vie et cetera. Et donc c'est un processus long à estimer, c'est coûteux, il y a besoin d'expertise et il y a encore des obstacles, mais il y a aussi beaucoup d'initiatives déjà créées. Euh, notamment des outils de mesure de consommation d'énergie. Euh, donc si vous avez accès et que vous gérez vos serveurs, vous pouvez tout simplement utiliser euh bah de manière assez classique un wattmètre pour mesurer la consommation d'énergie de vos serveurs. Euh, si vous n'avez pas accès, euh il y a d'autres types de wattmètres qui sont plutôt logiciels qui permettent de faire des estimations et des mesures, notamment la librairie Code Carbon, qui est une librairie qui en seulement quelques lignes de code Python permet de démarrer un tracker et de l'arrêter et donc de suivre la consommation d'énergie du CPU, du GPU et de la RAM pendant l'exécution de ces lignes de code. Euh et ensuite, on a plein d'outils d'estimation euh qui ont chacun leur cas d'usage et et leur spécificité. Je vais passer assez vite, c'est juste pour vous donner des exemples d'outils à creuser en détail, mais il y a les QR code à chaque fois si vous voulez le prendre en photo pour l'explorer plus tard. Donc "RIGA algorithm", c'est une interface web de simulation d'usage euh de CPU et de GPU, donc on décrit une infrastructure et un temps d'exécution et euh ça nous permet d'estimer une consommation d'énergie et une empreinte carbone. Euh, il y a EcoLogit qui est euh un des plus connus, je pense, qui est plus facile à utiliser et qui est vraiment spécifique à l'IA générative, donc à la génération de texte en particulier. Et euh donc on décrit quel modèle on utilise et quel type de prompt on génère, donc combien de mots on va venir générer euh avec l'IA, et ça nous donne les impacts euh d'énergie et aussi multicritères euh avec euh les l'épuisement des ressources abiotiques et euh les émissions de CO2 équivalent. Pour les phases d'usage et de fabrication du matériel. Euh ensuite, il y a AI Energy Score qui est un outil de comparaison de modèles, encore une fois, c'est que sur l'inférence. Donc sans prendre en compte l'entraînement des modèles, on vient comparer des modèles pour une tâche spécifique. Donc là par exemple, sur la capture, on est sur les les modèles de classification de texte et avec un système d'étoile, ça va venir nous dire quels sont les modèles les plus efficients.
[00:23:40]
Et enfin, Boavista API euh qui est donc un outil qui a été développé par Boavista, qui n'est pas spécifique à l'IA pour l'instant. Euh mais qui permet d'estimer les impacts multicritères liés à l'utilisation et à la fabrication euh de de différents services numériques.
[00:23:59]
Euhm.
[00:24:02]
Ah oui, si vous avez une pause, si vous avez des questions, on peut déjà faire une petite pause avant de passer à l'initiative BoAmps.
[00:24:16]
Non, moi j'en ai une.
[00:24:17]
OK.
[00:24:18]
Dans dans l'épuisement des ressources. Par exemple, je me demandais si l'étude de l'ADEME que vous avez montré, elle avait des hypothèses sur l'épuisement des ressources. Parce que j'ai pas vu de détails là-dessus. Il y a des hypothèses déjà sur l'épuisement des ressources, ou vraiment pas du tout ?
[00:24:37]
Hmm. Euh, dans cette étude de l'ADEME non. Euh après dans d'autres études, je sais pas si tu as des.
[00:24:42]
Alors, du coup, euh, moi je pensais que c'était dans l'étude de l'ADEME, mais du coup, il y en a une autre qui est défaite par l'ADEME et euh un autre cabinet qui prend en fait euh minerai par minerai. qui explique les enjeux géopolitiques et euh du coup les risques qu'on a en terme, en fait, il y a plus un il y a plus un problème de gestion de flux qu'un problème de gestion de stock. Voilà. Ils expliquent en fait, les ralentissements qui risquent d'y avoir par par minerais.
[00:25:20]
Du coup, on va continuer avec l'initiative BoAmps, donc c'est ce qu'on voulait mettre l'accent dessus aujourd'hui. C'est une initiative qu'on a du coup créé à Boavista. Euh, en fait, ça vient du constat que tous ces outils qui sont existants, ils sont limités, donc ils ont des cas d'usage assez spécifiques, certains, ils sont liés que euh à l'inférence et pas à l'entraînement. Pour des modèles spécifiques que la génération de texte par exemple, ou qui prennent en compte qu'un seul type d'infrastructure. Et donc comme ces modèles, ils sont basés sur la donnée, on se dit que si on a plus de données, et ben, on pourra améliorer tous ces outils. Et donc BoAmps c'est un format standard pour le partage de la mesure de consommation d'énergie de système d'IA. Donc concrètement, euh, c'est un modèle qui permet de décrire une consommation d'électricité associée à une tâche d'IA, en décrivant également les caractéristiques des serveurs mobilisés. Donc ça peut se nourrir de différents outils de mesure que j'ai présenté tout à l'heure et ça peut aussi permettre de standardiser des bases de données open qui existent déjà comme par exemple la base qui est la base de données d'AI Energy Score.
[00:26:23]
qui pour le coup compare différents modèles mais pour une seule infrastructure. Donc si on change si on transférait ces données à un modèle standard, on pourrait les comparer avec d'autres sources de données. Et concrètement, d'avoir cette base d'open data sur la consommation d'énergie des systèmes d'IA, ça nous permettrait d'avoir des bonnes pratiques très concrètes et quantifiées au niveau de des data, des modèles et des infrastructures. Euh ça permettrait d'améliorer les outils existants qui sont basés sur la donnée comme EcoLogit et Boavista API par exemple. Et ça pourrait sûrement donner lieu à de nouvelles initiatives d'IA frugale.
[00:26:59]
Oui.
[00:27:01]
C'est par rapport à la description du modèle qui décrit la production du modèle. Ouais. Quelle est la Qu'est-ce qu'il prend en compte le modèle ? Est-ce qu'il prend en compte le mix électrique ? Exactement.
[00:27:22]
Euh on a cette partie là dans le modèle qui permet de décrire effectivement l'environnement et le type d'énergie utilisée et aussi de fournir directement le mix électrique. Mais c'est c'est un une partie qui est non obligatoire. Parce que le but pour nous c'est vraiment de comparer l'efficience enfin d'optimiser à la fois au niveau data modèle et infra et du coup cette partie euh bah de source d'énergie si on faisait directement du reporting en carbone comme on l'a vu il y a différentes méthodes qui permettent de calculer le carbone, et du coup on pourrait pas comparer directement alors que la consommation électrique elle est elle change pas en fonction de la localisation. Mais effectivement à partir de la consommation d'électrique électrique, on peut calculer ensuite des impacts multicritères, surtout qu'on décrit aussi l'infrastructure et donc du coup comme on a le type de GPU, de CPU utilisé et cetera, on peut calculer des impacts multicritères à partir de des données qui sont dedans.
[00:28:22]
Et euh donc ce projet, il a été lancé côté Boavista, c'est parce que il y a des vrais enjeux de transparence dans l'évaluation de l'impact environnemental. Et plus on aura de données sur bah la consommation des algorithmes en fonction des capacités techniques sur lesquelles il s'appuie, plus on pourra après alimenter le le savoir-faire et proposer des outils de mesure et d'évaluation ouvert à tous et aussi du coup bah mettre en visibilité bah les les providers de service, on va dire les les Gafam aussi sur le travail d'optimisation qu'ils font et sur l'impact environnemental et apporter un petit peu une autre source de données et beaucoup plus de transparence.
[00:29:14]
Euh concrètement, le fonctionnement de BoAmps, c'est on imagine qu'on a deux organisations euh qui ont déployé des workload d'IA, qui sont capables de le mesurer parce qu'ils ont mis en place l'outillage nécessaire, que ça soit Code Carbon, PiJoule ou n'importe quel autre outil. Euh donc du coup, avec ces outils de mesure, ils extraquent, ils sont capables d'extraire des données euh qu'on va remplir au format BoAmps grâce à des outils de remplissage qu'on a créé. Donc on a un outil sous la forme d'un d'un formulaire sur Hugging Face, un script Bâche et un script Excel.
[00:29:47]
Euh et ensuite, du coup euh ça transforme la donnée en un JSON qui est au format standard BoAmps. qu'on va venir publier sur un repo d'open data où tout le monde peut venir partager des données ou consulter toutes les données qu'ont été qu'ont été déposées jusqu'à présent. Euh ce data modèle concrètement, il est composé de différentes parties euh dont certaines sont obligatoires et d'autres sont optionnelles. Euh on a un un report schémat JSON plus complet qui est composé de sous-schémas. Euh, donc par exemple, on va venir décrire la tâche qu'on est en train de réaliser. Cette tâche, elle peut être composée de d'algorithmes et de dataset. Donc par exemple, je peux décrire que je suis en train de faire de l'inférence d'IA générative, où j'ai utilisé un LLM LAMA 3 en version 8 milliards de paramètres, que je l'ai fine-tuné, que j'ai envoyé un prompt de 30 tokens et que j'en ai reçu 200 en sortie. Ensuite, je vais venir décrire la mesure que j'ai faite. Donc ça peut être une liste de mesures parce que comme on disait, il y a plein d'outils qui existent et donc on peut fournir des même des mesures faites avec différents outils de du même workload. Par exemple, si j'ai mesuré à la fois avec un wattmètre et à la fois avec Code Carbon, je peux venir fournir les deux mesures et ça va permettre en plus d'avoir plus de données sur les différences entre ces outils. Et la dernière partie vraiment importante, c'est l'infrastructure, donc décrire exactement quel type de serveur j'ai utilisé, quel type de composant, le modèle, la quantité de GPU et cetera. Et donc c'est dans la partie environnement aussi on peut facultativement venir détailler quel type d'énergie on a utilisé et quel mix électrique si on veut aussi donner directement la consommation enfin les émissions de CO2 équivalent associées. Pour les outils de remplissage, on a cet outil sur Hugging Face qui est donc un formulaire où on voit les différentes parties que je présentais avant donc le header, la tâche, mesure et cetera et les différentes parties, certaines qui sont obligatoires, d'autres non. Euh et donc ce concrètement où on en est sur le projet, on est à la deuxième version de ce data modèle. On l'a déjà expérimenté une fois auprès des équipes membres du groupe de travail et auprès d'étudiants qu'ont travaillé sur le sujet.
[00:32:03]
Euh du coup, on l'a mis à jour pour qu'il soit plus exhaustif, plus facile à utiliser, plus complet. Euh, on avait des outils bash et Excel, du coup qu'on est en train de mettre à jour vers cette V2. Pour le formulaire sur Hugging Face que je montrais juste avant, c'est déjà fait. Et euh le but donc l'open le repo d'open data participatif n'est pas encore euh complètement créé. Euh mais pour consolider tout ça, c'est maintenant qu'on a besoin de retours concrets d'utilisateur pour justement soit mettre à jour ce data modèle ou améliorer les outils qui existent déjà.
[00:32:36]
Donc si vous êtes en capacité dans votre entreprise ou même sur le le temps personnel et que vous déployez des systèmes d'IA et que vous pouvez mettre en place des outils de mesure, et ben nous on est preneur de retours euh à la fois sur bah le data modèle, sur les champs, s'il y a des choses qui sont pas claires ou des champs manquants. Euh on a besoin de retours et de cas d'usage concrets pour pouvoir consolider le le modèle. Puisqu'il y a sûrement des cas d'usage auquel on n'avait pas encore réfléchi. Euh et euh n'hésitez pas à créer des issues directement sur le repo si vous voyez des suggestions d'amélioration ou vous rencontrez des problèmes. Et euh pour l'instant, sur le repo Hugging Face, à la fin, on a un bouton pour télécharger le les données et si on veut les soumettre sur un repo public de test. Donc vous pouvez directement soumettre vos données là-bas ou euh par euh mail à sur mon mail si euh ça ne marche pas ou que vous préférez le faire autrement.
[00:33:32]
Et euh du coup donc le data modèle, il a été fait d'une façon qui fait que c'est très facile en réalité euh il y a beaucoup de champs qui sont pas obligatoires, les champs qui sont obligatoires sont pas si difficiles à obtenir. Quelque part les data scientistes, ils savent très bien tous tous ces champs-là, ils savent très bien de quoi il s'agit. Et euh donc c'est une action qui prend pas beaucoup de temps.
[00:33:54]
euh qui peut être bien valorisée au sein euh de votre structure parce que du coup c'est participer à un projet sustainable. Ça peut aussi être valorisé si votre entreprise elle fait partie de la Sustainable Coalition qui a été montée après l'IA Summit. Euh voilà, c'est ça peut être c'est c'est des petites actions. euh qui sont potentiellement à très forte valeur ajoutée euh et aussi euh côté data scientist, euh les data scientistes, ils aiment bien optimiser leur travail, ils aiment bien bien travailler. Donc de toute façon, ce travail d'optimisation, ils le font. Donc c'est aussi une façon de valoriser euh leur travail, donc c'est vraiment un win-win pour tout le monde.
[00:34:43]
Donc là, on a vraiment mis l'accent sur la partie évaluation mesure qui est un pilier de du travail sur l'impact environnemental de l'IA. Mais en réalité, il y a une logique systémique et des bonnes pratiques de frugalité.
[00:35:05]
Alors voilà. Donc c'est un petit peu toujours la blague quand je dis que je travaille sur l'IA frugale. Tout le monde me dit mais IA frugale, est-ce que ça marche ensemble? Euh surtout quand on regarde la définition qui se nourrit de peu et qui vit d'une manière simple.
[00:35:19]
qui se nourrit de peu et qui vit d'une manière simple. Euh déjà nos services numériques avant, c'est c'est voilà, c'était pas dingue, mais alors là, c'est comme vous l'avez compris, les architectures de l'IA sont assez terribles en terme d'impact environnemental. Donc euh la réponse c'est c'est de se dire qu'en fait une IA frugale, c'est avant tout une IA qui n'existe pas. Voilà, il faut la faut l'avoir en tête. Euh il y a beaucoup, il y a des référentiels qui sont sortis avec beaucoup de bonnes pratiques, notamment euh le référentiel général pour une IA frugale. qui a été co-piloté par l'AFNOR et l'Ecolab du Ministère de la Transition écologique. Il y a 150 experts en fait euh dont des entreprises dont vous faites partie des labos de recherche qui se sont mis autour de la table pendant 6 mois pour partager leurs bonnes pratiques et les valoriser dans ce document. qui maintenant est en cours d'étude au niveau européen, en espérant qu'ils arrivent à à créer une norme qui serait à la fois bonne pour l'environnement et aussi qui pourrait être un facteur concurrentiel d'un facteur de différenciant, un facteur de compétitivité. Après, il y a tout le travail qui est fait par la communauté Data for Good où là, ils ont fait un un livret qui est euh 360 qui prend aussi en compte les questions d'éthique.
[00:36:56]
Il y a les travaux du Shift qui viennent de sortir avec euh une analyse comme euh ils savent le faire sur où est-ce qu'on en est euh dans notre trajectoire de décarbonisation et euh avec ce qui se passe en ce moment avec l'IA, bah quels sont les les impacts en fait sur notre trajectoire.
[00:37:14]
Et comment est-ce qu'on peut faire avec cette ambition euh qui a été annoncée de construire plein de nouveaux data center. Euh ça soulève des des questions très euh pratiques.
[00:37:29]
de comment est-ce qu'on va se connecter au centrale, euh comment va fonctionner donc ce qu'on appelle le grid, c'est-à-dire ce que j'en ai compris parce que je suis pas une experte. Mais en fait la le fait de d'avoir plein de demandes d'électricité au même moment, ça fait des saturations de réseau. Donc visiblement on a pas un réseau qui est encore adapté. On a l'exemple de l'Irlande, t'en parlais Sarah tout à l'heure où ils ont vu qu'il y avait un vrai enjeu industriel à construire des data center, mais ils ont dû s'arrêter et faire un moratoire parce que bah ils arrivaient pas ils arrivaient plus à fournir la population en électricité. Donc on va aussi euh avoir à faire face à ce type d'enjeu. Donc le Shift, ils sont très bons pour faire de la planification et présenter tout ça. Euh, après, il y a l'INR, donc c'est l'Institut du numérique responsable euh qui publie euh qui qui a co-piloté par exemple la mise en place du RGESN, le référentiel général pour l'écoconception des services numériques. Je sais pas si vous connaissez.
[00:38:39]
Et euh donc ils ont fait un une liste de bonnes pratiques sur les questions d'IA, aussi euh qui inclut la partie tech et la partie éthique. Et euh enfin, il y a un site qui s'appelle IA frugal qui euh qui est mis à jour par un journaliste et qui euh présente en fait euh vraiment toutes les bonnes pratiques, à chaque fois, il y a 31 ressources qui sont décryptées et qui permettent d'accéder aux dernières bonnes pratiques et c'est aussi bien en terme de gouvernance que technique. Voilà pour vous outiller.
[00:38:32]
le référentiel général pour l'écoconception des services numériques. Je sais pas si vous connaissez. Et euh donc ils ont fait un une liste de bonnes pratiques sur les questions d'IA aussi qui inclut la partie tech et la partie éthique. Et euh enfin, il y a un site qui s'appelle IA Frugal qui euh qui est mis à jour par un journaliste et qui présente en fait vraiment toutes les bonnes pratiques, à chaque fois il y a 31 ressources qui sont décryptées et qui permettent d'accéder aux dernières bonnes pratiques et c'est aussi bien en terme de gouvernance que technique. Voilà pour vous outiller. Alors du coup, moi j'ai participé à la rédaction de la spec IA Frugal donc je vais mettre un petit peu l'accent là-dessus parce que euh il pose vraiment les bases de la démarche d'IA Frugal. Alors dans les concepts, il y a trois grands axes, trois grands leviers d'action à distinguer. Toute la partie système. Donc le système, c'est vraiment la tech, ce qu'on construit, le service. Quand on va travailler sur euh le système, on va travailler sur l'efficience. C'est-à-dire qu'on va optimiser le résultat attendu au regard de la consommation des ressources. Et c'est très intéressant de faire cette distinction avec la frugalité parce que quand on va travailler sur la frugalité, on va travailler sur le service. Donc on va se poser la question de du besoin, des choses que vous connaissez par cœur. Euh du besoin, de l'usage, est-ce que voilà, mon service il va vraiment être adapté à euh au résultat attendu même pour mon business, pour mes utilisateurs. Voilà. Donc quand on va travailler sur l'efficience du système, on va aller, donc comme on s'est dit tout à l'heure, regarder tout le cycle de vie. parce que là quand tout le monde s'est mis à s'intéresser aux impacts environnementaux de l'IA, tout le monde est allé faire de la mesure sur l'usage, ce qui peut être 30 40 % des des impacts, au bout d'un moment c'est c'est pas suffisant. Donc vraiment cette notion d'aller utiliser l'outil pour et il y a des très bons outils en ligne ce que ce que vous a montré Sarah, euh ça permet vraiment de faire de l'évaluation en fonction de vos équipements et cetera pour au moins avoir cette approche cycle de vie en en complément des travaux que vous faites sur l'usage. Donc on va aller regarder ça sur tout le cycle de vie et sur les trois segments, c'est-à-dire l'algorithme, les données parce que la collecte, le stockage des données, c'est aussi des impacts démentiels. Et donc le matériel, bah donc les les serveurs, euh les GPU mais aussi pourquoi pas les les écrans, les smartphones, voilà, c'est il peut avec les effets rebonds, il peut y avoir des des effets de bord avec le déploiement de l'IA. avec le déploiement de l'IA. Et euh du coup sur la partie euh frugalité, euh on va faire de l'évaluation parce que pour pouvoir faire de la comparaison pouvoir pour pouvoir faire des choix, on va aller faire de l'évaluation. Et euh et aussi travailler sur les architectures euh pour se poser la question est-ce que c'est vraiment l'IA dont j'ai besoin ou est-ce que je peux avoir un autre composant qui peut être plus simple. Et euh et donc il y a aussi cette idée de bah d'aller toujours chercher des bonnes pratiques hein et d'aller mettre en œuvre des bonnes pratiques. On entend souvent c'est impossible d'aller faire du ROI sur l'IA et encore moins sur l'IA générative. Et ben sur l'impact environnemental, on peut aussi avoir le même discours qui est bah allons mettre en place le maximum de bonnes pratiques de toute façon ça aidera quoi. Voilà. Alors euh ça passe toujours très vite ce genre de moment, est-ce que vous avez des des questions? J'ai encore plein de diapos mais
[00:42:47]
Voilà. ça peut être pas mal d'itérer.
[00:42:51]
Je parle de Green Ops, de Fin Ops, d'AI Ops pour le coup d'IA. Quelle est la relation entre utiliser un gros modèle, de pas de faire et en de modèle que vous avez de faire comme ça. Est-ce que il y a il y a une solution qui est plus rigide que
[00:43:07]
Non, je pense que les experts te répondront que il y a des différences mais à ce stade je pense qu'on peut les mettre dans le même panier.
[00:43:16]
Hmm.
[00:43:31]
Alors clairement, euh dans les préconisations, euh on est sur utiliser des modèles euh spécialisés de préférence. Sur des jeux de données maîtrisées. Plus on va partir sur des architectures de ce type, euh moins on va avoir d'impact environnemental.
[00:43:52]
Et on peut le voir notamment clairement avec l'outil ecology tout tu peux changer de modèle et changer le nombre de paramètres du modèle et on voit que par exemple passer de d'un modèle 7 milliards de paramètres à des modèles comme Chat GPT de milliers de milliards de paramètres, ça a vraiment un impact énorme et même passer de 1 milliard de paramètres à 7 milliards, on voit qu'il y a vraiment une réelle différence. Donc la taille du modèle importe influence vraiment la consommation derrière. influence vraiment la consommation derrière.
[00:44:18]
C'est pas
[00:44:23]
Maintenant, je je j'ai envie de me dire là jusqu'à la fin, euh si vous avez des questions au fur et à mesure, hésitez pas. Voilà, on va essayer d'avancer au maximum mais bon je crois qu'il y a beaucoup d'informations, je pense hésitez pas à demander des précisions ou poser des des questions très concrètes.
[00:44:42]
Donc voilà, là vous avez le cycle de vie d'un service d'IA. Donc là, on est vraiment d'ailleurs, on est vraiment sur l'algorithme. On regarde pas les équipements ni les données. Euh globalement, il va y avoir toute la phase de lancement du projet. Donc là, euh les bonnes pratiques c'est de travailler sur la qualification du besoin et des usages. Après, on a toute la partie conception, développement, vérification, validation si le modèle fonctionne bien. Donc c'est ce qu'on peut appeler l'entraînement. pendant cette période d'entraînement, vous pouvez clairement faire de la mesure, de l'évaluation et surtout intégrer ces critères-là dans une gouvernance.
[00:45:32]
Alors je vais faire un petit zoom maintenant sur la gouvernance. Euh comme vous êtes des experts des des KPI et cetera. Euh du coup euh intégrer comme ça de la mesure euh euh des chiffres, pour l'instant c'est très dur en fait pour les utilisateurs, tenez toutes les contraintes qu'il y a déjà sur un projet, d'avoir cette donnée en plus et de l'intégrer dans dans dans des arbitrages pour de la prise de décision. ça fait beaucoup de bruit, ça fait beaucoup de saturation cognitive. C'est un sujet dont on a beaucoup parlé pendant les 2 jours. Donc là en fait, euh moi je milite pas mal pour essayer de pas faire de l'environnement encore un quelque chose, enfin le social, les conditions de travail, l'environnement, faut pas que ce soit soit l'un soit l'autre, faudrait que ça fonctionne ensemble quoi. Donc sur euh les les méthodes comme ça en terme de gouvernance, là il y a avec la CSRD, quelque chose qui s'est accéléré, c'est l'idée de vraiment travailler sur une comptabilité environnementale. Donc de faire rarement de la mesure mais de le faire bien euh et du coup de travailler sur un budget et quelque part de travailler euh sur ces indicateurs environnementaux au même moment où on travaille sur le budget. Donc j'ai un budget en euro. puis juste à côté, j'ai mon budget en consommation d'eau ou en ou en ou en carbone et en fait pour construire ce budget, je vais aller collecter les les données de la de la même façon. Voilà. Ça c'est pour vous dire c'est un peu là ce qui dans les retours d'expérience, c'est ce qui fonctionne le le mieux quoi.
[00:47:22]
Y a-t-il une différence entre les Fin Ops, Green Ops, AI Ops? Pour l'IA, on va parler d'AI Ops.
[00:47:32]
Exactement, bah si alors Finops, Green Ops, même combat. Franchement typiquement je crois que dès qu'on ce qui est ce qui est aussi intéressant hein c'est que dès qu'on est sur de la recherche de l'efficience, de l'optimisation, euh très souvent, il y a des il y a des grosses convergences. Les les métiers de de l'architecture, les métiers du développement, les les métiers de l'optimisation euh financière vont en général dans le dans le sens euh de de même sens que des la réduction des impacts environnementaux. Et euh et donc on est un peu dans les blagues quoi, je sais pas si c'est une blague mais dans les chez les cloud provider, les gens qui sont très investis pour travailler sur la partie environnementale, ils disent toujours moi quand j'ai les quand j'ai les interlocuteurs chef de projet tout ça, ils s'en fichent tout le temps quand je leur présente cette partie-là du fonctionnement du cloud. Mais par contre si j'ai la chance d'avoir le DAF, alors lui il va vraiment s'y intéresser et il va il va rajouter en fait l'utilisation de l'argument environnemental pour pouvoir faire passer ses objectifs financiers.
[00:48:50]
Donc là, vous voyez un petit peu tous les thèmes sur lesquels euh il y a des il y a des bonnes pratiques qui existent dans la Frugal Spec. Donc bah on retrouve hein donc tout ce qui est travailler sur la gouvernance, euh voilà, la qualification du besoin, de l'usage, les trois grands segments. optimiser la performance des systèmes, optimiser la gestion des données et puis optimiser la gestion des équipements. Et enfin aussi euh avancer sur l'évaluation et sur les compétences parce que euh bah toutes les bonnes pratiques qui existent bah c'est des compétences en réalité, des compétences qui existent déjà dans le cœur du métier. ou alors de nouvelles compétences qui sont à intégrer dans le poste, dans le métier, afin que ce soit pas encore une couche en plus impossible à gérer quoi. Alors, par où commencer ? Euh ça, voilà, c'est un point euh qui est important parce qu'on vous a beaucoup parlé des impacts.
[00:49:57]
Il y a les équipements, l'usage, enfin il faudrait pouvoir agir un petit peu partout. On peut chacun agir de là où on est. Donc déjà le le premier point aussi que je dis souvent, c'est comme vous êtes beaucoup, et ça c'est génial, à avoir fait votre impact environnemental personnel. vous avez vu qu'il y a des tas de leviers sur lesquels on peut agir et quelque part, je suis sûr que dans la salle les gens qui ont envie d'agir, personne n'a n'a agi de la même façon. Donc déjà le premier point, c'est de se dire que quelque part c'est personnel en fait. Et et euh dès qu'on il y a des normes extérieures qui viennent et qui arrivent en dissonance avec notre façon d'agir, ça bloque l'action. Donc déjà, le le premier des des points, c'est de se dire moi là où je suis avec ma connaissance, mon périmètre, où est-ce que je peux agir ?
[00:50:56]
Voilà. Ensuite, dans donc les les bonnes pratiques, donc la gouvernance permettant de piloter l'IA frugale. Donc c'est ce que ce dont je vous ai parlé tout à l'heure. En ce moment, on voit vraiment ce qui marche bien, c'est quand même d'avoir cette approche holistique de la comptabilité environnementale. Après, bah il y a toutes les bonnes pratiques et là-dessus la gestion de projet, tout ce qui est agilité pour ajuster le besoin euh ça c'est c'est c'est des choses qui sont très précieuses. Toute la partie donc sur l'architecture, plus votre architecture et ça c'est des bonnes pratiques d'architecture d'entreprise qu'on entend depuis 20 ans, plus votre architecture elle va être modulaire,
[00:51:37]
uh et euh vous vous allez pouvoir réutiliser vos vos composants. un algorithme qui a déjà été entraîné plus vous l'utilisez plus il est partagé et cetera plus vous allez baisser le coût unitaire de l'entraînement.
[00:51:54]
Donc euh et derrière ça, il y a aussi l'idée d'utiliser des algorithmes open source, d'aller partager vos algorithmes, il y a des tas de bonnes pratiques qui sont liées à ça. Euh donc voilà, cette partie architecture est importante. Sur la partie technique, voilà, j'ai mis être dans des communautés, partager l'information dans les communs mais aussi partager ce que vous avez développé quoi. Donc les algorithmes, les données. Il y a des tas de jeux de données qui sont déjà ouverts de bonne qualité, euh si vous-même vous allez nettoyer un jeu de données et que vous pouvez d'un point de vue business le partager, c'est des choses qui sur des gros volumes qui ont qui peuvent très vite avoir beaucoup d'impact. Et enfin bon bah se former, voilà, j'en ai déjà parlé.
[00:52:57]
Et après voilà, bon ça c'est pour vous donner une idée euh des des bonnes pratiques des listes de bonnes pratiques qui sont euh qui sont disponibles dans les documents qu'on a cité. Euh voilà, mais en gros, c'est une bonne journée de formation voir des des des sous-parties spécialisées qui permettent de de traiter toutes ces bonnes pratiques.
[00:53:21]
Du coup, on peut finir peut-être sur les bonnes pratiques concrètes côté utilisateur final qui peuvent toucher un peu tout le monde. Euh donc du coup, il y a plusieurs leviers que vous pouvez adresser vous à votre niveau. déjà remettre en question le besoin, est-ce que j'ai vraiment besoin de créer une image avec de l'IA pour une slide que je vais utiliser une fois et se rendre compte et partager aussi bah les impacts de l'IA parce que aussi on n'a pas conscience quand on envoie un prompt à chat JPT forcément de tous les impacts que ça génère derrière. Euh et donc privilégier les modèles les plus légers comme on disait avant, pas forcément utiliser le modèle le plus généraliste pour juste poser une question assez basique, utiliser juste une recherche web quand c'est nécessaire. Euh donc c'est vraiment raisonner nos usages et concrètement on peut voir qu'il y a des des bonnes pratiques qui peuvent avoir un gros impact. Par exemple, je sais pas si vous utilisez GitHub Copilot mais de base, il a une fonction d'autocomplession qui est activé quand on l'utilise et donc à chaque fois qu'on tape juste une lettre. ça va essayer de nous proposer des lignes de code et donc en fait ça envoie plein de requêtes qui sont pas directement sollicitées par l'utilisateur. Euh et il y a une un article d'une recherche de Tristan Coignon euh qui nous dit que du coup en moyenne, on a neuf requêtes non sollicitées par minute qui sont envoyées au serveur derrière de de GitHub Copilot pour essayer de prédire le code et que dans toutes ces requêtes, il y en a que 10 à 15 % qui donnent des réponses qui sont acceptées par le développeur et ensuite 8 % qui sont gardés dans le code au final. Euh donc cette fonction, on peut justement l'enlever, la remettre comme on veut avec un contrôle clavier et du coup c'est un exemple de de bonne pratique qui peut avoir des cas très concrets et des réductions concrètes. Euh et il montrait aussi que du coup euh l'utilisation de Copilot avec l'autocomplétion, c'était comme utiliser autant d'énergie qu'un deuxième laptop en parallèle. Donc c'est énorme et donc c'est important de l'utiliser que quand on on sait qu'on a des tâches répétitives et que ça va vraiment avoir de l'intérêt, alors qu'il y a d'autres fois où justement ça va juste nous polluer puisque ça écrit tout le temps des choses à l'écran et que c'est pas c'est pas utile.
[00:55:34]
C'est ça. Merci.
[00:55:37]
Merci beaucoup.