Les enjeux de l’adoption de modèles d’apprentissage

Lino Galiana

Data scientist, Insee

2025-03-10

Avertissement

Il y a trois mondes. Le premier monde de l’IA est le monde de la recherche, du futur. […] Le deuxième monde de l’IA est le monde de l’application, du présent. Les ingénieurs utilisent les méthodes inventées par le premier monde pour construire des outils d’aide à la décision efficaces, rapides et pertinents. Le troisième monde de l’IA est le monde du mythe, du récit. La sphère médiatique s’empare de sujets qu’elle ne maîtrise pas et construit l’imaginaire collectif, à grand renforts d’exagération, de délires, de fantasme.

Ces trois mondes sont découplés. Les outils créés par le premier monde, celui de la science, sont réinterprétés librement par le troisième monde, celui du récit. Les scientifiques disent un possible, un potentiel, un pensable, qui est transformé par les communicants en récits parfois plausibles, souvent exagérés – voire faux.

Anatomie d’une bulle (AltGR 2023)

Quiz

Question 1

Un célèbre chercheur en IA a déclaré :

Mon but n’est pas de vous surprendre ou de vous choquer, mais pour résumer, nous disposons maintenant de machines qui pensent, apprennent et créent. En outre, leurs capacités va augmenter rapidement jusqu’à ce que, à un horizon proche, le type des problèmes qu’elles pourront résoudre sera proche de ce que l’esprit humain peut faire.

De quand date cette citation ?

  • 1957
  • 1979
  • 2019
  • 2023

Question 2

Un célèbre ingénieur en informatique a écrit :

Les oiseaux de mauvais augure qui nous prédisent un monde délirant où les robots prendraient le pouvoir et nous domineraient, où ceux qui nous font miroiter un monde dans lequel l’intelligence artificielle résoudrait tous nos problèmes, nous racontent tous n’importe quoi.

De quand date cette citation ?

  • 1957
  • 1979
  • 2019
  • 2023

Question 3

Quand a été créée la première intelligence artificielle à l’Insee ?

  • 1957
  • 1979
  • 2019
  • 2023

Réponses au quiz

Question 1

Mon but n’est pas de vous surprendre ou de vous choquer, mais pour résumer, nous disposons maintenant de machines qui pensent, apprennent et créent. En outre, leurs capacités va augmenter rapidement jusqu’à ce que, à un horizon proche, le type des problèmes qu’elles pourront résoudre sera proche de ce que l’esprit humain peut faire.

De quand date cette citation ?

et 66 ans plus tard, Yoshua Bengio répète encore la même chose (voir Radio Canada 2023)

Alors que l’on pensait qu’il faudrait attendre des décennies, voire des siècles, pour que l’IA atteigne le niveau des capacité cognitives des êtres humains, moi-même et d’autres scientifiques pensons que la technologie pour y arriver pourrait être développée au cours des deux prochaines décennies, voire dans les quelques années à venir.

Question 2

Un célèbre ingénieur en informatique a écrit :

Les oiseaux de mauvais augure qui nous prédisent un monde délirant où les robots prendraient le pouvoir et nous domineraient, où ceux qui nous font miroiter un monde dans lequel l’intelligence artificielle résoudrait tous nos problèmes, nous racontent tous n’importe quoi.

De quand date cette citation ?

Luc Julia en 2019 (voir Julia et Khayat 2019)

Question 3

Quand a été créée la première intelligence artificielle à l’Insee ?

Adoption d’un modèle d’apprentissage automatique seulement en 2022:

Introduction

Comment définir l’IA ?

« L’étude des agents [intelligents] qui reçoivent des perceptions de l’environnement et agissent. Chacun de ces agents est mis en œuvre par une fonction qui associe les perceptions aux actions, et nous couvrons différentes manières de de représenter ces fonctions, telles que les systèmes de production, les agents réactifs, les planificateurs logiques, les réseaux de neurones et les systèmes de gestion de l’information et les systèmes de théorie de la décision »

Russell et Norvig (2020)

« Système basé sur une machine qui est conçu pour fonctionner avec différents niveaux d’autonomie et qui peut faire preuve d’adaptabilité après son déploiement, et qui, pour des objectifs explicites ou implicites, déduit, à partir des données qu’il reçoit, comment générer des résultats tels que des prédictions, du contenu, des recommandations ou des décisions qui peuvent influencer des environnements physiques ou virtuels »

AI Act européen

Comment définir l’IA ?

  • Définition très large:
    • Pas que ChatGPT
    • Exemple: Feu de signalisation s’adaptant à la circulation = IA dans cette définition
  • Principe général:
    • Environnement représenté comme un ensemble de données (\(\mathbb{X}\))
    • Règles de décision adaptées à celles-ci (\(f(\mathbb{X})\))
    • Dimension fondamentalement opérationnelle

Comprendre par l’histoire ce qu’est l’IA

“L’âge d’or de l’IA” (1956-1970)

  • Un foisonnement d’idées et d’espoirs
    • reconnaissance de l’écriture, traduction, modélisation du langage, etc.
  • Les fondements de l’IA ont été inventés à cette époque:
    • Algorithmes type general problem solver, réseaux de neurones
    • Mais puissance de calcul très limitée
  • Résultats décevants, coupe des budgets en 1974
    • Le premier hiver de l’IA (1974-1980)

L’ère des systèmes experts (années 80)

  • Techniques des IA symboliques:
    • Encoder dans une machine la connaissance d’experts humains
  • Moteurs de règles:
    • SI … ET … ALORS …
    • Tendent à devenir très nombreuses, difficiles à maintenir
  • Un second (deuxième ?) hiver de l’IA à partir de la deuxième moitié des années 80

A partir de 1993

  • Puissance de calcul démultipliée:
    • Deep Blue (IBM) bat Kasparov en 1997
    • Loi de Moore : postulat d’un doublement tous les 2 ans du nombre de transistors présents sur un microprocesseur
  • Essor du machine learning
    • 2000’-2010’: apprentissage automatique dans la tech puis plus largement
    • 2015 : modèles de diffusion
    • 2017 : transformers, une architecture pour les problèmes complexes (langage, image, vidéo…)
    • Depuis 2018 : BERT, GPT2/3 (LLM)
  • 2022-2023 : IA génératives grand public (DALL-E, ChatGPT, Midjourney…)
    • Multimodales: capacité d’ingérer et générer différents formats

IA génératives : des espoirs démesurés ?

Figure 1: Hype Cycle for Emerging Technologies, 2023 (Rimol DeLisi et Howley 2023)

Enjeux de l’adoption de modèles d’apprentissage

Une approche scientifique

  • L’objectif de l’apprentissage: détecter des régularités statistiques fines
    • Algorithmes plutôt qu’hypothèses
    • Modèles plus ou moins complexes selon le type de tâche:
      • Machine learning -> réseaux de neurones
  • Approche scientifique adaptée à l’extrapolation

Comment évaluer un modèle d’apprentissage ?

  • Apprentissage supervisé: la variable qu’on essaie de prédire est mesurable
    • Evaluation de la qualité de l’algo sur le passé est la partie “aisée”
    • Enjeu de contrôle de la qualité des performances dans le temps
    • Enjeu de la collecte continue de données (annotations)
  • Apprentissage non supervisé: on essaie de réaliser une tâche mais on n’a pas de mesure de la variable cible
    • Exemples: profil de consommateur, sujets de discussion, etc.
    • Collecte d’annotations pour renforcer le modèle sur des tâches données (exemple: bien répondre à des questions)

Il faut évaluer au-delà de l’effet wahoo

Autrement, des décisions structurantes seront prises sans évaluer les conséquences techniques et humaines.

Enjeux de l’utilisation d’un modèle

  • Investissement conséquent dans la phase de POC:
    • Collecter et préparer de la donnée pour répondre au mieux à la question
    • Construire une équipe aux compétences diversifiées: data scientists, data engineers, devs, analystes métiers, etc.
    • Investir dans les moyens techniques pour faire de l’IA
  • Travail important du prototype à la production:
    • Avoir un modèle disponible à la demande est coûteux (GPU…)
    • Enjeux éthiques dans la prise de décision administrative ou l’usage RH
    • Il faut allouer des moyens pour maintenir un modèle d’IA:
      • Infrastructure, collecte de données, moyens de développements…

Les modèles génératifs, des enjeux spécifiques

Les modèles génératifs posent des défis supplémentaires, par exemple l’hallucination.

Conclusion

Conclusion

  • Histoire de l’IA: comprendre l’intérêt des modèles, leurs domaines d’application multiples et leur place accrue dans notre société
  • L’apprentissage est porteur de promesses
    • Très bonnes performances pour des tâches complexes
    • Mais ce n’est pas miraculeux (no free lunch)
  • Adopter une organisation humaine et technique pour maintenir un modèle de qualité
    • Même les meilleurs modèles nécessitent un travail humain important (ChatGPT)

Pour en savoir plus

AltGR. 2023. « Anatomie d’une bulle ». AltGR. https://www.alt-gr.tech/history-of-ai.
Julia, Luc, et Ondine Khayat. 2019. L’intelligence artificielle n’existe pas. Paris: First éditions.
Lorigny, Jacques. 1988. « QUID, une méthode générale de chiffrement automatique ». Techniques d’enquête 14 (2): 307‑16. https://www150.statcan.gc.ca/n1/fr/pub/12-001-x/1988002/article/14587-fra.pdf.
Meyer, Eric, et Pascal Rivière. 1997. « SICORE, un outil et une méthode pour le chiffrement automatique à IINSEE ». In Actes de la 4ème Conférence Internationale des Utilisateurs de Blaise, 280‑93. Paris, France. http://www.blaiseusers.org/1997/papers/meyer97.pdf.
Radio Canada. 2023. « L’IA atteindrait le niveau de l’intelligence humaine d’ici 5 à 20 ans, croit Bengio ». Radio-Canada. https://ici.radio-canada.ca/nouvelle/1998915/ia-conscience-evolution-bengio.
Rimol DeLisi, Meghan, et Catherine Howley. 2023. « Gartner Places Generative AI on the Peak of Inflated Expectations on the 2023 Hype Cycle for Emerging Technologies ». Gartner. https://www.gartner.com/en/newsroom/press-releases/2023-08-16-gartner-places-generative-ai-on-the-peak-of-inflated-expectations-on-the-2023-hype-cycle-for-emerging-technologies.
Rivière, Pascal. 1995. « SICORE, un outil et une méthode pour le chiffrement automatique à l’INSEE ». Courrier des statistiques, nᵒ 74 (août): 65‑69. https://www.nomenclature-pcs.fr/uploads/documents/L8_Article_Riviere.pdf.
Russell, Stuart J., et Peter Norvig. 2020. Artificial Intelligence: A Modern Approach (4th Edition). Pearson. http://aima.cs.berkeley.edu/.