Les 3 dimensions d’un système

Tout système automatique peut se décomposer selon 3 dimensions

  • Une dimension proportionnelle pour laquelle la réponse du système est directement fonction de la situation courante
  • Une dimension intégrative pour laquelle la réponse du système s’appuie sur le passé par intégration des situations antérieures
  • Une dimension différenciative pour laquelle la réponse du système est liées aux singularités de la situation et à son évolution

Certains flux de situations nécessitent que le système qui les traite soit plus ou moins développé sur certaines dimensions. Un système d’intelligence artificielle ou de data-intelligence n’échappe pas à ces règles.

Chacune des dimensions apporte ses méthodes et ses savoir-faire spécifiques. Sous l’angle mathématique on retrouvera des techniques liées à l’analyse fonctionnelle pour la dimension proportionnelle, au calcul intégral ou différentiel pour les deux autres. Sous l’angle de la psychologie des acteurs en situation on parlera plutôt sociologie pour la dimension intégrative et psychologie différenciative pour la dimension différenciative du système.

Mais en matière algorithmique, on rencontre des datascientists qui n’ont pas conscience de la notion de système et qui notamment n’instancient pas la dimension différenciative. Le résultat est qu’ils produisent des systèmes qui se montrent déceptifs dès que les dimensions manquantes deviennent prépondérantes. Ce n’est heureusement pas toujours le cas, mais comme cela arrive il est intéressant de se pencher sur les raisons sous-jacentes.

Le machine learning : IA purement intégrative

Certains systèmes se présentent avec des dimensions plus développées que les autres selon les situations à traiter, leur caractère rémanent, leur caractère évolutif, leur variété.

Par exemple si l’on cherche à anticiper le trafic d’une ligne de métro, on comprend bien que la dimension proportionnelle aura un effet car plus il y a de personnes, plus la demande de transport sera grande. Toutefois la croissance de la population est lente et bien souvent elle peut être considérée comme stable à l’échelle du système à concevoir. La dimension intégrative sera prépondérante car les usagers utilisent la ligne de métro de façon très récurrente et donc un apprentissage de type machine learning sera surement efficace. On peut donc se contenter généralement d’une machine avec une seule dimension intégrative pour prédire le trafic.

En revanche si des évènements exceptionnels sont planifiés tels que des rencontres sportives, si des incidents surviennent sur la ligne ou sur des lignes voisines, si la météo est perturbée, alors l’IA intégrative fournira pour ce jour-là des prédictions erronées.

Par définition, un système intégratif élimine les singularités pour se concentrer sur les phénomènes récurrents, il est donc normal que les exceptions ne soient pas prédictibles avec de tels systèmes.

Lorsque l’on analyse l’offre disponible en algorithmes sur le marché, qu’il s’agisse de Microsoft Azure, Amazon AWS ou Google Cloud pour citer les principales plateformes, il semble que les constructeurs se soient polarisés essentiellement sur les techniques intégratives. Les formations en data-science disponibles sur le marché n’évoquent que rarement la dimension différenciative. De fait les datascientists que l’on rencontre n’ont que très rarement à l’esprit cette dimension différenciative et on constate leur carence dans la plupart des systèmes installés.

Tant qu’il s’agit de prédire des cas récurrents, tant que la prédiction erronée en cas de situation exceptionnelle est tolérable, ces systèmes répondent bien à la demande, sont relativement simples à mettre en œuvre et sont bien maitrisés des datascientists.

Le deep learning : IA partiellement différenciative

Il existe plusieurs cas de figure dans lesquels la dimension différenciative s’impose. Le premier cas concerne les systèmes prédictifs asymétriques ou à forte variété d’évènements.

Un système asymétrique est un système dans lequel les évènements sont catégorisés selon une répartition fortement déséquilibrée, une catégorie est représentée de façon infinitésimale et l’autre couvre la quasi-totalité des cas. Dans cette situation les algorithmes intégratifs de type machine learning ne fonctionnent plus. En effet ces algorithmes sont conçus pour lisser les singularités et éliminer les signaux faibles. Or les événements rares sont considérés par l’algorithme comme des signaux faibles et sont éliminés.

Un artifice consiste à multiplier les événements peu probables lors de l’apprentissage pour forcer les algorithmes à les reconnaître en les présentant avec une densité plus grande. Mais cet artifice rencontre des limites en termes d’efficacité lorsque la variété d’événements rares grandit. Dès lors, les erreurs de catégorisation se multiplient mécaniquement.

Ce phénomène peut être amoindri par l’introduction d’une dimension différenciative permettant de limiter localement la variété des événements en réalisant plusieurs apprentissages sur des lots d’événements à variété plus réduite. C’est notamment le cas avec la mise en œuvre des techniques de deep learning. En effet les réseaux neuronaux offrent des capacités de différenciation des événements en amont ce qui permet d’affiner l’apprentissage. Les algorithmes de deeep learning classifient bien plus précisément que les algorithmes de machine learning.

Ces algorithmes trouvent notamment toute leur place dans le monde de la sémantique ou la variété de sens est très importante et partout ou une grande variété de situations se présentent.

L’IA personnalisée

Le deuxième cas ou s’impose la dimension différenciative concerne les événements dont la nature nécessite un traitement différencié. Par exemple il serait très discutable d’envisager de prescrire un traitement à un patient sur la seule base d’une statistique. Dans ces cas et bien d’autres, seule la dimension différenciative permet de prendre en charge les spécificités du dossier analysé.

Dans tous ces cas l’apprentissage en vue de reproduire une stratégie qui a fonctionné dans d’autres situations peut s’avérer très dangereux. De fait la dimension intégrative sera réduite. Un médecin par exemple mettra en œuvre une dimension proportionnelle pour définir la dose d’antidouleur à administrer au patient en fonction de son niveau de souffrance et une dimension différenciative par un examen approfondi du patient.

Bien sûr le médecin s’appuiera sur son expérience, sur les autres cas rencontrés mais son travail ne sera complet que s’il étudie tous les détails qui constituent des différences avec les cas rencontrés. C’est un travail d’analyse et d’investigation long et qui doit être mené avec sérieux, ce qui justifie la durée de la consultation, les examens complémentaires et les équipements sophistiqués nécessaires. Si le médecin se contentait de mettre en œuvre une dimension intégrative comme ce fut le cas par le passé, notre durée de vie serait considérablement amoindrie.

Il existe des cas bien moins critiques mais pour lesquels la personnalisation de l’IA se révèle également indispensable, il peut s’agir de l’orientation scolaire, de propositions d’emplois, de conseils, ou de recommandations de produits. En fait partout où l’IA s’adresse à un individu en particulier ou concerne une personne spécifique.

Par exemple pour proposer un produit à une personne, une IA intégrative ne s’appuiera que sur une statistique, et produira une recommandation du type « ceux qui ont consulté ça ont aussi consulté ça » ou « ceux qui habitent votre quartier achètent majoritairement ça ». Alors qu’une IA différenciative produira une recommandation bien plus proche de celle que ferait un conseiller en chair et en os « compte tenu de votre situation, nous vous proposons plutôt ça ».

L’IA justifiée

Le troisième cas concerne les événements pour lesquels il est nécessaire de justifier la prise de décision opérée par l’intelligence artificielle. Là encore, la dimension intégrative ne peut que fournir qu’une tendance globale liée à la présence de signaux forts. Seule la dimension différenciative permet de mettre en exergue les singularités qui ont modelé la prise de décision par l’intelligence artificielle et qui la justifient.

C’est le cas par exemple de la justice, il est bien évident que si une IA devait analyser les dossiers en vue d’alléger la charge du personnel judiciaire, les mêmes conclusions que celles obtenue dans le cas du médecin s’imposeraient, on ne peut inculper quelqu’un sur la seule base d’une analyse statistique, la dimension différenciative est primordiale. Mais ici le phénomène serait encore renforcé par le fait que l’IA devra apporter la justification précise de sa prise de décision. Dans tout acte judiciaire, il y a confrontation des arguments, l’accusation et la défense s’appuient sur des analyses du même dossier en mettant en exergue des différenciations à l’avantage à l’une ou l’autre des thèses. Il est alors indispensable que l’ensemble des justifications des décisions, alertes et recommandations de l’IA soient fournies et analysables par les parties concernées.

Cette situation se rencontre dans de nombreuses situations ou l’IA fait une incursion à notre époque. Par exemple le véhicule autonome devra tracer l’ensemble de ses décisions et devra les justifier en cas d’accident. C’est également le cas d’IA prenant des décisions financières, de celle intervenant dans un processus de production, décidant d’opérations de maintenance, etc.

Un effort important et soutenu

La construction d’un système intégratif est facilité à plusieurs niveaux :

  • Par principe ces systèmes éliminent les signaux faibles et les singularités et de fait se simplifient
  • L’intégration est une fonction qui a toujours une solution mathématique qui de plus est continue et régulière donc facilement calculable
  • Un système intégratif est peu sensible aux erreurs dans les données, leur qualité est donc peu influente
  • Il existe pléthore d’algorithmes sur le marché pour faciliter le développement du système
  • Même si le système est partiellement étudié, une intégration fournit toujours un résultat visible qui va dans le bon sens

En revanche construire un système différenciateur est un travail bien plus laborieux

  • Par principe ces systèmes sont très sensibles à la qualité des données, si les données sont édulcorées par un système de collecte leur efficacité chute de façon drastique
  • La différenciation peut se conduire selon de nombreux axes différents qu’il faut tester et souvent combiner
  • La différenciation peut conduire à des discontinuités, nécessiter de réaliser des calculs dans des espaces non euclidiens, elle n’est pas toujours possible mathématiquement
  • Il existe peu d’algorithmes sur le marché, il est souvent nécessaire de les construire soit même à partir de bibliothèques et bien veiller à respecter leur domaine d’application
  • Le système différenciateur produit peu d’effets tant que sa couverture de la variété des événements n’est pas achevée en grande partie.

Ce constat explique que l’intelligence artificielle différenciative soit si peu prisée des datascientists. De fait nombre d’entre eux s’évertuent à produire des systèmes intégratifs car ce sont les seuls qu’ils connaissent, alors même que leur application sera contre-productive. Dans de nombreux cas seule la dimension différenciative peut répondre à la problématique posée mais elle nécessite de la formation et de l’effort pour sa mise en œuvre.

Jean Pierre MALLE