3 mots pour un même objet ?

Il n’est pas rare que l’emploi de certains termes se fasse au détriment de leur sens originel. Certains parleront d’évolution du langage mais il s’agit généralement d’une simple ignorance ou de motivation marketing, un terme fait plus sérieux, plus moderne, plus vendeur. Il en résulte une certaine confusion.

Ainsi nous parlons « d’informatique », mais l’informaticien travaille-t-il l’information ou la donnée ? est-ce que je lui fournis une information ou une connaissance ?

A l’occasion des cours que je dispense en école ou en entreprise, je fais régulièrement le test pour solliciter mes auditeurs sur leur définition de diverses notions. La diversité des réponses en dit long sur l’état de confusion dans lequel nous sommes plongés.

Aujourd’hui je vous propose d’évoquer et tenter de clarifier les notions de donnée, information et connaissance.

La donnée

Selon wikipedia : « Une donnée est une description élémentaire d’une réalité. C’est par exemple une observation ou une mesure ».

La donnée est une notion abstraite typée. Il y a des données numériques, symboliques, textuelles, logiques, … La donnée ne porte pas de sens en elle-même. Si je code une fonction y = sinus(x), l’angle représenté par la valeur x n’a pas d’importance. Il peut s’agir d’un angle fait par un meuble dans une pièce, d’un angle de trajectoire d’une comète, de la pente d’une courbe d’évolution d’un cours de bourse, tout ceci n’est pas impactant sur la fonction sinus.

Lorsque je range des données dans une base de données, peu importe leur signification. La performance de l’algorithme de stockage et de restitution est uniquement liée au type et au volume des données, à la fréquence et à la nature des accès à ces données.

On peut dire que la grande majorité des traitements réalisés par les informaticiens concernent des données dont le sens porté par leurs valeurs n’est pas déterminant au sein du traitement. Mais il ne s’agit généralement pas des traitements les plus compliqués. Les traitements deviennent plus compliqués lorsqu’il est nécessaire de différentier les données en fonction de leur sens, quand ces données deviennent des informations.

L’information

Selon wikipedia :  Au sens étymologique, l’information est ce qui donne une forme à l’esprit. Elle vient du verbe latin informare, qui signifie « donner forme à  » ou « se former une idée de ».

L’information est aussi une notion abstraite, mais d’un niveau d’abstraction supérieur à celui de la donnée. On peut dire pour simplifier que l’information est une donnée + un sens.

Si je compare deux adresses en considérant qu’il s’agit de données, il me suffit de faire appel à une fonction qui va comparer les deux chaines de caractères, octet par octet. Mais nous savons bien que les deux adresses peuvent être identiques sans que leurs représentations le soit. Un code postal peut être écrit 91000 ou F91000, Boulevard peut être abrégé en Bd, Monsieur en M., le nom et le prénom peuvent être écrits dans des ordres différents, etc.

Comparer deux informations s’avère bien plus complexe que comparer deux données. En confondant les deux termes, des incompréhensions apparaissent, un maitre d’ouvrage peut s’attendre à un traitement au sens des informations et un fournisseur peut livrer un traitement sur la base de simples données.

De fait, utiliser le bon terme n’est jamais suffisant, il faut préciser la définition des deux termes pour interpeler le lecteur et éviter l’interprétation. C’est primordial.

La connaissance

Selon wikipedia :  » La connaissance est une notion aux sens multiples à la fois utilisée dans le langage courant et objet d’étude poussée de la part des philosophes contemporains ».

La connaissance est aussi une notion abstraite, d’un niveau d’abstraction supérieur à celui de l’information. La connaissance à la différence de l’information est partagée et s’appuie sur un référentiel collectif.

Mais attention, des informations peuvent être communiquées sans pour autant devenir des connaissances. Il faut alors les accompagner de leur référentiel puisque celui-ci ne sera pas partagé (non-implicite).

Si je vous communique un code postal, je n’ai pas besoin de vous expliquer ce dont il s’agit, vous disposer d’un référentiel pour interpréter ce code, par exemple pour savoir si le département est maritime, montagneux, campagnard en vue de segmenter une offre de produits. Le code postal s’apparente à une connaissance largement partagée en France. Mais si je communique ce code postal à une équipe en Inde, il est fort probable qu’il sera considéré simplement comme une information, en l’absence de référence de connaissance, ou pire de simple donnée.

La connaissance peut être spécifique à un métier, donc partagée seulement par les experts du métier.

Le bon sens populaire

Il est intéressant de noter que dans les expressions spontanées le bon terme est généralement présent. Notre cerveau effectue naturellement la distinction entre les 3 notions.

Mon web designer va me demander : « comment veux-tu que je présente tes données techniques sous la photo des moteurs ? ». Il me spécifie ainsi que la signification des chiffres communiqués n’est pas de son ressort.

Mon client va me dire : « j’ai regardé votre catalogue de moteur à la recherche du nombre de cylindre et je n’ai pas trouvé cette information !« . Il me signifie ainsi qu’il sait à quoi correspond un nombre de cylindre et qu’il était tout à fait capable de le relever quelle que soit la forme sous laquelle il aurait pu être écrit dans le catalogue.

Mon DRH va recruter un collaborateur en lui demandant : »avez-vous des connaissances sur la mécanique automobile ? ». Il précise ainsi le cadre dans lequel le collaborateur doit s’inscrire et se sentir à l’aise. Ainsi le collaborateur recruté sera plus à même d’interpréter les informations techniques des moteurs que je souhaite proposer sur mon site internet BtoB.

La déviation

Dans de nombreux cas, pour des motivations stratégiques ou politiques, ou simplement pour se protéger, mon interlocuteur va utiliser un terme inapproprié. C’est un acte dont il ne sera surement pas conscient. Il me conforte ainsi dans mon attente en utilisant mon terme mais en lui attribuant le sens qui lui convient. Il y aura fatalement confusion et des incompréhensions ne peuvent qu’en découler.

Les différentes notions sont représentées dans notre champ de conscience par des noèmes. Le raisonnement que l’on effectue sur ces noèmes est la noèse. A chaque noème sont associés des mots issus de notre apprentissage. Certains mots sont précis d’autres sont approximatifs pour nous.

En fait peu importe quelle terminologie est employée pourvue que l’on soit d’accord sur le noème et donc que l’on partage la même notion.

Dans notre cas, la problématique réside dans le fait que les interlocuteurs ne parlent pas des mêmes noèmes mais utilisent les mêmes mots pour désigner ces noèmes différents. Ainsi le noème « donnée » pourra être appelé indifféremment par le mot « donnée » ou le mot « information » et dans une moindre mesure par le mot « connaissance ». Le noème « information » pourra être appelé indifféremment par un des 3 termes. Et le noème « connaissance » sera nommé « connaissance » ou « information » et parfois simplement « donnée ».

On peut toutefois limiter le risque de déviation en étant très précis sur les termes employés et en rappelant leurs différences ou en précisant leurs définitions.  La vigilance est de mise également pour détecter l’emploi d’un terme qui pourrait être révélateur d’une déviation et préciser alors ce qui est attendu. Mais un problème de terminologie est souvent le théâtre d’une incompréhension plus profonde relevant d’une confusion des noèmes.

La confusion

La confusion consiste à ne maitriser qu’un nombre réduit de noèmes et leur associer plusieurs termes pris comme des synonymes.

Dans l’exemple ci-dessus le noème « information » n’existe pas, les termes « donnée » et « information » sont considérés comme des synonymes. C’est fréquemment le cas dans les populations de développeurs et de datascientists.

Le contraire peut être vrai aussi, les populations métiers ont souvent tendance à privilégier el noème « information », le noème « donnée » étant absent de leur champ de conscience. Ils attribuent le terme « donnée » systématiquement au noème « information » car toute valeur est pour eux porteuse de sens.

Bien évidement ceci ne constitue qu’une tendance.

Lorsqu’il y a confusion, le dialogue est quasi impossible, les interlocuteurs ne disposant pas des noèmes adéquats ne peuvent se comprendre.

Jean Pierre MALLE