jeudi 16 juin 2011

Les connaissances erronées

N'ayez pas peur de faire une erreur. Mais faites en sorte de ne pas faire la même erreur deux fois. (Akio Morita)
Lorsqu'on élicite les connaissances d'un expert, il est probable que, de temps à autre, l'expert délivre une connaissance erronée. Je ne parle pas d'erreurs dues à l'éliciteur, qui peuvent être éliminées par la technique du rétroapprentissage, mais bien d'erreurs dans la connaissance même de l'expert.
Comment gérer ce problème ?

L'origine des connaissances erronées

En effet, un savoir empirique n'est pas uniquement basé sur des faits mais également des idées non factuelles par l'un des trois modes du raisonnement :
  • déduction : utilisation de règles pour obtenir des conséquences qui découlent logiquement de faits ;
  • induction : généralisation de faits en une règle ;
  • et abduction : imagination de causes pouvant expliquer les faits.
Illustrons ces modes de raisonnement :
  • Je sais que les vaches ont quatre pattes, j'apprends que Pierre a acheté une vache, et j'en déduis que la vache de Pierre a quatre pattes. (déduction)
  • Je visite une exploitation agricole et j'observe 10 vaches qui ont toutes deux cornes, je me dis que vraisemblablement toutes les vaches ont deux cornes. (induction)
  • Pierre me donne une bouteille de lait, je sais que la vache de Pierre produit du lait, et j'imagine que le lait dans la bouteille provient de sa vache. (abduction)
La déduction est la méthode la plus rationnelle, mais également la plus pauvre pour l'expert car elle est incapable de produire de nouvelles connaissances, uniquement des conséquences logiques. A contrario, l'induction et l'abduction peuvent produire de nouvelles connaissances, mais ces connaissances sont potentiellement erronées.
La plupart de nos connaissances proviennent de l'un de ces deux derniers modes de raisonnement, et ils sont indispensables pour avancer : on ne peut pas compter uniquement sur les faits et sur la déduction logique pour comprendre le monde, car on ne pourrait pas obtenir de règles. C'est pourquoi il est naturel que des erreurs se cachent dans un corpus de connaissances.
Enfin, mis à part les erreurs dues aux raisonnements, il se peut aussi que ce soit dans l'observation des faits et leur interprétation que l'erreur réside. Ainsi, si quelqu'un voit une ombre passer qui pourrait être un chat, il va conclure qu'un chat vient de passer. Mais c'est peut-être un chien, ou un furet.
Naturellement, les conclusions erronées peuvent souvent être confrontées avec l'expérience et éliminées s'il s'avère qu'elles ne sont pas compatibles avec les observations. Mais une connaissance erronée peut très bien ne jamais encore avoir été en contradiction avec les faits dans l'expérience d'un professionnel car il s'est toujours trouvé dans des situations "favorables".
Par exemple, citons les physiciens du XIXe siècle pour qui il n'existait pas de limite supérieure à la vitesse d'un objet massif : ce n'est que lorsque la théorie de la relativité a permis de réconcilier l'électromagnétisme avec la mécanique qu'on a pris conscience que la vitesse de la lumière était une telle limite supérieure. Simplement, aucun mécanicien n'avait manipulé d'objet approchant la vitesse inouïe de 300 000 km/s.
On peut d'ailleurs remarquer sur cet exemple qu'une connaissance peut être vraie dans un contexte donné (les objets courants) et fausse dans un contexte différent (les particules élémentaires). La médiation technique, par nature, favorise le changement de contexte et les médiateurs techniques doivent être attentifs à ces problématiques.

Les connaissances valides dans un autre contexte

La littérature de la gestion des connaissances (KM, pour Knowledge Management) n'aborde guère cette problématique des connaissances erronées, si ce n'est à travers des techniques de correction d'erreurs sous le contrôle de l'expert. J'ignore d'ailleurs si un auteur de ce domaine s'y est intéressé au point d'écrire sur le sujet.
Vous ne serez pas étonné que, dans le cadre d'un blog sur la médiation technique, j'aille chercher des solutions toutes faites dans un domaine différent de celui de ma problématique initiale. Il existe en effet un autre domaine concerné par les connaissances : l'intelligence artificielle.
Le projet Cyc est un projet qui vise à faire raisonner les machines comme des êtres humains. L'idée est de rassembler des connaissances (une vache a quatre pattes, l'herbe est verte), et de permettre à la machine de répondre à des questions (quels animaux produisent du lait ? un loup a-t-il des cornes ?).
Comme le projet Cyc veut aborder le plus grand nombre de connaissances humaines sur des bases logiques, il faut dans une certaine mesure gérer les contradictions qui peuvent être induites par des connaissances erronées. L'idée-clé du projet pour éviter les contradictions est le principe de micro-théorie : chaque connaissance déclarée dans la base de Cyc doit faire explicitement partie d'une micro-théorie. Il peut exister des connaissances contradictoire dans Cyc, mais elles doivent nécessairement appartenir à des micro-théories disjointes.
Illustrons cette idée. Dans le contexte des romans de Harry Potter, certains hommes (les sorciers) sont capable de faire de la magie. Dans la réalité, cela n'est pas possible. Pour pouvoir raisonner sur les sorciers (Harry Potter est un sorcier, les sorciers font de la magie, donc Harry Potter fait de la magie), on définit une micro-théorie "Harry Potter", différente de la micro-théorie "vie courante". Dans la première, la connaissance "les sorciers font de la magie" sera valide, dans la seconde "aucun homme ne peut faire de la magie" sera valide.
Voilà donc une première piste pour gérer les erreurs : la micro-théorie, ou plus simplement, l'adjonction à toute connaissance du contexte d'où elle vient. On sait alors qu'une connaissance considérée hors contexte doit être manipulée avec précaution. On pourra, par exemple, considérer cette connaissance comme une hypothèse à valider, mais on ne devra pas l'appliquer dans un contexte sensible sans vérification préalable.

Les croyances

Cette réflexion sur le contexte présuppose que la connaissance est au moins valide dans un contexte donné et bien identifié. Mais il est des cas où la "connaissance" d'un expert est erronée même dans son domaine d'expertise.
Ainsi, si vous demandez à une sage-femme si la lune a une influence sur le nombre des naissances, vous avez de fortes chances d'avoir une confirmation : "il y a plus de naissances pendant la pleine lune". Pourtant, les études statistiques montrent que ce n'est pas le cas.
Notons que ce type de connaissances erronées sont avant tout des croyances qui n'ont souvent que peu d'impact opérationnel. En effet, si une connaissance erronée est très utilisée par un professionnel pendant une longue durée, le retour d'expérience devrait lui indiquer qu'il y a quelque chose qui cloche, et une remise en cause s'imposerait, finissant vraisemblablement par revenir sur cette croyance. On attend d'un expert qu'il ait une expérience suffisamment longue pour avoir pu éliminer toutes les connaissances erronées qui lui sont essentielles pour travailler.
Reste donc, me semble-t-il, trois cas :
  • soit la croyance est de peu d'utilité et est effectivement utilisée très rarement (ou, au contraire, quasi-systématiquement ; ce qui revient au même car c'est la croyance opposée qui n'est que rarement utilisée) : il convient de demander à l'expert à quelle fréquence il applique une connaissance donnée ;
  • soit la croyance est très utilisée, mais sa pertinence n'est que statistique (par exemple : ça marche dans 70% des cas) : il convient de demander à l'expert s'il estime qu'une connaissance donnée est toujours vraie ou souvent vraie ;
  • soit la croyance n'est pas utilisée en pratique même si l'expert croit qu'il l'utilise : il convient de vérifier l'utilisation d'une connaissance donnée dans la pratique, notamment par des techniques d'élicitation appropriées (voir cet article).

En résumé

Si l'on veut gérer le problème des connaissances erronées, le médiateur technique doit exiger de l'expert un certain nombre de tâches pour chaque connaissance :
  • préciser son origine (expérience, publication,...),
  • estimer sa fréquence d'application pratique (tous les jours, une fois par an, deux fois en 10 ans), 
  • estimer son taux de succès (ça marche systématiquement, ça marche plus souvent que ça ne rate),
  • et vérifier en pratique si elle est effectivement utilisée.
Bien sûr, ces vérifications lourdes et inquisitoires, désagréables pour l'expert qui est mis en doute, sont à réserver aux connaissances les plus importantes pour le client.