jeudi 21 avril 2011

Expérimenter efficacement : les plans d'experience

On ne peut se passer de méthode pour se mettre en quête de la vérité des choses. (René Descartes)
Dans bon nombre de domaines techniques, les ingénieurs et techniciens améliorent leurs produits ou leurs procédés par l'utilisation d'essais.
Mais une démarche d'expérimentation massive et mal structurée est à la fois coûteuse (les essais coûtent cher car du matériel peut être perdu, ou même une partie de la production) et difficile à interpréter. Autrement dit : sans méthode, entreprendre des essais est inefficace.

Les plans d'expérience et la méthode Tagushi

Commençons par une tentative de définition. Un plan d'expérience est un ensemble d'essais à réaliser qui a été déterminé méthodiquement afin d'aboutir à des résultats interprétables. Un essai se caractérisant essentiellement par le choix de la valeur de certains paramètres expérimentaux, il s'agit donc de déterminer le nombre d'essais et la valeur des paramètres déterminant chaque essai d'une manière intelligente.
Dans certains cas, un tel plan est facile à concevoir. C'est par exemple le cas lorsque le nombre de combinaisons possibles des valeurs des paramètres est réduit : il suffit d'essayer toutes les combinaisons. Un tel plan est appelé un plan factoriel complet.
Ainsi, si l'on cherche à déterminer quelle est la meilleure combinaison des valeurs de deux paramètres A et B qui peuvent prendre respectivement 3 et 5 valeurs différentes, on a 3x5 = 15 combinaisons possibles et donc 15 essais à planifier.
La tâche se complique si ce nombre explose : ainsi, si l'on a 7 paramètres qui peuvent prendre 4 valeurs différentes, le nombre d'essais à effectuer est de 4^7 = 16 384 : c'est généralement irréaliste, sauf dans certains cas particuliers ou l'on peut réaliser ces essais en parallèle et à bas coût, comme pour les puces à ADN en biologie.

C'est aussi le cas lorsque les essais sont très coûteux ou très longs à réaliser : même une dizaine d'essais peut être excessif.
Lorsqu'on a affaire à un paramètre continu, comme la valeur d'une résistance électrique, d'une pression  ou encore d'une concentration chimique, le nombre d'essais à réaliser est en théorie infini. Il est alors nécessaire de discrétiser le paramètre, c'est-à-dire choisir un certain nombre de valeurs du paramètre, qu'on considère représentatives de la diversité : il en faut donc un nombre minimal. Par contre, ce nombre ne doit pas être trop important car le nombre d'essai y est directement lié, et ce d'autant plus que le nombre de paramètres continus est grand. Choisir la bonne discrétisation est hasardeux si l'on n'a aucune idée de la sensibilité de l'objet d'expérimentation à ce paramètre. Mais souvent, après avoir réalisé quelques essais où l'on ne change que la valeur du seul paramètre en question et observé le résultat, on peut considérer que l'influence d'un paramètre donné est essentiellement linéaire (deux valeurs suffisent) ou quadratique (trois valeurs suffisent).
Plus généralement, sans aucune connaissance sur le comportement de l'objet d'expérimentation, il est difficile de réduire le nombre d'essais. C'est là qu'entre en scène la méthode Tagushi.
L'idée générale de cette méthode est de réduire astucieusement le nombre d'essais à réaliser en utilisant des hypothèses génériques d'indépendance des variables entre elles. La méthode permet aussi de vérifier si ces hypothèses d'indépendance sont valables ; si ce n'est pas le cas pour certaines d'entre elles, elle permet de compléter a minima le plan d'expérience en tirant profit des essais déjà réalisés.
Un plan d'expérience obtenu par la méthode Tagushi est appelé un plan factoriel fractionnaire. Par le jeu des hypothèses d'indépendance, on peut par exemple obtenir théoriquement un plan fractionnaire minimal, adapté à nos 7 variables à 4 valeurs possibles et qui comporte 22 essais, à comparer aux 16 384 essais du plan complet.
L'une des notions essentielles de la méthode est celle de degré de liberté (en abrégé : ddl). On suppose que le résultat Y d'un essai décrit par les paramètres indépendants X1, X2,... Xn s'écrit Y = moyenne + effet de X1 + effet de X2 + ... + effet de Xn. Une telle supposition constitue un modèle des essais. Le nombre de ddl des essais est le nombre de valeurs possibles de Y.
Outre la moyenne, qui correspond à un degré de liberté, chaque paramètre indépendant pouvant prendre N valeurs différentes correspond à N-1 degrés de liberté supplémentaires. Ainsi, pour 7 paramètres indépendants à 4 valeurs, on a donc 1 ddl pour la moyenne et 7 fois 3 ddl par paramètres, soit 22 ddl en tout comme annoncé précédemment.
Si certains paramètres ne sont pas indépendants mais qu'il existe des corrélations (typiquement, Y dépend de A et B mais aussi du produit AB), on peut considérer les corrélations comme des paramètres indépendants supplémentaires. Ainsi, si deux paramètres A et B sont corrélés, on considérera comme un paramètre indépendant le produit AB. Dans ce cas, c'est le produit des ddl de chaque paramètre qui détermine le ddl du produit.

Mais calculer le nombre d'essais minimal à réaliser ne suffit pas, il faut encore choisir le plan d'expérience qui permet effectivement de passer en revue tous les ddl prévus par le modèle. De manière naïve, dans notre exemple à 7 variables, on pourrait par exemple faire 22 essais en ne modifiant que les trois premiers paramètres (4x4x4 = 64 valeurs possibles), mais ces essais ne nous diraient rien sur l'influence des quatre derniers paramètres. Un bon plan d'expérience doit donc passer en revue  les ddl en choisissant astucieusement un ensemble d'essais.
La théorie montre qu'un certain nombre de conditions sont nécessaires à respecter, notamment lorsqu'on a des corrélations. Toutefois, obtenir un bon plan factoriel fractionnaire à partir de ces conditions n'est pas très facile. C'est pourquoi la méthode Tagushi recense un certain nombre de plans d'expériences parmi les plus courants, et décrit une méthode permettant de choisir l'un de ces plans.


De l'agronomie à l'industrie


Si le principe des plans factoriels complets est sans doute connu depuis que l'on pratique la science expérimentale, l'idée des plans factoriels fractionnaires semble apparaître avec Ronald Fisher, statisticien qui s'est intéressé aux techniques d'expérimentation lorsqu'il travaillait dans un centre de recherche agronomique britannique, la Rothamsted Experimental Station.
En voulant augmenter les rendements agricoles de diverses plantes sur différents sols en combinant des engrais et des méthodes de culture, il s'aperçoit vite que le nombre d'essais nécessaire à l'étude systématique de toutes ces combinaisons est astronomique et tout simplement prohibitif. Il parvient alors à réduire le nombre de configurations expérimentales à l'aide de modèles statistiques rigoureux.
Mais la démarche théorique est compliquée, difficile d'accès aux non-spécialistes, et peine à s'imposer dans l'industrie. C'est Genichi Tagushi qui va permettre aux plans d'expériences de s'introduire dans les industries japonaises dans les années 1960, en proposant des tables toutes faites de plans d'expérience et une méthode de choix de ces tables. Cette méthode pragmatique permet enfin à un non-spécialiste de réaliser des plans d'expériences efficaces. La méthode se répandra par la suite avec succès dans le monde entier.
Ainsi, les plans d'expérience sont une technique issue d'un secteur d'activité, l'agronomie, et qui a pu s'appliquer à plusieurs secteurs d'activité industriels. Genichi Tagushi a été d'une certaine manière un médiateur technique avant l'heure, capable de traduire une technique statistique très formelle en méthode pragmatique.