Confidences de Charles Dunnett
Accueil : À propos de la SSC : Histoire : Confidences de C. Dunnett | English | Grands caractères | Petits caractères
Aller au menu de la navigation.CONFIDENCES DE
Charles Dunnett, deuxième médaillé dor de la SSC
Charlie Dunnett à McMaster, mai 2002
photo par Peter Macdonald
à Mourmansk, avril 1944
en Belgique, octobre 1944
Charles W. Dunnett est originaire de Windsor, en Ontario. Né en 1921, il étudia la physique et les mathématiques à luniversité McMaster de Hamilton, où il termina son baccalauréat ès Arts en 1921. Radariste dans la marine pendant la Deuxième Guerre mondiale, il fut décoré de lOrdre de lEmpire britannique. Après la guerre, il revint au Canada et compléta une maîtrise en mathématiques à lUniversité de Toronto en 1946, avant daller étudier pendant deux ans à luniversité Columbia de New-York. En 1948-49, il enseigna au Collège maritime de létat de New-York. Il occupa ensuite un poste de biométricien aux Laboratoires des aliments et des drogues du Ministère fédéral de la Santé et du Bien-être social, à Ottawa. Après une visite dun an à luniversité Cornell en 1952-53, il fut pendant 21 ans à lemploi des Laboratoires Lederle, affiliés à lAmerican Cyanamid Company. En 1974, il fut nommé professeur de biostatistique à la Faculté des sciences de la santé de luniversité McMaster. Directeur du département de mathématiques appliquées pendant deux ans (1977-79), il fut en outre professeur titulaire au département des sciences mathématiques. Depuis un an, il est professeur émérite au département de mathématiques et de statistique, ainsi quau département dépidémiologie clinique et de biostatistique de luniversité McMaster.
Charles W. Dunnett a obtenu son doctorat en 1960, sous la direction du professeur David J. Finney de lUniversité dAberdeen. Il est fellow de lAssociation des statisticiens américains (ASA) et membre de lInstitut international de statistique. Le professeur Dunnett a été président de la SSC en 1982 et a reçu la médaille dor de la Société en 1986.
Les extraits suivants d'une conversation enregistrée le 5 juillet 1988 à l'université McMaster sont à l'origine apparus dans le vol. 3, numéro 1 de Liaison, novembre 1988.
L = Liaison, D = Dunnett
L. Pourriez-vous dabord nous parler un peu de votre service militaire, qui vous a dailleurs valu une décoration, je crois.
D. Tout de suite après avoir terminé mon baccalauréat à luniversité McMaster, je me suis enrôlé dans larmée et jai fait valoir mes connaissances en électronique pour demander à être affecté aux opérations radar. Jai alors été détaché à la marine britannique et, après avoir suivi des cours en Angleterre, jai été intégré à une équipe de recherche qui travaillait au perfectionnement de la technologie des radars pour le compte de laviation et de la marine. Cest ainsi que jai pu collaborer pendant six mois à la mise au point dun radar capable de détecter les navires et les sous-marins naviguant en surface; par la suite, je suis allé appliquer la théorie «sur le terrain», si on peut dire Dans un premier temps, jai été affecté à un escadron dentraînement où les pilotes venaient se familiariser avec cette nouvelle technologie. Ensuite, jai fait partie pendant un an et demi du premier escadron naval muni dun détecteur radar. Nous avons été en mer pendant plusieurs mois, à bord dun navire qui patrouillait lAtlantique et le corridor maritime de Mourmansk, emprunté à lépoque par beaucoup de convois militaires. Puis, à lapproche du jour «J», nous avons été muté à une base aérienne dans le sud de lAngleterre où notre mission a consisté à repérer et à attaquer les navires ennemis dans la Manche en prévision du débarquement. Après la libération du nord de lEurope, nous avons été relocalisés en Belgique, doù nous avons opéré jusquà la fin de la guerre. Et voilà toute ma carrière militaire! En tant que responsable de lentretien des radars, jai dû affronter toutes sortes de difficultés. Comme nous étions les premiers à expérimenter cette nouvelle technologie, cétait normal, vous me direz. Mon travail consistait à résoudre les difficultés techniques qui se présentaient, par moi-même autant que possible, ou alors en consultation avec les spécialistes qui étaient restés en Angleterre.
L. Etes-vous retourné à luniversité immédiatement après la guerre?
D. Oui. En principe, je devais être muté à la force du Pacifique dès la fin des hostilités en Europe. Mais comme la guerre a pris fin plus rapidement que prévu, jai décidé daller faire une maîtrise en mathématiques à lUniversité de Toronto. Cest un peu par hasard que jai pris un cours de statistique, dailleurs, mais jai été fasciné par le sujet et jai décidé que cétait fait pour moi. Colin Blyth étudiait aussi à Toronto cette année-là, et je peux dire quil a eu une influence déterminante sur mon orientation professionnelle. Après avoir fini sa maîtrise, il voulait aller à lUniversité Iowa State pour travailler avec Snedecor, Cochran et Gertrude Cox. Il ma convaincu den faire autant. Mais après avoir été admis au programme de doctorat, nous avons appris tout à coup que Cochran et Cox allaient déménager en Caroline du Nord. Pensant quil ne resterait plus personne dintéressant à Iowa State, nous avons alors changé nos plans. Cétait une fausse impression, bien entendu, mais cest quand même comme ça que Colin a décidé daller étudier en Caroline du Nord et que moi, jai abouti chez Wald et Wolfowitz, à Columbia.
Je suis resté là-bas pendant deux ans, au département de statistique mathématique. Jai fait toute ma scolarité de doctorat, mais je nai pas écrit de thèse. Après avoir suivi tous les cours et passé les examens prédoctoraux, jen ai eu marre de la théorie et jai décidé daller chercher de lexpérience pratique. Jai donc enseigné les mathématiques et la physique pendant un an au Collège Maritime de lEtat de New-York dans le Bronx, après quoi jai été engagé à titre de de biométricien par les Laboratoires des aliments et des drogues, à Ottawa.
Ça a été une expérience très enrichissante qui ma permis de me familiariser avec un tas de problèmes en statistique appliquée, en échantillonnage plus particulièrement. Jai eu loccasion de faire quelques voyages à Halifax où on procédait à linspection des cargaisons de produits alimentaires en provenance de létranger. Je travaillais avec le Dr J. W. Hopkins, un biométricien du Conseil national de la recherche. Il avait mis au point une théorie assez intéressante pour léchantillonnage de ce genre de produits. Pour des raisons pratiques, il fallait recourir à des techniques déchantillonnage à deux degrés, car les aliments -des noix, des figues et des dates surtout- étaient emballés dans des boîtes ou des sacs. Ces emballages représentaient les unités primaires parmi lesquelles on tirait un échantillon; dans chaque emballage sélectionné, on prélevait ensuite des unités secondaires aux fins danalyse. Un produit était déclaré non conforme sil était moisi ou infesté. Le problème était de déterminer la proportion de produits non conformes dans la cargaison. On supposait que le nombre de produits non conformes dans chaque emballage était aléatoire et que le taux déchantillonnage était négligeable, de sorte que le nombre de produits non conformes dans un emballage donné pouvait être représenté par une loi binomiale. Mais, ce qui était intéressant, cétait que le paramètre de cette loi binomiale semblait varier dun emballage à lautre; en tout cas, cest ce que les données indiquaient. Le Dr Hopkins avait ainsi été amené à proposer un modèle dans lequel le paramètre de la loi binomiale variait suivant une loi bêta, et donc à étudier ce quil avait appelé la loi hypergéométrique négative et quon appelle aujourdhui la loi bêta-binomiale.
L. Lutilisation de cette loi devait exiger beaucoup de calculs, non?
D. Lestimation des paramètres de la loi hypergéométrique négative nécessitait en effet des calculs assez complexes. Nous nous sommes servis de la méthode des moments pour estimer les paramètres et pour proposer une procédure de réception par échantillonnage (1).
Nous nous intéressions aussi beaucoup à des problèmes reliés aux essais biologiques. Aux laboratoires, on faisait régulièrement des expériences dans le but de comparer lefficacité des médicaments entre eux. Pour analyser les résultats, on faisait appel à lanalyse probit et, là encore, les calculs étaient passablement fastidieux. Pour chaque journée passée au laboratoire à effectuer des expériences, il fallait généralement que le chercheur en passe une autre devant sa machine à calculer pour déterminer lefficacité du médicament.
L. À quel moment vous êtes-vous impliqué dans la recherche universitaire?
D. À la faveur dun congé de perfectionnement, jai visité luniversité Cornell, où jai travaillé pendant un an avec Bob Bechhofer et Milton Sobel, qui avaient étudié à luniversité Columbia en même temps que moi. Bob Bechhofer sintéressait aux procédures de sélection dans le cadre dune subvention de recherche. Mon séjour là-bas a été très fructueux. Officiellement, nous étions rattachés au département de mathématiques mais, en fait, nos bureaux étaient situés au pavillon Warren Hall, à la Faculté dagriculture. Walter Federer et Doug Robson étaient logés à la même enseigne et je les ai vus sûrement aussi souvent que Jack Kiefer et les autres professeurs du département de mathématiques.
L. Sur quel genre de procédures de sélection travailliez-vous, au juste?
D. Le plus souvent, lobjectif était de trouver le meilleur traitement: identifier la population dont la moyenne est la plus grande, par exemple. Quand on veut comparer plusieurs traitements, on pense automatiquement à lanalyse de la variance et à tester légalité des moyennes par un test de Fisher, ou quelque chose du genre. Mais comme, dans bien des cas, le véritable problème est de choisir le meilleur traitement, le fait de rejeter lhypothèse nulle ne nous apprend pas grand chose, somme toute. Nos travaux partaient de cette observation. Nous voulions trouver une procédure qui ait une probabilité donnée de choisir le meilleur traitement possible. Bien sûr, cette probabilité dépend de la configuration réelle des moyennes des populations. Si elles sont très proches les unes des autres, par exemple, on ne peut pas être très confiant de choisir la plus grande. Mais si les moyennes des populations sont si proches les unes des autres, il nest peut-être pas si crucial de choisir la plus grande non plus! Le choix est important dans la mesure où le meilleur traitement est supérieur aux autres par une marge donnée. On commence donc par spécifier la marge quil est important de pouvoir détecter et on choisit la taille de léchantillon en conséquence. Cest Bob Bechhofer qui a formulé le problème de cette manière et qui a proposé la solution dans le cas de populations normales de variances connues et égales. Son article de 1954, publié dans The Annals of Mathematical Statistics (2), a été le premier à introduire cette idée de « zone dindifférence ».
Cest en voulant généraliser les résultats de Bob au cas où la variance est inconnue que nous avons découvert, ou plus exactement formulé, la loi de Student à plusieurs dimensions. Cest probablement le résultat théorique le plus important que nous ayions trouvé durant lannée que jai passée à Cornell. Ça a donné lieu à deux publications dans Biometrika (3), (4). Nous y avons défini la loi de Student multidimensionnelle, mais nous nous sommes surtout concentrés sur le cas à deux dimensions, parce que nous étions restreints dans nos calculs par la puissance des machines à calculer. À lépoque, il nous semblait que cétait déjà pas si mal de passer de une à deux dimensions!
L. Ce serait donc votre séjour à Cornell qui vous aurait incité à quitter pour de bon les Laboratoires des aliments et des drogues?
D. Jai décidé démigrer aux États-Unis, simplement parce quil y avait beaucoup plus de statisticiens là-bas. On ma offert un poste aux Laboratoires Lederle, une compagnie pharmaceutique de Pearl River, dans létat de New-York. Il y avait là déjà un petit groupe de statisticiens qui travaillaient sous la direction du Dr Frank Wilcoxon. Ce qui est curieux, cest que dès mon arrivée à Pearl River, jai découvert que la loi de Student à plusieurs dimensions permettait de comparer plusieurs traitements à un témoin; cette application sest même avérée plus importante encore que celle de la sélection, car à cette époque, les gens commençaient à peine à utiliser les premières méthodes de comparaisons multiples. Même sils navaient pas encore été publiés, les travaux de Scheffé (5) étaient déjà assez connus. Les gens connaissaient aussi les travaux de Tukey et de Duncan sur le sujet. Le jour de mon arrivée aux Laboratoires Lederle, le Dr Wilcoxon me parla de quelques-uns des problèmes auxquels son équipe sintéressait et il me mentionna, entre autres, le fait que le problème de comparer plusieurs traitements à un échantillon témoin navait été traité ni par Tukey, ni par Scheffé. Il attira aussi mon attention sur un article plus ancien de Roessler qui traitait du sujet dans le Journal of Horticultural Science. La méthode proposée par Roessler nétait pas très rigoureuse; elle ne tenait pas compte de la présence de la corrélation qui existe entre les traitements et le témoin lorsque ce dernier est utilisé pour chacune des comparaisons. En étudiant sa méthode, je me suis aperçu quen tenant compte des corrélations, on retombait sur la loi de Student à plusieurs dimensions que nous avions définie lannée précédente à Cornell. Si les variances sont homogènes et si les tailles des échantillons sont les mêmes pour les traitements et le témoin, les corrélations sont toutes égales à 1/2, à cause de la présence du témoin dans toutes les comparaisons. Le même phénomène se produit dans le problème de sélection, vu que toutes les comparaisons font intervenir le meilleur traitement.
L. Vos travaux sur le sujet sont encore abondamment cités aujourdhui, notamment vos articles de 1955 et de 1966, dans lesquels vous donnez des valeurs critiques pour la différence maximale entre les moyennes des traitements et de léchantillon-témoin (6, paru dans JASA), et vous généralisez et raffinez la méthode (7, paru dans Biometrics).
D. Cest vrai quils ont été cités souvent.
Mais quand je travaillais aux Laboratoires Lederle, jai aussi participé à la recherche de nouveaux médicaments. Je me suis particulièrement intéressé au problème important de déterminer quels sont les produits chimiques qui ont une certaine activité biologique. Les produits chimiques, ce nest pas ça qui manque dans les compagnies pharmaceutiques, vous savez; elles en mettent au point tous les jours dans leurs laboratoires. La question est de savoir si, parmi tous ces produits, il y en a qui ont susceptibles de contribuer au traitement dune maladie. On procède généralement comme suit: dans un premier temps, on teste un grand nombre de ces produits (20 ou 30) sur des animaux; puis, après avoir choisi les plus prometteurs et rejeté les moins intéressants, on effectue des tests supplémentaires avec les produits restants. Comme javais suivi un cours danalyse séquentielle avec Abraham Wald à luniversité Columbia, jai pensé me servir de ces méthodes. Typiquement, une expérience pouvait durer une semaine ou deux. On traitait un animal avec le produit en question et, après avoir observé les résultats, le chercheur décidait si ça valait la peine de répéter lexpérience ou non. Avant den arriver à une conclusion, on pouvait répéter lexpérience plusieurs fois. Jai travaillé sur un certain nombre dapplications de ce genre aux Laboratoires Lederle; jai mis au point des procédures séquentielles qui permettaient de décider sil fallait accepter un produit, le rejeter ou le tester de nouveau.
En 1957, jai appris que le Dr O.L. Davies, de la compagnie pharmaceutique I.C.I., devait présenter ses travaux (8) sur la recherche de médicaments au congrès de lInstitut international de statistique, à Stockholm. Les patrons des Laboratoires Lederle ont jugé que le déplacement en vaudrait la peine, et ils mont permis daller en Suède pour assister au congrès. Une fois sur place, jai eu la chance de rencontrer le professeur D.J. Finney, qui nous a parlé de problèmes similaires quil avait rencontrés en agriculture en travaillant sur la sélection de nouvelles variétés de plantes (9). Il sen est suivi un échange de correspondance entre nous, et cest comme ça que jai fini par aller à Aberdeen, lannée suivante, avec toute ma famille. La société Lederle avait consenti à maccorder un congé de perfectionnement de deux ans en vue de compléter un doctorat sous la direction du professeur Finney.
L. Décrivez-nous un peu latmosphère qui régnait à Aberdeen.
D. Dans ce temps-là, le professeur Finney était directeur du département de statistique, mais il était également responsable du groupe de statistique au Conseil de recherches en agriculture. En théorie, il y avait donc deux groupes, mais en pratique ils étaient presque confondus: les professeurs du département travaillaient sur des problèmes de recherche en agriculture et les statisticiens du Conseil donnaient aussi des cours au département de statistique. Michael Sampford, Bill Brass et Peter Fisk étaient associés au département, et Richard Cormack y terminait son doctorat. Personnellement, jai beaucoup travaillé en collaboration avec Robert Curnow, un autre doctorant dont la thèse portait sur des problèmes de sélection de plantes; dun point de vue théorique, nos problèmes se ressemblaient.
L. Larticle (10) que vous avez présenté à la Royal Statistical Society était-il basé sur votre thèse?
D. En partie seulement. Au départ, ma thèse devait porter uniquement sur la recherche de médicaments, mais jai aussi continué à étudier les problèmes de sélection. Larticle présenté à la Royal Statistical Society concernait justement un problème de sélection. Il sagissait dun modèle différent de celui sur lequel nous avions travaillé à Cornell. En fait, il sagissait dune sorte de modèle bayésien où lon supposait connue de linformation a priori sur les moyennes des populations. Ceci a fait quen bout de ligne, ma thèse a été divisée en deux parties, le premier volet étant consacré à la recherche de médicaments et lautre traitant de problèmes de sélection. La première partie a dailleurs été publiée dans les actes dun congrès de statistique appliquée à la pharmacologie (11) tenu en Hollande, à lUniversité de Leiden.
L. Là encore, vous avez sûrement dû vous frotter à des problèmes numériques considérables. En vous écoutant parler, je réalise peu à peu que ce genre de problème vous passionne!
D. Je dois lavouer, jai un faible pour le calcul. Les Laboratoires Lederle avaient acheté leur premier ordinateur en 1957. Cétait un modèle LGP-30 de Royal McBee avec une mémoire à tambour magnétique de 4000 mots, je crois. Éventuellement, nous avons augmenté sa capacité à 8000 mots Tous les calculs devaient être programmés en langage machine mais, en fait, ce nétait pas si compliqué que ça. Il y avait en tout seize opérations possibles: ajouter, soustraire, mettre en mémoire, et ainsi de suite. Chaque opération était suivie dune adresse à quatre chiffres pour indiquer lendroit où le nombre était stocké. Les programmes et les données devaient être perforés sur un long rouleau de papier-ruban. Cétait plutôt marrant, quand on y pense, mais il fallait surtout faire gaffe que la bande de papier ne semmêle pas! Comme nos bureaux étaient situés au sixième étage du plus grand immeuble de la compagnie, nous les balancions souvent par la fenêtre pour les démêler. Six étages, ça déroule longtemps!
L. Cétait le bon vieux temps!
D. On narrête pas le progrès!
L. Plus récemment, jai vu que vous avez publié dans JASA (12, 13) deux articles fort intéressants sur les comparaisons multiples pairées.
D. Le but principal de ces articles était de montrer, au moyen de simulations sur ordinateur, que la méthode élaborée par Tukey au début des années cinquante pour comparer des traitements pairés, pouvait être étendue au cas non balancé. Cest Tukey lui-même qui en avait fait la suggestion plusieurs années auparavant, mais sans fournir de justification rigoureuse. Dans la méthode de Tukey pour des échantillons balancés, on utilise le seuil alpha de létendue studentisée multiplié par s/sqrt(n) comme valeur critique pour comparer deux traitements quelconques dans le groupe. Si les traitements nont pas tous le même nombre dobservations, on peut par exemple remplacer s/sqrt(n) par s*sqrt(1/n1 + 1/n2)/sqrt(2), lécart-type de la différence entre deux moyennes, divisé par sqrt(2) pour les rendre comparables. Bien entendu, cétait fondé sur lintuition tout ça; on ne pouvait pas être certain que le niveau de confiance était 1-a.
Il y avait un certain nombre dautres méthodes qui justifiaient mathématiquement laccroissement du niveau de confiance lorsque le nombre dobservations différait entre les traitements. Ce que mes simulations sur ordinateur ont démontré, cest que lintervalle de confiance basé sur la généralisation intuitive de létendue studentisée avait aussi cette propriété, même sil était plus étroit. Depuis lors, ce résultat a été établi de façon rigoureuse par Hayter (14) dans le cas où les variances sont égales. Mais dans le cas où des variances inégales, je reste persuadé que la seule façon possible de justifier des méthodes comme celle-là est de recourir à des simulations. Un autre article (15) traite aussi de méthodes robustes pour les comparaisons multiples.
L. Est-ce le fait quil y a une Faculté de médecine à McMaster qui vous a incité à revenir à Hamilton?
D. Ça a été un facteur important. Ce sont mes travaux en pharmacologie qui mont amené à mintéresser aux applications médicales.
L. Ce sont dailleurs des applications médicales, je crois, qui ont motivé vos travaux sur les tests déquivalence et notamment votre article conjoint avec Gent (16), celui qui a paru dans Biometrics en 1977.
D. En effet. La motivation venait du fait que les études cliniques ont parfois pour but de démontrer léquivalence de certains traitements, et non le contraire. Cest Mike Gent qui a réalisé les implications que cette pratique devait avoir sur la philosophie habituelle qui entoure les tests dhypothèse. Il sest publié dautres articles sur le sujet depuis, mais je crois que le nôtre a été lun des premiers.
L. Sur quoi travaillez-vous actuellement?
D. Je mintéresse à nouveau aux problèmes reliés à la recherche de médicaments. Jai quelques idées que jaimerais explorer dans ce sens au cours des prochains mois. Je continue aussi de travailler sur les comparaisons multiples; un peu plus tard ce mois-ci, je dois dailleurs aller à un congrès de biométrie en Belgique pour présenter un article écrit en collaboration avec Bob Bechhofer, de Cornell, et Ajit Tamhane, de luniversité Northwestern. Ce sont des travaux qui portent sur une méthode permettant deffectuer des comparaisons multiples entre des traitements et un échantillon témoin. Nous avons cherché, en particulier, à calculer des intervalles de confiance conjoints pour chaque paire traitement/témoin. Mais comme ce ne sont pas tous les traitements qui ont des moyennes assez élevées pour être intéressants, on suggère de procéder à une expérience préliminaire pour se débarrasser des traitements les plus faibles, de sorte quon puisse ensuite se concentrer sur les autres. Nous avons essayé de voir dans quelles situations il serait plus efficace dutiliser les résultats des deux phases de lexpérience pour estimer les intervalles de confiance conjoints, plutôt que ceux de la deuxième phase seulement.
L. Vous entretenez aussi des liens privilégiés avec lUniversité de Swansea, au pays de Galles, nest-ce pas?
D. Je ny suis pas officiellement affilié pour le moment, mais jy suis allé deux fois à titre de professeur invité durant mes années sabbatiques. Ma femme et moi affectionnons particulièrement les environs de Swansea et nous y allons souvent. Qui plus est, le département de statistique et des sciences de la gestion de lUniversité de Swansea a toujours été très généreux à mon endroit. Lorsque jy vais, ils me prêtent toujours un bureau et me permettent dutiliser leur ordinateur.
L. Tous nos remerciements, monsieur Dunnett.
Références
1. Dunnett, C.W. and Hopkins, J.W. (1951). Symposium on Bulk Sampling, Spec. Tech. Pub. No. 114, Amer. Soc. for Testing Materials, 13-18.
2. Bechhofer, R.E. (1954). Ann. Math. Statist., 25, 16-39.
3. Bechhofer, R.E., Dunnett, C.W. and Sobel, M. (1954). Biometrika, 41, 170-176.
4. Dunnett, C.W. and Sobel, M. (1954). Biometrika, 41, 153-159.
5. Scheffé, H. (1953). Biometrika, 40, 87-104.
6. Dunnett, C.W. (1955). J. Amer. Statist. Assoc., 50, 1096-1121.
7. Dunnett, C.W. (1964). Biometrics, 20, 482-491.
8. Davies, O.L.(1958). Bull. I.S.I., 36, 226-241.
9. Finney, D.J. (1958). Bull. I.S.I., 36, 242-268.
10. Dunnett, C.W. (1960). J. Roy. Statist. Soc. B , 22, 1-40.
11. Dunnett, C.W. (1961). Quantitative Methods in Pharmacology (H. de Jonge, ed.), NorthHolland, 212-231.
12. Dunnett, C.W. (1980). J. Amer. Statist. Assoc., 75, 789-795.
13. Dunnett, C.W. (1980). J. Amer. Statist. Assoc., 75, 796-800.
14. Hayter, A.J. (1984). Ann. Statist., 12, 61-75.
15. Dunnett, C.W. (1982). Comm. Statist. A, 11, 2611-2629.
16. Dunnett, C.W. and Gent, M. (1977). Biometrics, 33, 593-602.
© 2001-2003 Société statistique du Canada | Contactez la SSC | Contactez le webmestre | Créé par Pip Media Group