Statistical Society of Canada / Société statistique du Canada

Confidences de Jim Zidek

Accueil : À propos de la SSC : Histoire : Confidences de Jim Zidek | English | Grands caractères | Petits caractères

Aller au menu de la navigation.

CONFIDENCES DE

Jim Zidek

Note du rédacteur : Liaison est heureux de reprendre la publication des entrevues avec certains de nos piliers en statistique. Jim Zidek a aimablement accepté de nous donner notre première entrevue, laquelle a été planifiée et réalisée par Nancy Heckman. Jim et elle se sont assis ensemble et ont bavardé pendant quelques heures à Vancouver au cours du printemps dernier. Nous sommes reconnaissants envers Nancy et Jim d'avoir rendu cette entrevue possible.

Jim Zidek - photo par Peter Macdonald

Jim Zidek
photo par Peter Macdonald

Photo de Jim Zidek.

Jim, au temps où il faisait partie d'une ligue de hockey Bantam à Red Deer, avant d'évoluer dans une équipe semi-professionnelle à Didsbury (Alberta).

Photo de Jim Zidek.

En 1974, Jim a siégé au comité des arrangements locaux pour le Congrès international des mathématiciens, qui s'est tenu à UBC.

Photo de Jim Zidek.

Jim Zidek, lors d'une réception à la fin de son deuxième mandat en tant que directeur du Département de statistique à UBC.

Jim Zidek est professeur titulaire au Département de statistique à l'Université de la Colombie-Britannique (UBC), département qu'il a aidé à mettre sur pied dès 1983. Très actif en recherche, il s'est intéressé entre autres aux fondements de la théorie de la décision, à l'analyse bayésienne multipartite et à la mésométrie. Il est membre de l'Institut international de statistique et membre d'honneur («fellow») de l'Association des statisticiens américains (ASA) et de l'Institut de statistique mathématique. Il a reçu de nombreuses distinctions, dont le Prix pour services insignes du neuvième symposium Eugene-Lukacs, la Médaille d'or de la Société statistique du Canada (SSC), la Médaille du mérite du Groupe de statistique environnementale de l'ASA et le Prix de recherche Izaak-Walton-Killam. Il a aussi servi la collectivité de maintes façons, notamment en tant que président de la SSC, président du groupe des sciences mathématiques pour le CRSNG, membre de nombreux comités de rédaction, et encore aujourd'hui à titre de conseiller à la rédaction du CRC.

Jim est né à Acme (Alberta) et a habité dans plusieurs petites localités de la province pendant son enfance. Le directeur de l'école secondaire qu'il a fréquentée l'ayant encouragé à faire des études universitaires en mathématiques, Jim a étudié à l'Université de l'Alberta, où il a complété son baccalauréat en 1961 et sa maîtrise en 1963. I-l a ensuite été admis à Stanford, où il a obtenu son doctorat en 1967. Il a été affilié à l'Université de la Colombie-Britannique (UBC) pendant toute sa carrière; il a habité Vancouver pendant toutes ces années, sauf pendant ses sabbatiques et l'année où l'Université de Washington est passée bien près de le convaincre de se joindre de façon permanente à son nouveau Département de statistique.

Jim, quand as-tu commencé à t'intéresser à la statistique ?

Quand j'étais étudiant de premier cycle à l'Université de l'Alberta, j'ai eu un jour une dispute assez sérieuse avec mon ami Glen. Il m'avait expliqué ce que c'était qu'un intervalle de confiance et j'avais trouvé le concept plutôt absurde. Je ne comprenais pas ce dont il voulait parler et nous avons argumenté sur le sujet pendant un bon bout de temps. C'est ce qui m'a décidé à suivre des cours de statistique: je voulais comprendre de quoi il retournait. Je n'ai pas eu de bonnes notes la première année, mais j'ai décidé de persévérer, même si je trouvais que le sujet n'était pas commode.

Et en y repensant aujourd'hui, es-tu capable de dire ce qui te causait tant de problèmes?

J'avais beaucoup de mal avec les questions conceptuelles. Par exemple, un de mes professeurs, Ernest Keeping, nous avait demandé un jour, dans un examen, quelle était la probabilité d'obtenir un as si on battait un jeu de cartes et qu'on en choisissait une au hasard. Au moment où je suivais son cours, j'avais finalement assimilé le mantra des intervalles de confiance selon lequel on ne doit jamais dire qu'il y a une probabilité de 0,95 que µ se situe entre un et sept, mettons, parce que m est dans l'intervalle ou bien il n'y est pas. Autrement dit, la probabilité est zéro ou un, sauf qu'on ne sait pas laquelle est la bonne. Alors j'ai voulu appliquer ce raisonnement pour déterminer la probabilité que la carte placée sur la table soit un as ou non. Je me suis dit qu'après tout, il n'y avait rien d'aléatoire dans cette carte... J'ai donc essayé d'argumenter que la probabilité était zéro ou un. Évidemment, ma réponse m'a valu un beau zéro !

En fin de compte, tu en as quand même compris assez pour poursuivre tes études et te rendre jusqu'à Stanford. Avec qui as-tu travaillé là-bas?

Avec Charles Stein. J'ai suivi un cours qu'il donnait sur la théorie de la décision. Dans ses cours, il posait toutes sortes de questions sans réponses, des questions qui reflétaient ses intuitions, des idées qu'il avait et des approximations grossières qu'il nous lançait au tableau et qui étaient loin d'être rigoureuses. Tout cela m'a emballé, ainsi que la personnalité même de Charles. C'était une personne impressionnante à bien des égards.

J'ai également travaillé pendant une année avec Herman Rubin - une expérience tout autre... Herman avait l'esprit très vif, un QI énorme et il résolvait les problèmes en un clin d'æil. Charles, lui, avait une autre sorte d'intelligence. Ce n'est pas le genre de gars qui jette son dévolu sur des résultats analytiques; il procède plutôt de façon heuristique et intuitive. J'ai beaucoup appris de Herman, beaucoup de trucs techniques : les applications de fonctions spéciales, les méthodes asymptotiques, et ainsi de suite. C'était vraiment très enrichissant de travailler avec les deux en même temps.

Quelles sortes d'articles as-tu tirés de ta thèse?

J'en ai publié un qui portait sur les quantiles extrêmes de la normale; j'y présentais une solution incomplète à un problème que Charles m'avait posé [1]. En 1971, j'ai publié une solution complète [2]. C'était un problème assez curieux parce que Stein avait démontré que si on estime la variance d'une distribution normale de moyenne inconnue, l'estimateur habituel n'est pas admissible. À ce moment-là, l'admissibilité de la moyenne expérimentale était connue depuis longtemps, bien sûr. La question des quantiles prenait alors une signification particulière, parce qu'un quantile, au fond, c'est m plus une constante fois s. Alors, si on prend une combinaison linéaire des deux estimateurs, est-ce qu'on obtient un estimateur admissible ou pas?

C'est aussi dans ce temps-là que j'ai commencé à m'intéresser à la théorie des groupes et à l'équivariance, ce qui m'a mené à l'article sur la mesure de Haar [3], qui reprenait d'un point de vue bayésien ce que Jack Kiefer avait fait beaucoup plus tôt sur les résultats de minimaxité. Dans les années 50, Kiefer avait démontré que quelque chose qui était minimax dans la classe des estimateurs équivariants était minimax tout court sous certaines conditions. J'ai montré essentiellement la même chose pour les estimateurs de Bayes.

À part ça, j'ai trouvé une condition suffisante d'admissibilité [4], inspirée par les travaux de Stein sur le théorème de la limite centrale. En fait, j'ai utilisé le même genre d'argument que lui.

Quelles sont les personnes ou les circonstances qui t'ont amené à privilégier l'approche bayésienne?

J'ai passé mon premier congé sabbatique à University College, à Londres, vers 1970. Je m'étais dit à l'époque que ce serait intéressant d'aller là-bas et d'acquérir de nouvelles connaissances, une perspective différente. Dennis Lindley était directeur du département à ce moment-là et Phil Dawid et Mervin Stone y travaillaient. Me voici donc, un fréquentiste qui se jette innocemment dans la gueule du loup - ces trois gars-là et d'autres encore m'ont aidé à voir la statistique d'une façon différente. Ça été une expérience formidable.

Ça a commencé tout bonnement pendant nos conversations à l'heure du repas - à un moment donné, quelqu'un m'avait demandé, par exemple, quel était l'intérêt de l'erreur quadratique moyenne. Quelle question idiote, que je me suis dit. Ça vous renseigne sur l'erreur quadratique que vous feriez en moyenne si l'expérience était répétée un grand nombre de fois. Mais alors on m'avait répondu : oui, mais qu'est-ce que ça donne de calculer ça si on fait l'expérience une seule fois de toute façon? J'étais souvent assez troublé par ces questions en apparence stupides, mais à la fin, j'ai compris qu'elles étaient en fait très sophistiquées. À la fin de mon séjour à Londres, je commencais à avoir une bonne idée des nombreuses difficultés liées au point de vue fréquentiste et je comprenais mieux l'approche bayésienne.

Bien sûr, tout le monde a une idée des rudiments de la théorie bayésienne - les gens comprennent bien, je pense, comment on passe d'une loi a priori a une loi a posteriori et ainsi de suite. Ça, c'est la base, mais il faut arriver à un niveau de compréhension plus élevé avant de pouvoir vraiment saisir les implications que ça peut avoir en statistique. Tout le monde ne va pas adopter le paradigme bayésien pour autant, mais ça aide à se poser les bonnes questions. Par exemple, c'est quoi, une probabilité? Est-ce que ça représente quelque chose de concret, dans un certain sens? - Ça a été une année vraiment stimulante au plan intellectuel, je dois dire. Et qui a conduit à mes travaux avec Phil et Mervin sur le paradoxe de la marginalisation, que nous avons présentés à l'occasion d'un débat public et qui ont été publiés avec commentaires [5]. Nous avons eu vraiment beaucoup de plaisir à travailler ensemble sur ce projet.

Est-ce que tu te considères comme un bayésien?

Je ne suis pas complètement sûr de savoir ce que ça veut dire. D'après moi, il n'y a pas vraiment d'autre fondement satisfaisant sur lequel construire une théorie statistique. Dans ce sens-là, j'imagine que oui, je suis un bayésien. Cela dit, je pense que bien des difficultés surgissent lorsqu'on cherche à construire sur de telles fondations. Une chose que j'ai vite apprise, en tout cas, c'est qu'une loi conjointe pour les paramètres et les variables aléatoires constitue vraiment un outil puissant de réflexion. J'ai trouvé ça vraiment pratique, même pour des problèmes de consultation, notamment dans des situations extrêmement complexes. C'est un cadre d'analyse extraordinaire, qui m'aide à organiser ma pensée.

L'approche bayésienne s'appuie sur des a priori qui ne sont pas toujours faciles à préciser. L'analyse bayésienne du comportement de groupe traite entre autres de ce problème-là, non? C'est quoi au juste, cette théorie?

Il s'agit d'un sujet très peu développé sur lequel j'ai d'abord travaillé avec Sam Weerahandi ([6], [7]). Le sujet est très important parce de nos jours, on demande souvent à des groupes d'experts de prendre ensemble des décisions. D'un point de vue normatif, on peut considérer chacun de ces experts comme un bayésien ou du moins comme une personne suffisamment rationnelle pour se comporter comme un bayésien. La question se pose alors de savoir comment les membres du groupe devraient s'y prendre, en principe, pour en arriver à une bonne décision. Du point de vue opérationnel, il y a là une question bien concrète et d'une importance capitale. J'ai travaillé avec Christian Genest [8] sur la synthèse d'opinions exprimées sous forme de lois de probabilité a priori. Nous avons approché le problème de toutes sortes de manières et à la fin, tout nous a portés à croire que la meilleure façon de s'y prendre, c'est de prendre une moyenne géométrique des densités a priori.

Au plan conceptuel, Sam et moi nous sommes aussi demandés si on pouvait imaginer des populations infinies de bayésiens - c'est vraiment là que j'ai le plus embarqué. C'est une sorte de substitut pour un autre concept plus familier qu'on appelle l'espace échantillonnal dans la théorie fréquentiste classique. Ni l'un ni l'autre n'existe vraiment, si ce n'est dans l'esprit de la personne qui essaie d'évaluer une procédure statistique.

L'idée de base est d'imaginer que chacun des membres de cette population infinie apporte ses propres croyances a priori fondées sur son expérience du monde. Ensuite, à vous de voir comment choisir ce groupe conceptuel comme banc d'essai. En gros, chacun de ces bayésiens possède un ensemble d'hyper-paramètres qui caractérisent son point de vue. Le risque bayésien, qui est fonction de ces hyper-paramètres, devient une sorte de résumé du point de vue de chaque personne. Vous pouvez alors faire varier les hyper-paramètres sur toute la gamme de ces bayésiens que vous avez choisi d'utiliser comme base d'expérimentation hypothétique, et puis vous pouvez vérifier l'effet que ça a sur la fonction de risque. Vous avez là quelque chose qui ressemble à une théorie de Wald classique, sauf que vous travaillez avec des risques de Bayes plutôt qu'avec des risques classiques. Les mêmes théorèmes mathématiques s'appliquent, bien entendu. C'est comme ça que j'ai abordé le problème d'un point de vue conceptuel.

Comment en es-tu venu à collaborer avec Constance van Eeden?

Au départ, j'ai pris contact avec Constance van Eeden parce qu'elle s'intéressait aux questions d'inférence statistique avec contraintes d'ordre, et puis elle est devenue l'une de mes collègues. Lorsque j'ai voulu intégrer la théorie de Wald dans l'analyse bayésienne du comportement de groupes [9], je me suis vite rendu compte que les espaces de paramètres sur lesquels on tombe comportaient des contraintes d'ordre. Quand on crée cette population infinie de bayésiens dont je parlais tout à l'heure, ça n'a pas de sens de croire qu'on a besoin de toute la droite réelle pour représenter tous les bayésiens pertinents. Après tout, puisque tout le monde partage une expérience commune du monde qui nous entoure, il semble raisonnable que d'une façon ou d'une autre, nos paramètres se ressemblent. Les articles que j'ai rédigés avec Constance s'apparentent de près à ceux qui concernent la théorie de Wald. Mais dans mon esprit, ils sont également pertinents dans le cadre du problème bayésien de décision de groupe.

Un des premiers projets appliqués sur lesquels tu as travaillé concernait la conception de ponts - est-ce que c'était un projet de consultation?

Oui. À l'époque, il était question de remplacer le pont Lions Gate. Il n'était plus tout à fait conforme aux normes en vigueur, mais on se demandait s'il était tout de même capable de répondre aux besoins de la circulation. Je crois que c'est le premier projet concret d'envergure auquel j'aie travaillé, et j'ai beaucoup appris. Ça m'a vraiment fait réaliser que j'avais compris la statistique de manière superficielle - Ça veut dire quoi, au juste, l'indépendance des charges de deux sections du tablier d'un pont ? J'en avais une vague idée d'un point de vue strictement probabiliste, mais je n'avais pas encore compris l'importance d'un concept comme celui d'indépendance conditionnelle - il peut arriver que des observations soient dépendantes mais qu'elles deviennent indépendantes, une fois qu'on conditionne par rapport à certains paramètres. Les ingénieurs n'avaient pas ce genre de paramètres-là en tête. Alors pour eux, les sections du pont étaient reliées très étroitement. Ce projet-là m'a aussi fait comprendre que la consultation est un élément indispensable si l'on veut vraiment saisir l'essence de certains concepts statistiques qui font pourtant partie de notre quotidien. Somme toute, le projet s'est avéré très intéressant.

À l'époque, il n'y avait pas de normes pour la construction de ponts de longue portée comme le Lions Gate. Pour les ponts de ce genre, ce ne serait pas du tout réaliste de baser la conception sur une charge maximale; les coûts de construction deviendraient prohibitifs. Ça ouvrait la porte à l'utilisation de différentes méthodes de valeurs extrêmes, et ça m'a intéressé [10]. À la fin, nous avons publié ce que je pense avoir été à l'époque le premier code du bâtiment pour les ponts de longue portée - lequel a ensuite été adopté par l'American Society for Civil Engineers.

Et qu'est-ce qui t'a amené à t'intéresser à la mésométrie?

C'est un truc qui a démarré dans les années 80 par un projet de consultation lié au lancement des activités de forage dans la mer de Beaufort et dans la baie Harrison. Il fallait mettre au point un système pour certaines mesures prises avant et après le forage. En particulier, la National Oceanographic and Atmospheric Agency s'inquiétait des effets néfastes de l'exploitation sur les petits organismes marins.

À la suite de ce projet, Don Thompson, président de SIMS (anciennement le SIAM : Institut de sciences mathématiques, devenu depuis l'Institut de statistique mathématique sociétal), m'a contacté pour m'inviter à participer à un programme du gouvernement fédéral américain visant à évaluer l'évolution des retombées des pluies acides, programme qui est devenu une étude multi-centres avec Jim Ware et ses collègues d'Harvard, et Paul Switzer et ses collègues à Stanford. Par la suite, John Petkau a également travaillé sur le projet avec moi à UBC. Le groupe de UBC a aussi aidé celui de Seattle à se développer comme centre distinct.

On a tiré beaucoup de bénéfices de tout ça. De mon point de vue, par exemple, je pense à tous mes travaux conjoints avec Nhu Le, relatés dans toute une série d'articles. J'ai écrit le premier article avec Bill Caselton sur les aspects de planification d'expérience [11]; on retrouve les mêmes préoccupations dans l'article sur les questions de prévision spatiale que j'ai rédigé avec Nhu Le en 1992 [12]. Ces deux articles ont ensuite inspiré un bon nombre de travaux subséquents. Et ça continue! À titre d'exemple, si les stations de cueillette de données entrent en opération à différents moments, les observations prennent la forme d'un escalier dont la première marche correspondrait à la station la plus récente, alors que la marche la plus haute correspondrait à la station la plus ancienne. Il faut alors trouver une manière efficace de gérer cette structure en escalier [13].

À la réflexion, quelle serait d'après toi ta plus grande réalisation?

Ce serait difficile pour moi d'identifier une chose en particulier. Je me suis lancé dans ce domaine pour comprendre la statistique. Je ne pense pas avoir vraiment réussi, mais j'ai quand même un peu progressé et ça, c'est déjà quelque chose! Au fond, mon impression est que nous avançons tous ensemble, à tâtons; nous essayons encore de trouver les fondements et les applications pratiques de notre discipline dans d'autres domaines. Tout ça fait un tout et je pense que c'est l'objectif que nous devrions tous tenter d'atteindre dans le futur.

Références

1. Zidek, J.V. «Inadmissibility of the best invariant estimator of extreme quantiles of the normal law under squared error loss.» The Annals of Mathematical Statististics 40: 1801-1808 (1969).
2. Zidek, J.V. «Inadmissibility of a class of estimators of a normal quantile. monitoring sites.» The Annals of Mathematical Statistics 42: 1444-1477 (1971).
3. Zidek, J.V. «A representation of Bayes invariant procedures in terms of Haar measure.» Annals of the Institute of Statistical Mathematics 21: 291-308 (1969).
4. Zidek, J.V. «Sufficient conditions for the inadmissibility under squared error loss of formal Bayes estimators.» The Annals of Mathematical Statististics 41: 446-456 (1970).
5. Dawid, A.P., Stone, M. et Zidek, J.V. «Marginalization paradoxes in Bayesian and structural inference.» Journal of the Royal Statistical Society, Series B 35: 189-233 (1973).
6. Weerahandi, S. et Zidek, J.V. «Multi-Bayesian statistical decision theory.» Journal of the Royal Statistical Society, Series A 144: 85-93 (1981).
7. Weerahandi, S. et Zidek, J.V. «Elements of multi-Bayesian decision theory.» The Annals of Statistics 11: 1032-1046 (1983).
8. Genest, C. et Zidek, J.V. «Combining probability distributions: a critique and an annotated bibliography.» Statistical Science 1: 114-148 (1986).
9. van Eeden, C. et Zidek, J.V. «Group Bayes estimation of the exponential mean: a retrospective view of the Wald theory.» Proceedings of the Fifth Purdue International Symposium on Statistical Decision Theory and Related Topics (eds. S.S. Gupta and J.O. Berger), pp. 35-49 (1994).
10. Zidek, J.V., Navin, F.D.P. et Lockhart, R.A. «Statistics of extremes: an alternate method with application to bridge design codes.» Technometrics 8: 185-191 (1979).
11. Caselton, W.F. et Zidek, J.V. «Optimal monitoring network designs.» Statistics and Probability Letters 2: 223-227 (1984).
12. Le, N.D. et Zidek, J.V. «Interpolation with uncertain spatial covariances: a Bayesian alternative to kriging.» Journal of Multivariate Analysis 43: 351-374 (1992).
13. Le, N.D., Sun, L. et Zidek, J.V. «Spatial prediction and temporal backcasting for environmental fields having monotone data patterns.» La revue canadienne de statistique 29: 529-554 (2001).

À propos de l'interviewer

photo of Nancy Heckman

Nancy Heckman est professeure et collègue de Jim à UBC. Elle a obtenu son doctorat de l'Université du Michigan à Ann Arbor en 1982 et a travaillé quelques années à New-York avant de s'associer au Département de statistique de UBC en 1984. Ses travaux portent sur les méthodes de lissage et l'analyse de données fonctionnelles.

© 2001-2003 Société statistique du Canada | Contactez la SSC | Contactez le webmestre | Créé par Pip Media Group

Ce site n'est visible dans sa version formatée qu'avec un navigateur qui supporte les normes Web, mais son contenu est accessible par ous les navigateurs et appareils à accès Internet.