Atelier Apprentissage 2006–2007
Test par rééchantillonnage dans un cadre gaussien corrélé Étienne Roquain (INRA/univ. Paris XI) 12 mars 2007 |
En collaboration avec Sylvain Arlot et Gilles Blanchard.
Mots-clés : rééchantillonnage, tests multiples, vecteur gaussien corrélé, inégalités de concentration, quantile symétrisé
Dans ce travail, on construit un test pour détecter les moyennes positives d’un vecteur gaussien, en contrôlant la probabilité d’avoir au moins une fausse alarme (erreur appelée FWER i.e. "family wise error rate"). On considère ici le cas où les $K$ coordonnées du vecteur peuvent être fortement dépendantes, où la matrice de corrélation est inconnue et où on observe $n$ copies i.i.d de ce vecteur avec $n << K$ (cadre non-asymptotique). Ce cadre correspond à plusieurs cas pratiques (analyse de puces à ADN, analyse d’images, etc). On répond à ce problème par deux approches basées sur un rééchantillonnage du supremum de la moyenne empirique des données : la première utilise des résultats de concentration alors que la seconde utilise une astuce de symétrisation de quantile. On montre que ces deux procédures ont des erreurs rigoureusement contrôlées par le niveau souhaité, et ce quels que soient $K$ et $n$.Lorsque les corrélations sont suffisamment importantes, ces méthodes, qui apprennent implicitement ces corrélations, donnent des résultats meilleurs qu’une simple procédure de Bonferonni. Ceci sera illustré par une étude de simulation.
Écouter | ||
|
||
- Visualiser - Télécharger |
||
|
||
Télécharger | ||
|
||
Télécharger | ||
|
![]() | Étienne Roquain (INRA/univ. Paris XI) |
Page officielle du groupe de travail apprentissage
Page personnelle [en anglais] d’Étienne Roquain