Séminaire "Statistique, Probabilités et Applications"
Année 2008-2009
Institut de Mathématiques de Bourgogne
18-19 Juin 2009 : Sixièmes journées de statistique fonctionnelle et opérationnelle (http://math.u-bourgogne.fr/Staph2009/)
Mercredi 3 Juin 2009 : Nicolas Pouyanne (Versailles)
Titre : Loi limite des grands arbres $m$-aires de recherche.
Résumé : Les
arbres m-aires de recherche peuvent être vus comme des urnes de
Polya, et lorsque $m > 26$, l'asymptotique du vecteur composition de
l'urne n'est pas gaussien. Pour identifier la loi de la limite de
martingale qui apparaît, on utilise un plongement en temps
continu qui fait apparaître un processus de branchement. Ce sont
les équations de dislocation écrites pour ce processus
qui donnent un système différentiel sur la série
de Laplace de la loi mystérieuse, qui va permettre de
l'identifier.
Mercredi 20 Mai 2009 : Marianne Pelletier (Université de Versailles)
Titre : Vitesse de convergence des algorithmes stochastiques à pas doubles
Mercredi 13 Mai 2009 : Etienne Joserand (IMB Dijon)
Titre : Sondages
stratifiés pour données fonctionnelles : allocation
optimale et bandes de confiance asymptotiques.
Résumé :
Dans cet exposé, je propose une estimation de la moyenne
basée sur des estimateurs de type Horvitz-Thompson lorsque
les données sont des courbes et issues d'un plan de sondage en
strates, ainsi qu'une bande de confiance asymptotique. La technique de
stratification permet de réduire la variance des estimateurs.
Mercredi 8 Avril 2009 : Gladys Toulemonde (Université de Montpellier)
Titre : Modèles de Markov cachés en théorie des valeurs extrêmes
Résumé: Dans
cet exposé nous proposons de nouveaux modèles
statistiques motivés par la problématique de
l'assimilation de données en théorie des valeurs
extrêmes. En science de l'environnement, les maxima journaliers,
hebdomadaires ou annuels de séries temporelles sont
généralement ajustés par une distribution des
valeurs extrêmes généralisée. La
distribution de Gumbel en est un exemple et apparaît comme la
distribution limite des maxima issus de distributions à queues
légères. Pour prendre en compte les formes de
dépendance temporelle inhérentes à ces
séries, une solution consiste à utiliser les processus
linéaires autorégressifs, très
appréciés notamment pour leur facilité
d'interprétation. Nous proposons des modèles
autorégressifs qui sont à la fois linéaires et
adaptés à la distribution de Gumbel bien que cette
dernière soit une loi stable pour l'opérateur max et non
pour l'addition. Ces modèles autorégressifs constituent
alors une base solide à l'élaboration de modèles
à espace d'état pour des évènements
extrêmes.
Mercredi 25 Mars 2009 : Adeline Samson (Université Paris V)
Titre : Estimation dans les modèles mixtes définis par des équations différentielles stochastiques.
Résumé : Nous
présenterons l'estimation paramétrique dans les
modèles mixtes classiques à l'aide d'une version
stochastique de l'algorithme EM. Nous verrons ensuite le cas de
modèles mixtes définis par une équation
différentielle stochastique. Dans le cas où la
densité de la diffusion n'est pas explicite, nous montrerons la
convergence de notre estimateur vers l'estimateur du maximum de
vraisemblance. Nous proposerons également un estimateur bayesien
des paramètres de ces modèles.
Mercredi 18 Février 2009 : Anne Ruiz-Gazen (Toulouse School of Economics)
Titre : Détection d'observations atypiques et d'observations influentes dans des contextes non standards.
Résumé : La
détection de valeurs atypiques et/ou influentes dans un jeu de
données est un problème important qui a donné lieu
à de très nombreux travaux. Dans cette
présentation nous proposons de rappeler quelques
méthodes de détection notamment en multivarié et
de montrer comment elles peuvent s'étendre à des
contextes non standards comme le cas des données
géoréférencées ou le cas des données
de sondages.
Mercredi 4 Février 2009 :
Emmanuelle Puceat, Benoit Forel, Guillaume Dera, Benjamin Brigaud et
Fabrice Monna (Université de Bourgogne)
Titre : Deux problèmes
d’ordre mathématique (parmi d’autres)
rencontrés en géologie et en archéologie.
Résumé
Géologie. Depuis plus de 20 ans, de nombreuses
études géochimiques menées sur des restes
d'organismes fossiles (coquillages, dents de poissons) ont permis de
préciser les variations de température de l'eau de mer
pendant les temps géologiques. En effet, l'incorporation des
différents isotopes de l'oxygène (16 et 18) est
dépendante de la température de l'eau de mer. Face
à la multitude des données récentes, la
création de courbes isotopiques composites montrant les
variations de températures au cours du temps est
maintenant possible. Peut-on utiliser une moyenne (ou fenêtre)
mobile ou doit-on envisager des procédures plus complexes du
type LOESS, Kriging, ou ARMA? Comment lisser efficacement en tenant
compte des variations de densité de points tout en conservant le
maximum d'informations (en distinguant le bruit de fond et les
variations à haute fréquence).
Archéologie.
L’analyse du mobilier métallique à base de cuivre
constitue pour l’archéologie une source importante dans la
compréhension de la métallurgie précoce. La
caractérisation de la composition chimique
élémentaire et de la composition isotopique du mobilier a
pour objectif d’apporter des éléments de
réponses sur des questions aussi complexes que la
nature des minerais exploités et la « recette
métallurgique » mise en œuvre pour la confection de
l’objet.
Il ne faut cependant pas oublier que le métal constitue une
matière réutilisable. Ce phénomène a
très probablement existé mais il est impossible
d’en percevoir l’intensité. L’objectif serait
de simuler le recyclage à partir de la base de données
archéologiques existante afin d’examiner dans quelle
mesure il affecte la variabilité chimique et isotopique des lots
d’objets découverts sous forme de «
dépôt ». Ceci permettrait peut être
d’évaluer la qualité des informations tirée
à partir des populations à défaut de celles
extraites à partir des individus.
Mercredi 28 Janvier 2009 : Alexandre Guay, notre philosophe de l'UFR Sciences et Techniques
Titre : Conceptions contemporaines de la causalité
Résumé: Dans cette conférence,
j'exposerai les grande conceptions de la causalité en
philosophie contemporaine. En particulier, je discuterai de la
réduction de la causalité à l'explication, ainsi
que des approches contrefactuelle, interventionniste et en termes de
transmission de la causalité. Je tenterai de convaincre
l'auditoire du caractère toujours ouvert de cette question en
philosophie.
Mercredi 21 Janvier 2009: Mohamed Chaouch (IMB)
Titre : Sondage et quantiles géométriques
Résumé: pdf
Mercredi 10 Décembre 2008 : Hélène Boistard (TSE, Toulouse)
Titre: Théorèmes
limites pour des intégrales multiples par rapport au processus
empiriques. Application au test de Wasserstein.
Résumé: Les
intégrales multiples par rapport au processus empirique (cf., e.
g. Major 2006) sont des objets étroitement liés aux
U-statistiques. Les travaux de Major (2006, 2007) établissent
l'existence d'un théorème limite central (TLC) pour les
intégrales multiples. Nous approfondissons ici ce
résultat en explicitant la limite et en lui donnant un sens,
comme intégrale multiple par rapport au pont brownien. Nous
étendons les TLC pour les U-statistiques.
Nous établissons par la suite des résultats de
convergence sous hypothèse de contiguïté. Nous
étudions les tests basés sur des intégrales
doubles par rapport au processus empirique, dans le cadre asymptotique
des expériences gaussiennes de déplacement (Gaussian
shifts).
Nous appliquons ces outils au test de normalité de
Wasserstein, qui est équivalent à une intégrale
double par rapport au processus empirique. Nous étudions son
efficacité asymptotique pour des mélanges de lois
normales. Des simulations permettent de mettre en perspective les
résultats asymptotiques et le comportement du test en
échantillon fini.
Vendredi 5 Décembre à
10h30 salle René Baire, Batiment Mirande: soutenance de
thèse de Mohamed Chaouch (IMB Dijon)
Titre : Contribution à
l'estimation non paramètrique des quantiles
géométriques et à l'analyse des données
fonctionnelles.
Jeudi 4 Décembre à 16h00 salle René Baire, Batiment Mirande : soutenance de thèse de Mohamed Mounsef (IMB Dijon)
Titre : Analyticité de la pression aux sommes
d'exponentielles pour des systèmes dynamiques localement
inversibles et des poids holderiens
Mercredi 19 Novembre : Nathael Gozlan (Université Marne la Vallée)
Titre : Concentration, transport et grandes déviations.
Résumé :
Certaines mesures de probabilité ont la propriété
de concentrer indépendamment de la dimension. C'est le cas, par
exemple, pour la mesure gaussienne ou pour la mesure exponentielle. Ces
dernières années, ces propriétés de
concentrations adimensionnelles ont été vues comme
conséquences d'inégalités fonctionnelles plus
générales satisfaites par la probabilité de
référence.
L'exemple le plus célèbre est
l'inégalité de Sobolev Logarithmique qui implique de la
concentration adimensionnelle de type gaussien. Pour étudier
d'autres types de concentration, de nombreuses inégalités
fonctionnelles ont été proposées :
inégalités de Poincaré, inégalités
de Sobolev Logarithmiques modifiées, inégalités de
Latala-Oleskiewicz, inégalités de transport,
inégalités d'inf-convolution, inégalités de
Poincaré à poids,...
Dans cet exposé, nous montrerons que les
inégalités de transport, introduites par Marton et
Talagrand, jouent un rôle privilégié. Nous verrons
en effet qu'elles sont équivalentes au phénomène
de concentration adimensionnelle. La preuve de ce résultat
repose sur des outils venant de la théorie des grandes
déviations.
Mercredi 12 Novembre 2008 : Pierre-André Zitt (Imb)
Titre : Résonances pour une diffusion dans un potentiel à croissance lente
Résumé : Pour
étudier une diffusion liée à l'algorithme du
recuit simulé, on est amené à déterminer le
comportement asymptotique du spectre de son générateur,
quand l'intensité du bruit décroît vers 0. Ce
générateur est explicite, et dépend de la fonction
"potentiel" que l'algorithme cherche à minimiser. Le "bas
du spectre" (les valeurs propres proches de zéro) de ce
générateur est très bien connu quand la fonction
potentiel croît rapidement vers l'infini. En revanche, sans cette
hypothèse, le spectre peut dégénérer, et
les valeurs propres disparaître. On peut cependant trouver
d'autres quantités spectrales, appelées
résonances, dont le comportement asymptotique est très
proche. Après avoir présenté le problème,
on expliquera ce que sont les résonances, puis on montrera les
principales étapes de la preuve de leur existence.
Mercredi 22 Octobre 2008 : Laurent Delsol (Institut de statistique Bruxelles)
Titre : Tests de structure en régression sur variable fonctionnelle: point de vue théorique et applications.
Mercredi 15 Octobre 2008 : Li-Ming WU (Université de Clermont Ferrand)
Titre : Concentration gaussienne pour les processus de Markov
Mercredi 8 Octobre 2008 : Issam Elhattab (Imb)
Titre : Estimation Non Paramétrique de l'Entropie, Synthèse et Nouvelles Résultats.
Résumé: La notion de l'entropie a
été introduite par Shannon en 1948. Depuis cette date la
notion de l'entropie a eu beaucoup d'usage théorique et
pratique. Dans cet exposé nous allons définir quelques
estimateurs non paramétriques de l'entropie
différentielle, et après une brève synthèse
des principaux résultats de convergence, connus à ce
jour, nous présentons des nouvelles théorèmes
concernant la vitesse de convergence et le problème de choix de
la fenêtre.
Vendredi 26 Septembre 2008 : Jay Breidt (Colorado
State University and ENSAI, Rennes) in collaboration avec Jean Opsomer,
Colorado State University et Ingrid van Keilegom, Université
Catholique de Louvain.
Titre : Endogenous Post-Stratification in Surveys: Parametric and Non-Parametric Approaches.
Résumé :
Post-stratification is frequently used to improve the precision of
survey estimators when categorical auxiliary information is available
from sources outside the survey. In natural resource
surveys, like forest inventories, such information is often obtained
from remote sensing data, classified into categories and displayed as
pixel-based maps. These map may be constructed based on classification
models fitted to the sample data. Post-stratification of the
sample data based on categories derived from the sample data
(``endogenous post-stratification'') violates the standard post-stratification assumptions that observations are classified without error into post-strata, and post-stratum population counts are known. Properties of the endogenous post-stratification estimator are derived for the case of a sample-fitted generalized linear model, from which the post-strata are constructed by dividing the range of the model predictions into predetermined intervals. Design consistency of the endogenous post-stratification estimator is established under mild conditions. Under a superpopulation model, consistency and asymptotic normality of the endogenous post-stratification estimator are established, showing that it has the same asymptotic variance as the traditional post-stratified estimator with fixed strata. Simulation experiments demonstrate that the practical effect of first fitting a model to the survey data before post-stratifying is small, even for relatively small sample sizes. Some potential extensions with non-parametric classification models are discussed.