Séminaire "Statistique, Probabilités et Applications" 

Année 2008-2009

Institut de Mathématiques de Bourgogne






18-19 Juin 2009 :  Sixièmes journées de statistique fonctionnelle et opérationnelle  (http://math.u-bourgogne.fr/Staph2009/)

Mercredi 3 Juin 2009 : Nicolas Pouyanne (Versailles)

Titre : Loi limite des grands arbres $m$-aires de recherche.

Résumé : Les arbres m-aires de recherche peuvent être vus comme des urnes de Polya, et lorsque $m > 26$, l'asymptotique du vecteur composition de l'urne n'est pas gaussien. Pour identifier la loi de la limite de martingale qui apparaît, on utilise un plongement en temps continu qui fait apparaître un processus de branchement. Ce sont les équations de dislocation écrites pour ce processus qui donnent un système différentiel sur la série de Laplace de la loi mystérieuse, qui va permettre de l'identifier.


Mercredi 20 Mai 2009 : Marianne Pelletier (Université de Versailles)

Titre : Vitesse de convergence des algorithmes stochastiques à pas doubles



Mercredi 13 Mai 2009 : Etienne Joserand (IMB Dijon)

Titre : Sondages stratifiés pour données fonctionnelles : allocation  optimale et bandes de confiance asymptotiques.

Résumé : Dans cet exposé, je propose une estimation de la moyenne basée sur des  estimateurs de type Horvitz-Thompson lorsque les données sont des courbes et issues d'un plan de sondage en strates, ainsi qu'une bande de confiance asymptotique. La technique de stratification permet de réduire la variance des estimateurs.


Mercredi 8 Avril 2009 : Gladys Toulemonde (Université de Montpellier)

Titre : Modèles de Markov cachés en théorie des valeurs extrêmes

Résumé: Dans cet exposé nous proposons de nouveaux modèles statistiques motivés par la problématique de l'assimilation de données en théorie des valeurs extrêmes. En science de l'environnement, les maxima journaliers, hebdomadaires ou annuels de séries temporelles sont généralement ajustés par une distribution des valeurs extrêmes généralisée. La distribution de Gumbel en est un exemple et apparaît comme la distribution limite des maxima issus de distributions à queues légères. Pour prendre en compte les formes de dépendance temporelle inhérentes à ces séries, une solution consiste à utiliser les processus linéaires autorégressifs, très appréciés notamment pour leur facilité d'interprétation. Nous proposons des modèles autorégressifs qui sont à la fois linéaires et adaptés à la distribution de Gumbel bien que cette dernière soit une loi stable pour l'opérateur max et non pour l'addition. Ces modèles autorégressifs constituent alors une base solide à l'élaboration de modèles à espace d'état pour des évènements extrêmes.



Mercredi 25 Mars 2009 : Adeline Samson (Université Paris V)

Titre : Estimation dans les modèles mixtes définis par des équations différentielles stochastiques.

Résumé : Nous présenterons l'estimation paramétrique dans les modèles mixtes classiques à l'aide d'une version stochastique de l'algorithme EM. Nous verrons ensuite le cas de modèles mixtes définis par une équation différentielle stochastique. Dans le cas où la densité de la diffusion n'est pas explicite, nous montrerons la convergence de notre estimateur vers l'estimateur du maximum de vraisemblance. Nous proposerons également un estimateur bayesien des paramètres de ces modèles.



Mercredi 18 Février 2009 : Anne Ruiz-Gazen (Toulouse School of Economics)

Titre : Détection d'observations atypiques et d'observations influentes dans des contextes non standards.

Résumé : La détection de valeurs atypiques et/ou influentes dans un jeu de données est un problème important qui a donné lieu à de très nombreux travaux. Dans cette présentation nous proposons de rappeler quelques  méthodes de détection notamment en multivarié et de montrer comment elles peuvent s'étendre à des contextes non standards comme le cas des données géoréférencées ou le cas des données de sondages.



Mercredi 4 Février 2009 : Emmanuelle Puceat, Benoit Forel, Guillaume Dera, Benjamin Brigaud et Fabrice Monna (Université de Bourgogne)

Titre : Deux problèmes d’ordre mathématique (parmi d’autres) rencontrés en géologie et en archéologie.

Résumé 

Géologie.
Depuis plus de 20 ans, de nombreuses études géochimiques menées sur des restes d'organismes fossiles (coquillages, dents de poissons) ont permis de préciser les variations de température de l'eau de mer pendant les temps géologiques. En effet, l'incorporation des différents isotopes de l'oxygène (16 et 18) est dépendante de la température de l'eau de mer. Face à la multitude des données récentes, la création de courbes isotopiques composites montrant les variations de températures au cours du temps est
maintenant possible. Peut-on utiliser une moyenne (ou fenêtre) mobile ou doit-on envisager des procédures plus complexes du type LOESS, Kriging, ou ARMA? Comment lisser efficacement en tenant compte des variations de densité de points tout en conservant le maximum d'informations (en distinguant le bruit de fond et les variations à haute fréquence).

Archéologie. L’analyse du mobilier métallique à base de cuivre constitue pour l’archéologie une source importante dans la compréhension de la métallurgie précoce. La caractérisation de la composition chimique élémentaire et de la composition isotopique du mobilier a pour objectif d’apporter des éléments de réponses sur des questions aussi complexes que la
nature des minerais exploités et la « recette métallurgique » mise en œuvre pour la confection de l’objet.
Il ne faut cependant pas oublier que le métal constitue une matière réutilisable. Ce phénomène a très probablement existé mais il est impossible d’en percevoir l’intensité. L’objectif serait de simuler le recyclage à partir de la base de données archéologiques existante afin d’examiner dans quelle mesure il affecte la variabilité chimique et isotopique des lots d’objets découverts sous forme de « dépôt ». Ceci permettrait peut être d’évaluer la qualité des informations tirée à partir des populations à défaut de celles extraites à partir des individus.




Mercredi 28 Janvier 2009 : Alexandre Guay, notre philosophe de l'UFR Sciences et Techniques

Titre :
Conceptions contemporaines de la causalité

Résumé:
Dans cette conférence, j'exposerai les grande conceptions de la causalité en philosophie contemporaine. En particulier, je discuterai de la réduction de la causalité à l'explication, ainsi que des approches contrefactuelle, interventionniste et en termes de transmission de la causalité. Je tenterai de convaincre l'auditoire du caractère toujours ouvert de cette question en philosophie.


Mercredi 21 Janvier 2009: Mohamed Chaouch (IMB)

Titre : Sondage et quantiles géométriques

Résumé: pdf



Mercredi 10 Décembre 2008 : Hélène Boistard (TSE, Toulouse)

Titre: Théorèmes limites pour des intégrales multiples par rapport au processus empiriques. Application au test de Wasserstein.

Résumé: Les intégrales multiples par rapport au processus empirique (cf., e. g. Major 2006) sont des objets étroitement liés aux U-statistiques. Les travaux de Major (2006, 2007) établissent l'existence d'un théorème limite central (TLC) pour les intégrales multiples. Nous approfondissons ici ce résultat en explicitant la limite et en lui donnant un sens, comme intégrale multiple par rapport au pont brownien. Nous étendons les TLC pour les U-statistiques.
Nous établissons par la suite des résultats de convergence sous hypothèse de contiguïté. Nous étudions les tests basés sur des intégrales doubles par rapport au processus empirique, dans le cadre asymptotique des expériences gaussiennes de déplacement (Gaussian shifts).
Nous appliquons ces outils au test de normalité de Wasserstein, qui est équivalent à une intégrale double par rapport au processus empirique. Nous étudions son efficacité asymptotique pour des mélanges de lois normales. Des simulations permettent de mettre en perspective les résultats asymptotiques et le comportement du test en échantillon fini.



Vendredi 5 Décembre à 10h30 salle René Baire, Batiment Mirande: soutenance de thèse de Mohamed Chaouch (IMB Dijon)

Titre : Contribution à l'estimation non paramètrique des quantiles géométriques et à l'analyse des données fonctionnelles.


Jeudi 4 Décembre à 16h00 salle René Baire, Batiment Mirande : soutenance de thèse de Mohamed Mounsef (IMB Dijon)

Titre :
Analyticité de la pression aux sommes d'exponentielles pour des systèmes dynamiques localement inversibles et des poids holderiens



Mercredi 19 Novembre : Nathael Gozlan (Université Marne la Vallée)

Titre :
Concentration, transport et grandes déviations.

Résumé : Certaines mesures de probabilité ont la propriété de concentrer indépendamment de la dimension. C'est le cas, par exemple, pour la mesure gaussienne ou pour la mesure exponentielle. Ces dernières années, ces propriétés de concentrations adimensionnelles ont été vues comme conséquences d'inégalités fonctionnelles plus générales satisfaites par la probabilité de référence.
L'exemple le plus célèbre est l'inégalité de Sobolev Logarithmique qui implique de la concentration adimensionnelle de type gaussien. Pour étudier d'autres types de concentration, de nombreuses inégalités fonctionnelles ont été proposées : inégalités de Poincaré, inégalités de Sobolev Logarithmiques modifiées, inégalités de Latala-Oleskiewicz, inégalités de transport, inégalités d'inf-convolution, inégalités de Poincaré à poids,...
Dans cet exposé, nous montrerons que les inégalités de transport, introduites par Marton et Talagrand, jouent un rôle privilégié. Nous verrons en effet qu'elles sont équivalentes au phénomène de concentration adimensionnelle. La preuve de  ce résultat repose sur des outils venant de la théorie des grandes déviations.



Mercredi 12 Novembre 2008 : Pierre-André Zitt (Imb)

Titre : Résonances pour une diffusion dans un potentiel à croissance lente

Résumé : Pour étudier une diffusion liée à l'algorithme du recuit simulé, on est amené à déterminer le comportement asymptotique du spectre de son générateur, quand l'intensité du bruit décroît vers 0. Ce générateur est explicite, et dépend de la fonction "potentiel" que l'algorithme cherche à minimiser.  Le "bas du spectre" (les valeurs propres proches de zéro) de ce générateur est très bien connu quand la fonction potentiel croît rapidement vers l'infini. En revanche, sans cette hypothèse, le spectre peut dégénérer, et les valeurs propres disparaître. On peut cependant trouver d'autres quantités spectrales, appelées résonances, dont le comportement asymptotique est très proche. Après avoir présenté le problème, on expliquera ce que sont les résonances, puis on montrera les principales étapes de la preuve de leur existence.


Mercredi 22 Octobre 2008 : Laurent Delsol (Institut de statistique Bruxelles)

Titre : Tests de structure en régression sur variable fonctionnelle: point de vue théorique et applications.



Mercredi 15 Octobre 2008 : Li-Ming WU (Université de Clermont Ferrand)

Titre : Concentration gaussienne pour les processus de Markov



Mercredi 8 Octobre 2008 : Issam Elhattab (Imb)

Titre : Estimation Non Paramétrique de l'Entropie, Synthèse et Nouvelles Résultats.

Résumé: La notion de l'entropie a été introduite par Shannon en 1948. Depuis cette date la notion de l'entropie a eu beaucoup d'usage théorique et pratique. Dans cet exposé nous allons définir quelques estimateurs non paramétriques de l'entropie différentielle, et après une brève synthèse des principaux résultats de convergence, connus à ce jour, nous présentons des nouvelles théorèmes concernant la vitesse de convergence et le problème de choix de la fenêtre.


Vendredi 26 Septembre 2008 : Jay Breidt (Colorado State University and ENSAI, Rennes) in collaboration avec Jean Opsomer, Colorado State University et Ingrid van Keilegom, Université Catholique de Louvain.

Titre : Endogenous Post-Stratification in Surveys: Parametric and Non-Parametric Approaches.

Résumé : Post-stratification is frequently used to improve the precision of survey estimators when categorical auxiliary information is available from  sources outside the survey.  In natural resource surveys, like forest inventories, such information is often obtained from remote sensing data, classified into categories and displayed as pixel-based maps. These map may be constructed based on classification models fitted to the sample data.  Post-stratification of the sample data based on categories derived from the sample data (``endogenous post-stratification'') violates the standard post-stratification assumptions that observations are classified without error into post-strata, and post-stratum population counts are known. Properties of the endogenous post-stratification estimator are derived for the case of a sample-fitted generalized linear model, from which the post-strata are constructed by dividing the range of the model predictions into predetermined intervals. Design consistency of the endogenous post-stratification estimator is established under mild conditions.  Under a superpopulation model, consistency and asymptotic normality of the endogenous post-stratification estimator are established, showing that it has the same asymptotic variance as the traditional post-stratified estimator with fixed strata. Simulation experiments demonstrate that the practical effect of first fitting a model to the survey data before post-stratifying is small, even for relatively small sample sizes.  Some potential extensions with non-parametric classification models are discussed.