Bayesian inference of model error for the calibration of two-phase CFD codes

Nicolas Leoni

Résumé

The calibration of a computer code consists in the comparison of its predictions to the experimental data, so that the best input parameter values can be inferred. We work in a Bayesian framework, where the parameters are treated as random variables to accurately represent the uncertainty around their values, and the subsequent model predictions. The focus is on situation where, regardless of parameter values, there remains an irreducible discrepancy between model predictions and the data, which reveals the presence of model error. Every model is an imperfect representation of reality, and its model error is caused by the approximating assumptions it is based on.In the first part of the manuscript we present the theoretical and numerical contributions developed in this thesis, and the principal one is the development of a new technique for estimating model error, named Full Maximum a Posteriori (FMP), based on a new parameterization of the model discrepancy distribution, and the introduction of optimal hyperparameters. This technique is replaced in the context of traditional estimation technique, notably the one of Kennedy-O'Hagan (KOH) which is the standard in the domain. Under an assumption of normality of the posterior density, we show that the FMP method outperforms the KOH method, since it does not underestimate the parameter uncertainty and it reveals all possible explanations of the data when the posterior is multimodal. The relevance of this normality assumption is examined in situations where the number of experimental observations tends to infinity, in three asymptotic frameworks. A second chapter is dedicated to numerical techniques that are used in calibration, notably the sampling of densities using Markov Chain Monte-Carlo techniques, and the construction of a surrogate model following a dimensionality reduction of the code output using a Principal Component Analysis. We introduce a variant of the resampling algorithm applied to the FMP sample to improve its quality. In order to accelerate the FMP technique, we also propose an algorithm of construction of surrogate models for the optimal hyperparameters, with training points drawn from samples of successive Markov Chains, weighted according to the predictive uncertainties.In a second part we present two applications of the FMP calibration, where it is compared to the KOH method and the reference solution when it is attainable. First we consider the study of a liquid boiling at a wall, with a model that predicts the partitioning of the wall heat flux. The calibration is performed using data from multiple experimental configurations, which constitutes a significant number of hyperparameters to be treated simulataneously. In a second chapter we treat both experimental uncertainty and model error in the code Neptune_CFD, specifically considering the model of interfacial area transport based on bubble interaction. The calibration is performed using the data obtained from the DEBORA experimental facility. On both applications we show that the FMP method is more robust than the KOH method since it avoids overconfident estimation of model parameters and falsely narrow confidence intervals on the predictions. Furthermore, the FMP method is performed at lower cost than the reference solution, so it is attainable in situations where the number of unknowns is high. The robust and cheap character of this technique makes it relevant for nuclear applications, but also in many more domains where we require the reproduction of experimental data with numerical simulations.

La calibration d'un code de calcul consiste en la comparaison de ses prédictions aux données expérimentales dont on dispose, pour déterminer les meilleures valeurs des paramètres d'entrée. Nous travaillons dans un cadre bayésien où ces paramètres sont représentés par des variables aléatoires, permettant une représentation fidèle de l'incertitude sur leurs valeurs ainsi que sur les prédictions. Nous nous intéressons à des situations où, après avoir étudié les possibles variations des paramètres d'entrée du code, il subsiste une distance irréductible entre prédictions et observations, ce qui indique la présence d'une erreur de modèle. Cette erreur provient de l'utilisation d'hypothèses simplificatrices lors de l'élaboration d'un modèle.Dans une première partie nous présentons les contributions théoriques et numériques de cette thèse, dont la principale est une nouvelle approche d'estimation de l'erreur de modèle nommée Full Maximum a Posteriori (FMP), portée par l'introduction d'une nouvelle paramétrisation de la distribution du biais de modèle, et sur le calcul d'hyperparamètres optimaux. Cette méthode est placée dans le contexte des techniques traditionnelles d'estimation et notamment de la méthode classique de Kennedy et O'Hagan (KOH). Sous une hypothèse de normalité de la densité à posteriori, nous démontrons la supériorité de l'approche FMP vis-à-vis de la méthode KOH car elle ne sous-estime pas l'incertitude paramétrique et révèle la totalité des explications possibles des données lorsque la postérieure est multimodale. La pertinence de cette hypothèse de construction est ensuite étudiée dans des situations où le nombre d'observations expérimentales tend vers l'infini, selon trois modes d'acquisition différents. Nous présentons les techniques numériques qui sont au coeur de la calibration, à savoir l'échantillonnage de densités selon la méthode de Monte-Carlo par chaînes de Markov, et la construction de modèles de substitution du code de calcul couplée à une réduction de dimensionalité au moyen d'une Analyse par Composantes Principales. Une méthode d'amélioration de la précision des échantillons FMP basée sur l'algorithme de rééchantillonnage est également proposée. Dans le but d'accélérer la méthode FMP, nous proposons un algorithme permettant la construction de modèles de substitution pour les hyperparamètres optimaux, où les points d'entraînement sont tirés au hasard dans des échantillons de chaînes de Markov successives, avec pondération selon l'incertitude de prédiction.La seconde partie de la thèse est consacrée aux applications de la méthode FMP et la comparaison avec la méthode KOH et la solution de référence au problème de calibration. Dans un premier temps nous procédons à la calibration d'un modèle de répartition de flux thermique à la paroi dans un écoulement en convection forcée, en utilisant des observations provenant de multiples configurations expérimentales, ce qui constitue un nombre significatif d'hyperparamètres à traiter de manière simultanée. La seconde application porte sur le code de calcul Neptune_CFD, où nous traitons simultanément l'incertitude expérimentale et l'erreur de modèle qui porte sur l'équation de transport de l'aire interfaciale, à partir de données obtenues sur l'expérience DEBORA. Sur ces deux applications, nous démontrons que la méthode FMP est plus robuste que la méthode KOH car elle évite une confiance excessive envers les paramètres et produit des intervalles de confiance plus fiables sur les prédictions. De plus, son coût réduit permet de réaliser une calibration dans des situations où la solution de référence serait trop chère à calculer. La technique FMP de calibration, illustrée ici par des applications empruntées au domaine nucléaire, est également applicable à de nombreuses situations où le but est de reproduire des données expérimentales par le biais de simulations numériques.

Bayesian inference of model error for the calibration of two-phase CFD codes

Inférence bayésienne de l'erreur de modèle pour la calibration des codes CFD

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager