Development of new statistical methodologies for quantitative proteomics data analysis - DSA-IPHC Accéder directement au contenu
Thèse Année : 2021

Development of new statistical methodologies for quantitative proteomics data analysis

Développement de nouvelles méthodologies statistiques pour l'analyse de données de protéomique quantitative

Résumé

Proteomic analysis consists of studying all the proteins expressed by a given biological system, at a given time and under given conditions. Recent technological advances in mass spectrometry and liquid chromatography make it possible to envisage large-scale and high-throughput proteomic studies.This thesis work focuses on developing statistical methodologies for the analysis of quantitative proteomics data and thus presents three main contributions. The first part proposes to use monotone spline regression models to estimate the amounts of all peptides detected in a sample using internal standards labelled for a subset of targeted peptides. The second part presents a strategy to account for the uncertainty induced by the multiple imputation process in the differential analysis, also implemented in the mi4p R package. Finally, the third part proposes a Bayesian framework for differential analysis, making it notably possible to consider the correlations between the intensities of peptides.
L’analyse protéomique consiste à étudier l’ensemble des protéines exprimées par un système biologique donné, à un moment donné et dans des conditions données. Les récents progrès technologiques en spectrométrie de masse et en chromatographie liquide permettent d’envisager aujourd’hui des études protéomiques à large échelle et à haut débit. Ce travail de thèse porte sur le développement de méthodologies statistiques pour l’analyse des données de protéomique quantitative et présente ainsi trois principales contributions. La première partie propose d’utiliser des modèles de régression par spline monotone pour estimer les quantités de tous les peptides détectés dans un échantillon grâce à l'utilisation de standards internes marqués pour un sous-ensemble de peptides ciblés. La deuxième partie présente une stratégie de prise en compte de l’incertitude induite par le processus d’imputation multiple dans l’analyse différentielle, également implémentée dans le package R mi4p. Enfin, la troisième partie propose un cadre bayésien pour l’analyse différentielle, permettant notamment de tenir compte des corrélations entre les intensités des peptides
Fichier principal
Vignette du fichier
Chion_Marie_2021_ED269.pdf (15.06 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03515977 , version 1 (07-01-2022)
tel-03515977 , version 2 (22-09-2022)

Identifiants

  • HAL Id : tel-03515977 , version 2

Citer

Marie Chion. Development of new statistical methodologies for quantitative proteomics data analysis. General Mathematics [math.GM]. Université de Strasbourg, 2021. English. ⟨NNT : 2021STRAD025⟩. ⟨tel-03515977v2⟩
148 Consultations
50 Téléchargements

Partager

Gmail Facebook X LinkedIn More