Skip to main content

DS4S - Data Science for Science


Mittwoch, 25.5.2022 - 16 Uhr

Hanna Voß spricht über ihre Forschung

Wir, die Graduiertenschule Data Science in Hamburg - Helmholtz Graduate School for the Structure of Matter (DASHH), der Leibniz ScienceCampus InterACt (LSC InterACt)und das Center for Data and Computing in Natural Sciences (CDCS) organisieren derzeit eine neue Veranstaltungsreihe mit dem Titel Data Science for Science (DS4S), um den Austausch und die Vernetzung über die Disziplinen hinweg in der Metropolregion Hamburg zu ermöglichen. Dazu laden wir alle interessierten Forscherinnen und Forscher zu den zweiwöchentlich stattfindenden Veranstaltungen ein, die jeweils mittwochs um 16 Uhr stattfinden.

Forscherinnen und Forscher aus allen Partnerinstitutionen sind eingeladen, verschiedene Aspekte der (geplanten) Data-Science-Forschung und die entsprechenden Anwendungsfelder vorzustellen. Die neue Reihe ist eine Erweiterung unserer früheren Hamburg COVID-19 Series, die viel Aufmerksamkeit und positives Feedback erhalten hat, obwohl sie nun einen viel breiteren Rahmen hat. Die Veranstaltung wird derzeit online organisiert, aber wir hoffen, dass wir unsere Reihe bis Juni zu einer Vor-Ort-Veranstaltung mit Vorträgen und einem anschließenden Networking-Event ausbauen können.

Den nächsten Vortrag hält Hannah Voß (Klinische Chemie und Labormedizin, Universitätsklinikum Hamburg-Eppendorf) am 25. Mai 2022 um 16 Uhr. In ihrem Vortrag wird sie aktuelle Data Science-Herausforderungen im Bereich der Massenspektrometrie vorstellen. Der Titel des Vortrags lautet "Data integration of in-house and publicly available proteome data across tissue types, quantification techniques and experimental setups overcomes cohort size limitations and enables valid statistical analysis for rare samples".

Abstract (in Englisch)
Investing the proteome is crucial for the understanding of molecular changes in diseases, as the proteome represents pharmacologically addressable phenotype.Small cohorts limit the usability and validity of statistical methods especially for rare disease, while variable technical setups and high numbers of missing values make data integration from public sources challenging. Here, we show for the first time the successful integration of proteomic data across different tissue types (Fresh Frozen, Formalin Fixated Paraffin embedded (FFPE)), quantification platforms (DDA, DIA, SILAC, TMT) and technical setups, while handling missing data without the need for error prone imputation. The developed framework can remove technical batch effects trough Bayesian framework or linear regression model and is adaptable to different data probability distributions-according to the user’s needs.
Based on different datasets we show that data integration across independent proteomic cohorts can help to identify subpopulations and to disclose molecular signatures and altered pathways in biomarker discovery studies.

Wenn Sie einen Beitrag zu dieser Reihe leisten wollen und Kooperationen mit Hamburger Forschern zu einem bestimmten Verfahren oder Anwendungsfeld suchen, können Sie sich gerne über den Kontakt-Button mit uns in Verbindung setzen.

Wenn Sie Interesse an unseren Vorträgen haben und regelmäßig über diese Reihe informiert werden möchten, tragen Sie sich in unsere Mailingliste https://bit.ly/3hTStBa ein.

Wir sind besonders dankbar für die Unterstützung dieser Reihe durch die Joachim Herz Foundation.