ÉQUIPE

Biologie Computationelle

Responsable d'équipe : B. Habermann

Le groupe de biologie computationnelle essaie de répondre à des problèmes biologiques en utilisant des méthodes de calcul. Nous avons deux axes principaux de recherche : tout d’abord, nous nous intéressons à l’intégration de données à grande échelle, en se concentrant sur la fonction mitochondriale au cours du développement et dans un contexte pathologique ; deuxièmement, nous développons des méthodes de comparaison de séquences isolées, avec l’accent mis sur la prédiction de novo de motifs protéiques courts et fonctionnels.

RÉSUMÉ GRAND PUBLIC

Les analyses et calculs informatiques apportent des approches complémentaires à la recherche biologique depuis longtemps. Avec le début du séquençage et le décryptage du code génétique, des méthodes ont été développées permettant  l’analyse de ce type de données. Le séquençage partiel ou entier des génomes nous a permis, par exemple, d’établir une vision plus fine sur l’évolution des espèces.

Au cours des dernières années, les cribles à grande échelle et le séquençage de nouvelle génération génèrent une quantité énorme de données, qui ne peuvent être analysées – ou comprises – sans l’aide de techniques de calcul. Notre laboratoire travaille dans l’analyse assistée des données biologiques par ordinateur.

Notre équipe aborde deux aspects de la biologie computationnelle :

Premièrement, nous voulons permettre l’utilisation de l’information biologique disponible à ce jour et l’intégrer dans une perspective des systèmes biologiques, dans un contexte développemental ou pathologique. Nous avons choisi les mitochondries pour démontrer l’utilité de l’intégration de données à grande échelle afin de comprendre un système biologique. Les mitochondries sont les usines énergétiques de la cellule. Elles fournissent non seulement l’énergie de la cellule, mais sont aussi impliquées dans de nombreuses fonctions métaboliques. Leur rôle central dans le développement cellulaire et également dans l’homéostasie en fait une cible idéale pour étudier les changements qui ont lieu dans le système mitochondrial. Nous développons des méthodes pour l’interprétation et l’intégration des données biologiques afin de comprendre le changement de fonction des mitochondries dans un tissu en cours de développement ou dans un contexte pathologique comme la maladie de Parkinson ou le cancer.

Deuxièmement, nous travaillons avec les similarités de séquences protéiques dans la zone dite d’ombre (deux protéines apparentées ayant subies un certain nombres de mutations ne permettant plus de pouvoir détecter leurs similarités séquentielles). Nous avons développé des procédés pour détecter des relations évolutives distantes entre protéines homologues, domaines fonctionnels conservés, ainsi qu’entre protéines orthologues conservées. Actuellement, nous travaillons sur des méthodes de prédiction de novo de motifs protéiques courts et fonctionnels : peut-on, sans aucune information préalable, identifier une courte séquence dans une protéine, qui effectue une fonction spécifique, telle que la liaison à une autre protéine ou à un ligand ? Nous abordons ce problème en utilisant soit uniquement la séquence de la protéine, soit sa structure tridimensionnelle.

RÉSUMÉ SPÉCIALISTES

Intégration de données à grande échelle
Nous travaillons sur l’intégration de données à grande échelle à partir de différentes ressources afin d’en extraire l’information biologique significative. Nous utilisons principalement les données NGS qui intègrent des données d’expressions différentielles (ChiP-seq ; interactome) dans le but de fournir aux biologistes de nouvelles hypothèses à tester. Pour ce faire, nous développons des méthodes d’intégration de données qui sont faciles d’utilisation pour les non- experts.

Pour montrer la faisabilité de nos méthodes, nous avons choisi le système mitochondrial, car il représente l’organelle central pour les fonctions métaboliques et la production d’énergie dans la cellule. Il est expérimentalement très bien caractérisé, au niveau de sa composition en protéines et des voies enzymatiques impliquées. C’est un système efficace nous permettant d’examiner les changements de la fonction mitochondriale dans différentes conditions cellulaires.

MitoXplore – comprendre la fonction mitochondriale dans un contexte développemental ou pathologique 
Nous développons la plateforme MitoXplore, un outil web permettant l’intégration de données d’expression et de mutation à grande échelle avec l’interactome mitochondrial.

En utilisant des pipelines spécialisés pour l’analyse de données NGS, les données de mutation et d’expression pour toutes les protéines localisées dans les mitochondries sont extraites, quelle que soit leur localisation génomique (mitochondrial ou génome nucléaire). Nous intégrons ensuite ces données avec l’interactome mitochondrial qui a été assemblé et nettoyé manuellement, et nous formalisons les changements observés dans différentes conditions expérimentales ou pathologiques.  Cela permet une visualisation facile et rapide, offrant ainsi de comparer différents ensembles de données par rapport à leurs fonctions mitochondriales. Ce projet est soutenu par une subvention DFG ‘Systems biological analysis of cancer genomes using deductive databases’.

Differential expression and mutation of mitochondrial genes and nuclear mitochondrial genes in an aneuploid human cancer cell line.

 

AnnoMiner – l’intégration des données de ChIP-seq
AnnoMiner intègre la détection de pics issus des expériences de ChIP-seq en utilisant des critères de recouvrement heuristiques. Notre algorithme peut être utilisé pour annoter les pics de ChIP-seq avec des caractéristiques génomiques comme les gènes ou la comparaison des profils de ChIP-seq. Une deuxième caractéristique de AnnoMiner est d’utiliser les profils de ChIP-seq disponibles pour l’analyse de l’enrichissement des études d’expression à grande échelle. Tout comme la recherche de l’enrichissement de sites de liaison dans les éléments régulateurs de gènes exprimés de manière différentielle, nous pouvons regarder l’enrichissement des pics de ChIP-seq à partir de ressources publiques afin de trouver des facteurs régulateurs potentiels impliqués dans l’expression différentielle. AnnoMiner est disponible pour tous les organismes modèles et sera disponible en web-service.

Des réseaux biologiques pour l’analyse, l’intégration et la visualisation de données
Les réseaux biologiques tels que les réseaux d’interaction protéine-protéine ou les réseaux de régulation génique font partie intégrante de la compréhension des systèmes biologiques. Nous utilisons ces réseaux afin d’interpréter et d’intégrer des données à grande échelle provenant des études d’expression. Nous avons développé plusieurs algorithmes pour 1 ) la génération de réseaux d’interactions protéiques non redondants ( miMerge , miScore ( Villaveces , et al . , Base de données , 2015 ) ) , 2 ) la visualisation et l’intégration des données de voie de signalisation ( KEGGviewer ( Villaveces , et al . , F100Res 3:43 , 2014) , PsiquicGraph ( Villaveces , et al . , F100Res 3:44 , 2014) ), tous deux disponibles via la plateforme BioJS , ainsi que 3 ) les plugins Cytoscape pour la génération de réseaux et de voies biologiques ( Viper & Peanut ( . Garmhausen et al, BMC Genomics 16 : 790, 2015) ) .

viPEr-networks of Statin-treated human hepatocytes. (A) Focus network of all differentially regulated genes upon Atorvastatin treatement and direct Atorvastatin targets. (B) Focus networks based on same data between the Transcription Factors FoxA1/A2/A3 and all the main Atorvastatin target, HMGCR.

 

Analyse de séquences distantes – prédiction de motifs de novo et détection d’orthologie dans la zone d’ombre
Notre point de vue sur l’évolution darwinienne indique que cette dernière est le résultat de changements aléatoires de notre code génétique combiné avec le processus de sélection naturelle. De nombreux changements mineurs sur une longue période de temps ont un impact majeur sur l’évolution. Par conséquent, la similitude entre les séquences de deux gènes orthologues peut être est faible, ce que nous appelons conservation dans la zone d’ombre.

Détection de relations d’orthologie distantes
Notre équipe s’intéresse à la découverte de gènes ou protéines orthologues distants. L’identification de protéines orthologues est l’une des tâches essentielles en biologie computationnelle : il est nécessaire de connaître les orthologues d’une protéine afin d’en comprendre son évolution. Les orthologues nous disent aussi si une protéine conservée au sein des espèces modèles est impliquées au-delà des  territoires connus.

Les orthologues sont également importants pour la recherche à la paillasse : nous transférons des informations fonctionnelles grâce aux relations d’orthologie et pouvons donc fournir de nouvelles hypothèses à tester sur la fonction d’une protéine.

Le niveau de conservation de séquence, même entre orthologues, peut parfois être en dessous de la limite de détection par les logiciels standard et les paramètres utilisés.

Nous avons abordé ce problème et développé un service web, morFeus (Wagner, et al, BMC Bioinformatics 15 (1), 263, 2014;. Utilisation gratuite ici : http://bio.biochem.mpg.de/morfeus/) pour la détection d’orthologues dans la zone d’ombre de similarité de séquence.

Nous comparons les représentations binaires pondérées des alignements de séquences à partir de résultats de BLAST et clustérisons les scores en fonction de leur similarité. Des recherches itératives réciproques par BLAST sont effectuées pour vérifier l’orthologie. La requête mais aussi la connaissance d’autres orthologues permettent d’établir des liens d’orthologie et d’inclure ces résultats pour relancer les recherches réciproques par BLAST. La dernière étape permet la création d’un réseau d‘orthologie avec un calcul de score (centrality scoring) indépendant de la E-value du BLAST pour des orthologues putatifs. Nous avons comparé morFeus à HomoloGene et Inparanoid et avons obtenu une sensibilité nettement plus élevée avec une spécificité égale.

Figure legend: morFeus network of orthology for fission yeast Apc13, a subunit of the anaphase Promoting Complex.

 

Découverte de motifs de novo dans les séquences protéiques
Les motifs protéiques sont définis comme des unités fonctionnelles autonomes. Ils sont généralement composés de 3 à 23 acides aminés et ont différentes fonctions dans les protéines. Ils peuvent servir de sites de clivage, sont nécessaires pour la dégradation protéosomale, sont impliqués dans l’amarrage et la liaison du ligand, servent de signaux de modification post-traductionnelle ou sont des signaux pour la localisation subcellulaire. Sans information au préalable sur la localisation ou la nature du motif et de fait de leur petite taille et d’un manque de conservation évident entre les séquences, ces motifs sont très difficiles à trouver de novo. Nous cherchons à identifier des motifs fonctionnels courts dans les protéines de novo. Nous effectuons des comparaisons de profils d’évolution restrictifs pour détecter des motifs communs dans un ensemble de protéines non apparentées. En collaboration avec les chercheurs en laboratoire, nous testons expérimentalement nos motifs prédits.

Découverte de motifs structurels courts dans les structures tridimensionnelles des protéines
Proche des méthodes basées sur les séquences, nous cherchons des motifs structuraux dans les protéines. Pouvons-nous prédire des patchs potentiels à la surface des protéines, responsables des interactions protéiques ou des interactions protéine-ligand ? Nous utilisons des méthodes statistiques pour identifier des motifs potentiels, structuraux et fonctionnels, dans les structures tridimensionnelles des protéines.


Main publications

PUBLICATION

Hypermethylation of gene body CpG islands predicts high dosage of functional oncogenes in liver cancer

Arechederra M, Daian F, Yim A, Bazai SK, Richelme S, Dono R, Saurin AJ, Habermann BH, Maina F.
Nat Commun. 2018 Aug 8;9(1):3164. doi: 10.1038/s41467-018-05550-5. PMID: 30089774

PUBLICATION

A transcriptomics resource reveals a transcriptional transition during ordered sarcomere morphogenesis in flight muscle.

Spletter ML, Barz C, Yeroslaviz A, Zhang X, Lemke SB, Bonnard A, Brunner E, Cardone G, Basler K, Habermann BH, Schnorrer F.
Elife. 2018 May 30;7. pii: e34058. doi: 10.7554/eLife.34058. PMID: 29846170

PUBLICATION

Integrative analysis and machine learning on cancer genomics data using the Cancer Systems Biology Database (CancerSysDB).

Krempel R, Kulkarni P, Yim A, Lang U, Habermann B, Frommolt P.
BMC Bioinformatics. 2018 Apr 24;19(1):156. doi: 10.1186/s12859-018-2157-7. PMID: 29699486

PUBLICATION

The deregulated microRNAome contributes to the cellular response to aneuploidy.

Dürrbaum M, Kruse C, Nieken KJ, Habermann B, Storchová Z.
BMC Genomics. 2018 Mar 14;19(1):197. doi: 10.1186/s12864-018-4556-6. PMID: 29703144

PUBLICATION

SLALOM, a flexible method for the identification and statistical analysis of overlapping continuous sequence elements in sequence- and time-series data

Prytuliak R, Pfeiffer F, Habermann BH.
BMC Bioinformatics. 2018 Jan 26;19(1):24. doi: 10.1186/s12859-018-2020-x. PMID: 29373955

PUBLICATION

The axolotl genome and the evolution of key tissue formation regulators.

Nowoshilow S, Schloissnig S, Fei JF, Dahl A, Pang AWC, Pippel M, Winkler S, Hastie AR, Young G, Roscito JG, Falcon F, Knapp D, Powell S, Cruz A, Cao H, Habermann B, Hiller M, Tanaka EM, Myers EW.
Nature. 2018 Jan 24. doi: 10.1038/nature25458. PMID: 29364872

PUBLICATION

The complete and fully assembled genome sequence of Aeromonas salmonicida subsp. pectinolytica and its comparative analysis with other Aeromonas species: investigation of the mobilome in environmental and pathogenic strains.

Pfeiffer F, Zamora-Lagos MA, Blettinger M, Yeroslaviz A, Dahl A, Gruber S, Habermann BH.
BMC Genomics. 2018 Jan 5;19(1):20. doi: 10.1186/s12864-017-4301-6. PMID: 29304740

PUBLICATION

HH-MOTiF: de novo detection of short linear motifs in proteins by Hidden Markov Model comparisons

Roman Prytuliak, Michael Volkmer, Markus Meier, Bianca H. Habermann
Nucleic Acids Res. 2017 Apr 29. PMID: 28460141

PUBLICATION

Revision and reannotation of the Halomonas elongata DSM 2581T genome.

Pfeiffer F, Bagyan I, Alfaro-Espinoza G, Zamora-Lagos MA, Habermann B, Marin-Sanguino A, Oesterhelt D, Kunte HJ.
Microbiologyopen. 2017 Aug;6(4). PMID: 28349658

PUBLICATION

A Guide to Computational Methods for Predicting Mitochondrial Localization.

Sun S, Habermann BH.
Methods Mol Biol. 2017;1567:1-14. PMID: 28276009

PUBLICATION

Oh Brother, Where Art Thou? Finding Orthologs in the Twilight and Midnight Zones of Sequence Similarity

Habermann BH.
Evolutionary Biology: Convergent Evolution, Evolution of Complex Traits, Concepts and Methods (Springer): pp393-419

PUBLICATION

Virtual pathway explorer (viPEr) and pathway enrichment analysis tool (PEANuT): creating and analyzing focus networks to identify cross-talk between molecules and pathways.

Garmhausen M, Hofmann F, Senderov V, Thomas M, Kandel BA, Habermann BH.
BMC Genomics. 2015 Oct 14;16:790. PMID: 26467653

PUBLICATION

Tools for visualization and analysis of molecular networks, pathways, and -omics data.

Villaveces JM, Koti P, Habermann BH.
Adv Appl Bioinform Chem. 2015 Jun 4;8:11-22. PMID: 26082651

PUBLICATION

Merging and scoring molecular interactions utilising existing community standards: tools, use-cases and a case study.

Villaveces JM, Jiménez RC, Porras P, Del-Toro N, Duesbury M, Dumousseau M, Orchard S, Choi H, Ping P, Zong NC, Askenazi M, Habermann BH, Hermjakob H.
Database (Oxford). 2015 Feb 4;2015. PMID: 25652942

PUBLICATION

morFeus: a web-based program to detect remotely conserved orthologs using symmetrical best hits and orthology network scoring.

Wagner I, Volkmer M, Sharan M, Villaveces JM, Oswald F, Surendranath V, Habermann BH.
BMC Bioinformatics. 2014 Aug 6;15:263. PMID: 25096057

PUBLICATION

KEGGViewer, a BioJS component to visualize KEGG Pathways.

Villaveces JM, Jimenez RC2, Habermann BH.
F1000Res. 2014 Feb 13;3:43. PMID: 24715980

PUBLICATION

PsicquicGraph, a BioJS component to visualize molecular interactions from PSICQUIC servers.

Villaveces JM, Jimenez RC, Habermann BH.
F1000Res. 2014 Feb 13;3:44. PMID: 25075287

PUBLICATION

Designing efficient and specific endoribonuclease-prepared siRNAs.

Surendranath V, Theis M, Habermann BH, Buchholz F.
Methods Mol Biol. 2013;942:193-204. PMID: 23027053

PUBLICATION

HMMerThread: detecting remote, functional conserved domains in entire genomes by combining relaxed sequence-database searches with fold recognition.

Bradshaw CR, Surendranath V, Henschel R, Mueller MS, Habermann BH.
PLoS One. 2011 Mar 10;6(3):e17568. PMID: 21423752

PUBLICATION

SeLOX--a locus of recombination site search tool for the detection and directed evolution of site-specific recombination systems.

Surendranath V, Chusainow J, Hauber J, Buchholz F, Habermann BH.
Nucleic Acids Res. 2010 Jul;38(Web Server issue):W293-8. PMID: 20529878

PUBLICATION

Genome-wide resources of endoribonuclease-prepared short interfering RNAs for specific loss-of-function studies.

Kittler R*, Surendranath V*, Heninger AK, Slabicki M, Theis M, Putz G, Franke K, Caldarelli A, Grabner H, Kozak K, Wagner J, Rees E, Korn B, Frenzel C, Sachse C, Sönnichsen B, Guo J, Schelter J, Burchard J, Linsley PS, Jackson AL, Habermann B#, Buchholz F#. * - equal contribution; # - co-corresponding authors
Nat Methods. 2007 Apr;4(4):337-44. PMID: 17351622

PUBLICATION

ProFAT: a web-based tool for the functional annotation of protein sequences.

Bradshaw CR, Surendranath V, Habermann B.
BMC Bioinformatics. 2006 Oct 23;7:466. PMID: 17059594

PUBLICATION

An Ambystoma mexicanum EST sequencing project: analysis of 17,352 expressed sequence tags from embryonic and regenerating blastema cDNA libraries.

Habermann B#, Bebin AG, Herklotz S, Volkmer M, Eckelt K, Pehlke K, Epperlein HH, Schackert HK, Wiebe G, Tanaka EM#. # - co-corresponding authors
Genome Biol. 2004;5(9):R67. Epub 2004 Aug 13. PMID: 15345051

PUBLICATION

DEQOR: a web-based tool for the design and quality control of siRNAs.

Henschel A, Buchholz F, Habermann B.
Nucleic Acids Res. 2004 Jul 1;32(Web Server issue):W113-20. PMID: 15215362

PUBLICATION

The BAR-domain family of proteins: a case of bending and binding?

Habermann B.
EMBO Rep. 2004 Mar;5(3):250-5. PMID: 14993925

PUBLICATION

The power and the limitations of cross-species protein identification by mass spectrometry-driven sequence similarity searches.

Habermann B, Oegema J, Sunyaev S, Shevchenko A.
Mol Cell Proteomics. 2004 Mar;3(3):238-49. PMID: 14695901
Other publications

PUBLICATION

High-resolution TADs reveal DNA sequences underlying genome organization in flies.

Ramírez F, Bhardwaj V, Arrigoni L, Lam KC, Grüning BA, Villaveces J, Habermann B, Akhtar A, Manke T.
Nat Commun. 2018 Jan 15;9(1):189. doi: 10.1038/s41467-017-02525-w. PMID: 29335486

PUBLICATION

Structure of a Cytoplasmic 11-Subunit RNA Exosome Complex.

Kowalinski E, Kögel A, Ebert J, Reichelt P, Stegmann E, Habermann B, Conti E.
Mol Cell. 2016 Jul 7;63(1):125-34. doi: 10.1016/j.molcel.2016.05.028. PMID: 27345150

PUBLICATION

Secretory cargo sorting by Ca2+-dependent Cab45 oligomerization at the trans-Golgi network.

Crevenna AH, Blank B, Maiser A, Emin D, Prescher J, Beck G, Kienzle C, Bartnik K, Habermann B, Pakdel M, Leonhardt H, Lamb DC, von Blume J.
J Cell Biol. 2016 May 9;213(3):305-14. doi: 10.1083/jcb.201601089. PMID: 27138253

PUBLICATION

Human Holliday junction resolvase GEN1 uses a chromodomain for efficient DNA recognition and cleavage.

Lee SH, Princz LN, Klügel MF, Habermann B, Pfander B, Biertümpfel C.
Elife. 2015 Dec 18;4. pii: e12256. http://www.pubmed.com/26682650/

PUBLICATION

The RNA-binding protein Arrest (Bruno) regulates alternative splicing to enable myofibril maturation in Drosophila flight muscle.

Spletter ML, Barz C, Yeroslaviz A, Schönbauer C, Ferreira IR, Sarov M, Gerlach D, Stark A, Habermann BH, Schnorrer F.
EMBO Rep. 2015 Feb;16(2):178-91. PMID: 25532219

PUBLICATION

MTERF1 binds mtDNA to prevent transcriptional interference at the light-strand promoter but is dispensable for rRNA gene transcription regulation.

Terzioglu M, Ruzzenente B, Harmel J, Mourier A, Jemt E, López MD, Kukat C, Stewart JB, Wibom R, Meharg C, Habermann B, Falkenberg M, Gustafsson CM, Park CB, Larsson NG.
Cell Metab. 2013 Apr 2;17(4):618-26. doi: 10.1016/j.cmet.2013.03.006. PMID: 23562081

Membres more

  Fabio Marchianò   Soukaïna Timouma
Bianca Habermann
Fermer la fenêtre
Bianca Habermann

Chercheur

Fermer la fenêtre
Rikesh Jain

Ingénieur / Technicien

Fabio Marchianò
Fermer la fenêtre
Fabio Marchianò

Ingénieur / Technicien

Fermer la fenêtre
Michaël Pierrelée

Doctorant

Soukaïna Timouma
Fermer la fenêtre
Soukaïna Timouma

Ingénieur / Technicien