Wu Enhui, Qiao Liang*
Afdeling Scheikunde, Fudan Universiteit, Shanghai 200433, China
Micro-organismen zijn nauw verwant aan ziekten en gezondheid bij de mens. Hoe we de samenstelling van microbiële gemeenschappen en hun functies kunnen begrijpen, is een groot probleem dat dringend moet worden bestudeerd. Metaproteomics is de afgelopen jaren een belangrijk technisch middel geworden om de samenstelling en functie van micro-organismen te bestuderen. Vanwege de complexiteit en hoge heterogeniteit van monsters van de microbiële gemeenschap zijn monsterverwerking, massaspectrometrie-gegevensverzameling en gegevensanalyse echter de drie belangrijkste uitdagingen geworden waarmee metaproteomics momenteel worden geconfronteerd. Bij metaproteomics-analyse is het vaak nodig om de voorbehandeling van verschillende soorten monsters te optimaliseren en verschillende microbiële scheidings-, verrijkings-, extractie- en lyseschema's toe te passen. Vergelijkbaar met het proteoom van een enkele soort, omvatten de massaspectrometrie-data-acquisitiemodi in metaproteomics de data-afhankelijke acquisitie (DDA) -modus en de data-onafhankelijke acquisitie (DIA) -modus. De DIA-gegevensverzamelingsmodus kan de peptide-informatie van het monster volledig verzamelen en heeft een groot ontwikkelingspotentieel. Vanwege de complexiteit van metaproteoommonsters is de DIA-gegevensanalyse ervan echter een groot probleem geworden dat de diepgaande dekking van metaproteomics belemmert. In termen van data-analyse is de belangrijkste stap de constructie van een eiwitsequentiedatabase. De omvang en volledigheid van de database hebben niet alleen een grote impact op het aantal identificaties, maar hebben ook invloed op de analyse op soort- en functioneel niveau. Momenteel is de gouden standaard voor de constructie van een metaproteoomdatabase een eiwitsequentiedatabase gebaseerd op het metagenoom. Tegelijkertijd is bewezen dat de filtermethode voor openbare databases, gebaseerd op iteratief zoeken, ook een grote praktische waarde heeft. Vanuit het perspectief van specifieke data-analysestrategieën hebben peptide-gecentreerde DIA-data-analysemethoden een absolute mainstream ingenomen. Met de ontwikkeling van deep learning en kunstmatige intelligentie zal dit de nauwkeurigheid, dekking en analysesnelheid van macroproteomische data-analyse aanzienlijk bevorderen. In termen van stroomafwaartse bio-informatica-analyse is de afgelopen jaren een reeks annotatiehulpmiddelen ontwikkeld, die soortannotatie kunnen uitvoeren op eiwitniveau, peptideniveau en genniveau om de samenstelling van microbiële gemeenschappen te verkrijgen. Vergeleken met andere omics-methoden is de functionele analyse van microbiële gemeenschappen een uniek kenmerk van macroproteomics. Macroproteomics is een belangrijk onderdeel geworden van de multi-omics-analyse van microbiële gemeenschappen, en heeft nog steeds een groot ontwikkelingspotentieel in termen van dekkingsdiepte, detectiegevoeligheid en volledigheid van data-analyse.
01Monstervoorbehandeling
Momenteel wordt metaproteomics-technologie op grote schaal gebruikt bij het onderzoek van het menselijk microbioom, de bodem, het voedsel, de oceaan, actief slib en andere gebieden. Vergeleken met de proteoomanalyse van een enkele soort, staat de monstervoorbehandeling van het metaproteoom van complexe monsters voor meer uitdagingen. De microbiële samenstelling in werkelijke monsters is complex, het dynamische bereik van de overvloed is groot, de celwandstructuur van verschillende soorten micro-organismen is heel verschillend en de monsters bevatten vaak een grote hoeveelheid gastheereiwitten en andere onzuiverheden. Daarom is het bij de analyse van het metaproteoom vaak nodig om verschillende soorten monsters te optimaliseren en verschillende microbiële scheidings-, verrijkings-, extractie- en lyseschema's toe te passen.
De extractie van microbiële metaproteomen uit verschillende monsters heeft zowel bepaalde overeenkomsten als enkele verschillen, maar momenteel ontbreekt er een uniform voorverwerkingsproces voor verschillende soorten metaproteoommonsters.
02Massaspectrometrie data-acquisitie
Bij shotgun-proteoomanalyse wordt het peptidemengsel na voorbehandeling eerst gescheiden in de chromatografische kolom en vervolgens na ionisatie de massaspectrometer binnengegaan voor gegevensverzameling. Net als bij de proteoomanalyse van een enkele soort, omvatten de massaspectrometrische gegevensverwervingsmodi bij macroproteoomanalyse de DDA-modus en de DIA-modus.
Met de voortdurende iteratie en update van massaspectrometrie-instrumenten worden massaspectrometrie-instrumenten met hogere gevoeligheid en resolutie toegepast op het metaproteoom, en wordt de dekkingsdiepte van metaproteoomanalyse ook voortdurend verbeterd. Een reeks massaspectrometrie-instrumenten met hoge resolutie onder leiding van Orbitrap wordt al lange tijd op grote schaal gebruikt in het metaproteoom.
Tabel 1 van de originele tekst toont enkele representatieve onderzoeken naar metaproteomics van 2011 tot heden in termen van monstertype, analysestrategie, massaspectrometrie-instrument, acquisitiemethode, analysesoftware en aantal identificaties.
03Massaspectrometriegegevensanalyse
3.1 DDA-data-analysestrategie
3.1.1 Zoeken in databases
3.1.2de nieuwesequencing strategie
3.2 DIA data-analysestrategie
04Soortenclassificatie en functionele annotatie
De samenstelling van microbiële gemeenschappen op verschillende taxonomische niveaus is een van de belangrijkste onderzoeksgebieden in het microbioomonderzoek. De afgelopen jaren is een reeks annotatiehulpmiddelen ontwikkeld om soorten op eiwitniveau, peptideniveau en genniveau te annoteren om de samenstelling van microbiële gemeenschappen te verkrijgen.
De essentie van functionele annotatie is het vergelijken van de doeleiwitsequentie met de functionele eiwitsequentiedatabase. Met behulp van genfunctiedatabases zoals GO, COG, KEGG, eggNOG, enz. kunnen verschillende functionele annotatieanalyses worden uitgevoerd op eiwitten die worden geïdentificeerd door macroproteomen. Annotatietools omvatten Blast2GO, DAVID, KOBAS, enz.
05Samenvatting en vooruitzichten
Micro-organismen spelen een belangrijke rol in de menselijke gezondheid en ziekte. De afgelopen jaren is metaproteomics een belangrijk technisch middel geworden om de functie van microbiële gemeenschappen te bestuderen. Het analytische proces van metaproteomics is vergelijkbaar met dat van proteomics van één soort, maar vanwege de complexiteit van het onderzoeksobject van metaproteomics moeten in elke analysestap specifieke onderzoeksstrategieën worden toegepast, van monstervoorbehandeling, data-acquisitie tot data-analyse. Dankzij de verbetering van de voorbehandelingsmethoden, de voortdurende innovatie van de massaspectrometrietechnologie en de snelle ontwikkeling van de bio-informatica heeft metaproteomics momenteel grote vooruitgang geboekt op het gebied van identificatiediepte en toepassingsbereik.
Bij het voorbehandelingsproces van macroproteoommonsters moet eerst rekening worden gehouden met de aard van het monster. Het scheiden van micro-organismen van omgevingscellen en eiwitten is een van de belangrijkste uitdagingen waarmee macroproteomen worden geconfronteerd, en de balans tussen scheidingsefficiëntie en microbieel verlies is een urgent probleem dat moet worden opgelost. Ten tweede moet bij de eiwitextractie van micro-organismen rekening worden gehouden met de verschillen die worden veroorzaakt door de structurele heterogeniteit van verschillende bacteriën. Macroproteoommonsters in het sporenbereik vereisen ook specifieke voorbehandelingsmethoden.
In termen van massaspectrometrie-instrumenten hebben reguliere massaspectrometrie-instrumenten een overgang ondergaan van massaspectrometers gebaseerd op Orbitrap-massa-analysatoren zoals LTQ-Orbitrap en Q Exactive naar massaspectrometers gebaseerd op ionenmobiliteitsgekoppelde time-of-flight-massa-analysatoren zoals timsTOF Pro . De instrumenten uit de timsTOF-serie met informatie over de afmetingen van de ionenmobiliteit hebben een hoge detectienauwkeurigheid, een lage detectielimiet en een goede herhaalbaarheid. Ze zijn geleidelijk belangrijke instrumenten geworden in een verscheidenheid aan onderzoeksgebieden waarvoor massaspectrometriedetectie vereist is, zoals het proteoom, metaproteoom en metaboloom van een enkele soort. Het is vermeldenswaard dat het dynamische bereik van massaspectrometrie-instrumenten lange tijd de eiwitdekkingsdiepte van metaproteoomonderzoek heeft beperkt. In de toekomst kunnen massaspectrometrie-instrumenten met een groter dynamisch bereik de gevoeligheid en nauwkeurigheid van eiwitidentificatie in metaproteomen verbeteren.
Voor massaspectrometrie-data-acquisitie, hoewel de DIA-data-acquisitiemodus op grote schaal is toegepast in het proteoom van een enkele soort, gebruiken de meeste huidige macroproteoomanalyses nog steeds de DDA-data-acquisitiemodus. De DIA-gegevensverzamelingsmodus kan de fragmentioninformatie van het monster volledig verkrijgen, en vergeleken met de DDA-gegevensverzamelingsmodus heeft deze het potentieel om de peptide-informatie van het macroproteoommonster volledig te verkrijgen. Vanwege de hoge complexiteit van DIA-gegevens wordt de analyse van DIA-macroproteoomgegevens echter nog steeds met grote moeilijkheden geconfronteerd. Verwacht wordt dat de ontwikkeling van kunstmatige intelligentie en deep learning de nauwkeurigheid en volledigheid van DIA-gegevensanalyse zal verbeteren.
Bij de data-analyse van metaproteomics is een van de belangrijkste stappen de constructie van een eiwitsequentiedatabase. Voor populaire onderzoeksgebieden zoals de darmflora kunnen darmmicrobiële databases zoals IGC en HMP worden gebruikt en zijn goede identificatieresultaten behaald. Voor de meeste andere metaproteomics-analyses is de meest effectieve databaseconstructiestrategie nog steeds het opzetten van een monsterspecifieke eiwitsequentiedatabase op basis van metagenomische sequencinggegevens. Voor microbiële gemeenschapsmonsters met een hoge complexiteit en een groot dynamisch bereik is het noodzakelijk om de sequentiediepte te vergroten om de identificatie van soorten met een lage overvloed te vergroten, waardoor de dekking van de eiwitsequentiedatabase wordt verbeterd. Wanneer sequentiële gegevens ontbreken, kan een iteratieve zoekmethode worden gebruikt om de openbare database te optimaliseren. Iteratief zoeken kan echter van invloed zijn op de FDR-kwaliteitscontrole, dus de zoekresultaten moeten zorgvuldig worden gecontroleerd. Bovendien is de toepasbaarheid van traditionele FDR-kwaliteitscontrolemodellen in metaproteomics-analyse nog steeds het onderzoeken waard. In termen van zoekstrategie kan de hybride spectrale bibliotheekstrategie de dekkingsdiepte van DIA-metaproteomics verbeteren. In de afgelopen jaren heeft de voorspelde spectrale bibliotheek gegenereerd op basis van deep learning superieure prestaties laten zien in DIA-proteomics. Metaproteoomdatabases bevatten echter vaak miljoenen eiwitgegevens, wat resulteert in een grote schaal van voorspelde spectrale bibliotheken, veel computerbronnen verbruikt en resulteert in een grote zoekruimte. Bovendien varieert de gelijkenis tussen eiwitsequenties in metaproteomen enorm, waardoor het moeilijk is om de nauwkeurigheid van het voorspellingsmodel van de spectrale bibliotheek te garanderen, dus voorspelde spectrale bibliotheken zijn niet op grote schaal gebruikt in metaproteomics. Bovendien moeten nieuwe strategieën voor eiwitinferentie en classificatie-annotatie worden ontwikkeld om toe te passen op metaproteomics-analyse van eiwitten met een hoge sequentie.
Samenvattend kan worden gezegd dat metaproteomics-technologie, als opkomende onderzoekstechnologie voor het microbioom, aanzienlijke onderzoeksresultaten heeft opgeleverd en ook een enorm ontwikkelingspotentieel heeft.
Posttijd: 30 augustus 2024