Wu Enhui, Qiao Liang*
Odjel za kemiju, Sveučilište Fudan, Šangaj 200433, Kina
Mikroorganizmi su usko povezani s ljudskim bolestima i zdravljem. Kako razumjeti sastav mikrobnih zajednica i njihove funkcije glavno je pitanje koje treba hitno proučiti. Posljednjih godina metaproteomika je postala važno tehničko sredstvo za proučavanje sastava i funkcije mikroorganizama. Međutim, zbog složenosti i visoke heterogenosti uzoraka mikrobne zajednice, obrada uzorka, prikupljanje podataka spektrometrije mase i analiza podataka postali su tri glavna izazova s kojima se trenutno suočava metaproteomika. U metaproteomičkoj analizi često je potrebno optimizirati prethodnu obradu različitih vrsta uzoraka i usvojiti različite sheme mikrobnog odvajanja, obogaćivanja, ekstrakcije i lize. Slično proteomu jedne vrste, načini prikupljanja podataka spektrometrije mase u metaproteomici uključuju način prikupljanja podataka ovisno o podacima (DDA) i način prikupljanja podataka neovisno o podacima (DIA). Način prikupljanja podataka DIA može u potpunosti prikupiti informacije o peptidima uzorka i ima veliki razvojni potencijal. Međutim, zbog složenosti uzoraka metaproteoma, njegova analiza DIA podataka postala je veliki problem koji sprječava dublje pokrivanje metaproteomike. U smislu analize podataka, najvažniji korak je izgradnja baze podataka sekvenci proteina. Veličina i cjelovitost baze podataka ne samo da imaju velik utjecaj na broj identifikacija, već također utječu na analizu na razini vrsta i na funkcionalnoj razini. Trenutačno je zlatni standard za konstrukciju baze podataka metaproteoma baza podataka proteinskih sekvenci temeljena na metagenomu. Istovremeno, dokazano je da metoda filtriranja javne baze podataka temeljena na iterativnom pretraživanju ima snažnu praktičnu vrijednost. Iz perspektive specifičnih strategija analize podataka, metode analize podataka DIA usmjerene na peptide zauzele su apsolutni mainstream. S razvojem dubokog učenja i umjetne inteligencije, uvelike će promicati točnost, pokrivenost i brzinu analize makroproteomske analize podataka. Što se tiče nizvodne bioinformatičke analize, posljednjih je godina razvijen niz alata za označavanje, koji mogu izvesti označavanje vrsta na razini proteina, peptida i gena kako bi se dobio sastav mikrobnih zajednica. U usporedbi s drugim omics metodama, funkcionalna analiza mikrobnih zajednica jedinstvena je značajka makroproteomike. Makroproteomika je postala važan dio multiomičke analize mikrobnih zajednica i još uvijek ima veliki razvojni potencijal u smislu dubine pokrivenosti, osjetljivosti detekcije i potpunosti analize podataka.
01 Predobrada uzorka
Trenutno se metaproteomska tehnologija naširoko koristi u istraživanju ljudskog mikrobioma, tla, hrane, oceana, aktivnog mulja i drugih područja. U usporedbi s analizom proteoma jedne vrste, prethodna obrada metaproteoma složenih uzoraka suočava se s više izazova. Mikrobni sastav u stvarnim uzorcima je složen, dinamički raspon brojnosti je velik, struktura stanične stijenke različitih vrsta mikroorganizama vrlo je različita, a uzorci često sadrže veliku količinu proteina domaćina i drugih nečistoća. Stoga je u analizi metaproteoma često potrebno optimizirati različite vrste uzoraka i usvojiti različite sheme mikrobnog odvajanja, obogaćivanja, ekstrakcije i lize.
Ekstrakcija mikrobnih metaproteoma iz različitih uzoraka ima određene sličnosti kao i neke razlike, ali trenutačno nedostaje jedinstveni proces prethodne obrade za različite vrste uzoraka metaproteoma.
02Skupljanje podataka spektrometrije mase
U analizi proteoma sačmarice, smjesa peptida nakon predtretmana prvo se odvaja u kromatografskoj koloni, a zatim ulazi u maseni spektrometar za prikupljanje podataka nakon ionizacije. Slično analizi proteoma pojedinačne vrste, načini prikupljanja podataka spektrometrije mase u analizi makroproteoma uključuju DDA način i DIA način.
S kontinuiranim ponavljanjem i ažuriranjem instrumenata za spektrometriju mase, instrumenti za spektrometriju mase s većom osjetljivošću i rezolucijom primjenjuju se na metaproteome, a dubina pokrivenosti analize metaproteoma također se kontinuirano poboljšava. Dugo se vremena niz instrumenata masene spektrometrije visoke razlučivosti na čelu s Orbitrapom naširoko koristio u metaproteomu.
Tablica 1 izvornog teksta prikazuje neke reprezentativne studije o metaproteomici od 2011. do danas u smislu vrste uzorka, strategije analize, instrumenta spektrometrije mase, metode prikupljanja, softvera za analizu i broja identifikacija.
03 Analiza podataka spektrometrije mase
3.1 Strategija analize podataka DDA
3.1.1 Pretraživanje baze podataka
3.1.2de novostrategija sekvenciranja
3.2 Strategija analize podataka DIA
04 Klasifikacija vrsta i funkcionalna oznaka
Sastav mikrobnih zajednica na različitim taksonomskim razinama jedno je od ključnih istraživačkih područja u istraživanju mikrobioma. Posljednjih godina razvijen je niz alata za označavanje vrsta za označavanje vrsta na razini proteina, peptida i gena kako bi se dobio sastav mikrobnih zajednica.
Bit funkcionalne anotacije je usporedba ciljanog proteinskog slijeda s bazom podataka o funkcionalnom proteinskom slijedu. Korištenjem baza podataka o funkciji gena kao što su GO, COG, KEGG, eggNOG, itd., različite funkcionalne anotacijske analize mogu se provesti na proteinima identificiranim makroproteomima. Alati za označavanje uključuju Blast2GO, DAVID, KOBAS itd.
05Sažetak i izgledi
Mikroorganizmi igraju važnu ulogu u ljudskom zdravlju i bolestima. Posljednjih godina metaproteomika je postala važno tehničko sredstvo za proučavanje funkcije mikrobnih zajednica. Analitički proces metaproteomike sličan je procesu proteomike jedne vrste, ali zbog složenosti predmeta istraživanja metaproteomike, potrebno je usvojiti specifične istraživačke strategije u svakom koraku analize, od prethodne obrade uzorka, prikupljanja podataka do analize podataka. Trenutno, zahvaljujući poboljšanju metoda predtretmana, stalnim inovacijama tehnologije masene spektrometrije i brzom razvoju bioinformatike, metaproteomika je postigla veliki napredak u dubini identifikacije i opsegu primjene.
U procesu predobrade uzoraka makroproteoma, prvo se mora uzeti u obzir priroda uzorka. Kako odvojiti mikroorganizme od stanica i proteina okoliša jedan je od ključnih izazova s kojima se suočavaju makroproteomi, a ravnoteža između učinkovitosti odvajanja i gubitka mikroba hitan je problem koji treba riješiti. Drugo, ekstrakcija proteina mikroorganizama mora uzeti u obzir razlike uzrokovane strukturnom heterogenošću različitih bakterija. Uzorci makroproteoma u tragovima također zahtijevaju posebne metode prethodne obrade.
Što se tiče instrumenata masene spektrometrije, glavni instrumenti masene spektrometrije prošli su prijelaz s masenih spektrometara temeljenih na analizatorima mase Orbitrap kao što su LTQ-Orbitrap i Q Exactive na spektrometre mase temeljenih na analizatorima mase s pokretljivošću iona povezanim s vremenom leta kao što je timsTOF Pro . TimsTOF serija instrumenata s informacijama o dimenziji mobilnosti iona ima visoku točnost detekcije, nisku granicu detekcije i dobru ponovljivost. Postupno su postali važni instrumenti u raznim istraživačkim poljima koja zahtijevaju detekciju spektrometrijom mase, poput proteoma, metaproteoma i metaboloma jedne vrste. Vrijedno je napomenuti da je dugo vremena dinamički raspon instrumenata masene spektrometrije ograničavao dubinu pokrivenosti proteina istraživanja metaproteoma. U budućnosti, instrumenti masene spektrometrije s većim dinamičkim rasponom mogu poboljšati osjetljivost i točnost identifikacije proteina u metaproteomima.
Za prikupljanje podataka spektrometrije mase, iako je način prikupljanja podataka DIA naširoko prihvaćen u proteomu jedne vrste, većina trenutnih analiza makroproteoma još uvijek koristi način prikupljanja podataka DDA. Način prikupljanja podataka DIA može u potpunosti dobiti informacije o fragmentu iona uzorka, au usporedbi s načinom prikupljanja podataka DDA, ima potencijal za potpuno dobivanje informacija o peptidu uzorka makroproteoma. Međutim, zbog velike složenosti DIA podataka, analiza podataka DIA makroproteoma još uvijek se suočava s velikim poteškoćama. Očekuje se da će razvoj umjetne inteligencije i dubinskog učenja poboljšati točnost i potpunost analize podataka DIA.
U analizi podataka metaproteomike, jedan od ključnih koraka je izgradnja baze podataka sekvenci proteina. Za popularna područja istraživanja kao što je crijevna flora, mogu se koristiti baze podataka crijevnih mikroba kao što su IGC i HMP, a postignuti su dobri rezultati identifikacije. Za većinu drugih metaproteomskih analiza, najučinkovitija strategija izgradnje baze podataka i dalje je uspostavljanje baze podataka sekvenci proteina specifične za uzorak na temelju podataka metagenomskog sekvenciranja. Za uzorke mikrobne zajednice visoke složenosti i velikog dinamičkog raspona potrebno je povećati dubinu sekvenciranja kako bi se povećala identifikacija vrsta s malom zastupljenošću, čime se poboljšava pokrivenost baze podataka sekvenci proteina. Kada nedostaju podaci o sekvenciranju, može se koristiti iterativna metoda pretraživanja za optimizaciju javne baze podataka. Međutim, iterativno pretraživanje može utjecati na kontrolu kvalitete FDR-a, pa rezultate pretraživanja treba pažljivo provjeriti. Nadalje, primjenjivost tradicionalnih FDR modela kontrole kvalitete u metaproteomičkoj analizi još uvijek vrijedi istražiti. U smislu strategije pretraživanja, strategija hibridne spektralne knjižnice može poboljšati dubinu pokrivenosti DIA metaproteomike. Posljednjih godina, predviđena spektralna biblioteka generirana na temelju dubokog učenja pokazala je superiorne performanse u DIA proteomici. Međutim, baze podataka metaproteoma često sadrže milijune unosa proteina, što rezultira velikim opsegom predviđenih spektralnih biblioteka, troši puno računalnih resursa i rezultira velikim prostorom za pretraživanje. Osim toga, sličnost između sekvenci proteina u metaproteomima jako varira, što otežava osiguranje točnosti modela predviđanja spektralne biblioteke, tako da predviđene spektralne biblioteke nisu naširoko korištene u metaproteomici. Osim toga, potrebno je razviti nove strategije za zaključivanje proteina i klasifikacijske anotacije za primjenu u metaproteomičkoj analizi proteina vrlo sličnih sekvencama.
Ukratko, kao tehnologija istraživanja mikrobioma u nastajanju, metaproteomska tehnologija je postigla značajne istraživačke rezultate i također ima ogroman razvojni potencijal.
Vrijeme objave: 30. kolovoza 2024