Abstract
Bakgrunn
Det har vært mye interesse for å skille syke og normale prøver ved hjelp av biomarkører avledet fra massespektrometri (MS) studier. Imidlertid har biomarkør identifikasjon for spesifikke sykdommer blitt hindret av ureproduserbarhet. Nærmere bestemt, en topp-profil ekstrahert fra et datasett for biomarkør identifikasjon er avhengig av en data pre-prosesseringsalgoritme. Til nå har ingen allment akseptert enighet er nådd.
Resultater
I denne artikkelen har vi undersøkt konsistensen av biomarkør identifikasjon ved bruk av forskjellig uttrykt (DE) topper fra topp profiler produsert av tre utbredt gjennomsnittlig spektrum avhengig pre-prosesseringsalgoritmer basert på SELDI-TOF MS data for prostata og brystkreft. Våre resultater avdekket to viktige faktorer som påvirker konsistensen av DE topp identifisering ved hjelp av ulike algoritmer. En faktor er at noen DE topper valgt fra en topp-profil ikke ble påvist som topper i andre profiler, og den andre faktoren er at den statistiske kraften til å identifisere DE topper i store topp profiler med mange topper kan være lav på grunn av det store omfanget av testene og lite antall prøver. Videre demonstrerte vi at DE toppdeteksjon kraft i store profiler kan forbedres ved den stratifiserte falsk funnraten (FDR) kontroll tilnærming, og at reproduserbarheten av DE toppdeteksjon kan derved økes.
Konklusjoner
Sammenligning og vurdering av pre-prosesseringsalgoritmer i form av reproduserbarhet kan belyse sammenhengen mellom ulike algoritmer og også hjelpe i å velge en pre-prosessering algoritmen. De topper valgt fra liten topp profiler med få topper for et datasett har en tendens til å være reproduserbart påvises i store topp profiler, noe som antyder at en egnet forbehandling algoritme bør være i stand til å produsere topper tilstrekkelig for å identifisere nyttige og reproduserbare biomarkører.
Citation: Zou J, Hong G, Guo X, Zhang L, Yao C, Wang J et al. (2011) Reproduserbar Cancer biomarkører i SELDI-TOF MS Bruke forskjellige pre-prosessering algoritmer. PLoS ONE 6 (10): e26294. doi: 10,1371 /journal.pone.0026294
Editor: William C.S. Cho, Queen Elizabeth Hospital, Hong Kong
mottatt: 07.06.2011; Godkjent: 24 september 2011; Publisert: 14 oktober 2011
Copyright: © 2011 Zou et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av Natural Science Foundation National of China (30970668, 81071646, 91029717) (https://www.nsfc.gov.cn/Portal0/default106.htm), utmerket Youth Foundation i Heilongjiang-provinsen (JC200808) (http: //jj.hljkj.cn/qn/), Foundation Natural Science of Heilongjiang-provinsen i Kina (QC2010012) (https://jj.hljkj.cn/zr/index.htm), og Scientific Research Fund of Heilongjiang Provincial undervisningsavdeling (11541156). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
proteomikk teknologier basert på massespektrometri (MS) [1] har i økende grad blitt metoden for valg for identifisering av biomarkører som er nyttige for å skille syke og normale prøver [2], [3], [4] . Imidlertid, i likhet med mikromatrise studier [5], [6], ved bruk av MS-teknikker for å identifisere sykdoms biomarkører er blitt hindret av ureproduserbarhet [7], [8]. For eksempel, de biomarkører identifisert i fire prostata kreft studier er svært forskjellige [8]. Nylig, Callesen
et al
. [7] viste at bare 10 av 207 biomarkører rapportert i 15 MS-baserte brystkreftstudier ble påvist i mer enn 2 studier. Dette ureproduserbarhet reiser spørsmål om den biologiske betydningen og kliniske implikasjoner av de oppdagede biomarkører.
Mange faktorer, slik som utvalgets behandling og driftsprosedyrer for eksperimenter, kan påvirke reproduserbarhet av sykdoms biomarkører [9], [10] , [11], [12], [13], [14], [15]. Viktigere, valgt data pre-prosessering algoritmen for å produsere topp profiler kan i stor grad påvirke biomarkør identifikasjon [16]. Noen studier har forsøkt å finne den optimale pre-prosesseringsalgoritme for detektering av toppene [17], [18], [19]. Men inntil nå, ingen allment akseptert er oppnådd enighet. For eksempel, basert på simulerte data med forhåndsdefinerte sanne topper, Cruz-Marcelo
et al
. [17] og Emanuele
et al
. [18] vurderte flere algoritmer både når det gjelder følsomhet (definert som andel av sanne topper som ble korrekt identifisert) og spesifisitet (definert som den falske funnraten (FDR)). Disse to studiene nådde forskjellige konklusjoner på de tre algoritmer som de begge evaluert, som var MassSpecWavelet [20], Cromwell [21] og kommersiell programvare produsert av Ciphergen Biosystems. Cruz-Marcelo
et al
. [17] rapporterte at disse algoritmene tilbudt høy følsomhet med en lav FDR, mens Emanuele
et al
. [18] viste at de hadde lav sensitivitet og et lavt FDR. Denne konflikt kan ha blitt innført ved forskjeller i deres simulerte data, som generelt har en tendens til å bli forspent til bestemte scenarier. En løsning for å unngå bias er å vedta reelle data i stedet for simulerte data. Dessverre, sammen med virkelige data, følsomheten og FDR av en algoritme kan ikke bli vurdert fordi de virkelige toppene er ukjent. Imidlertid kan pre-prosesseringsalgoritmer sammenlignes når det gjelder spissregistrering reproduserbarhet ved å vurdere peak overlapping. Spesielt, er reproduserbarheten et kritisk mål for validering av biologiske funn som er forskjellig fra sensitivitet og spesifisitet [6], [22], [23], [24].
I denne studien ved bruk av virkelige prostata og brystcancer data, først evaluert vi reproduserbarheten av toppdeteksjon mellom tre mye brukt pre-prosesseringsalgoritmer som gjenkjenner topper avhengig av gjennomsnittsspektrumet av alle de spektra (se
Methods
), inkludert SpecAlign [25], MassSpecWavelet [ ,,,0],20] og Cromwell [21]. Enda viktigere, vurderte vi ytterligere reproduserbarheten for påvisning av forskjellig uttrykt (DE) topper (ofte definert som biomarkører), som har vært et fokus for den biologiske samfunnet, men har ikke blitt fullstendig evaluert med enten simulerte eller reelle data. Våre resultater tyder på at antallet topper er oppdaget for et datasett varierer betydelig avhengig av forhåndsbehandlingsalgoritmen. Våre resultater viser også to viktige faktorer som påvirker konsistensen av DE topp identifisering ved hjelp av ulike pre-prosesseringsalgoritmer. Den første faktoren er at en topp-profil kan mangle DE toppene som finnes i en annen profil, noe som kan påvirke reproduserbarhet før valg av DE topper. Den andre faktor er at en stor topp-profil med mange topper kan lide av lav statistisk kraft for å identifisere DE toppene på grunn av det store omfanget av testen sammen med liten prøve nummer [26], [27], [28], [29] . Heldigvis Våre resultater tyder på at kraften av store topp profiler kan økes ved den stratifiserte FDR styre tilnærming [30]. Følgelig, DE topper valgt fra liten topp profiler har en tendens til å være reproduserbart påvises i store topp profiler. Basert på analyse av denne studien, foreslår vi at en passende pre-prosessering algoritme bør være i stand til å produsere topper tilstrekkelig for identifisering av nyttige og reproduserbare biomarkører.
Materialer og metoder
Kreft datasett
prostatakreft data som ble lastet ned fra https://www.evms.edu/vpc/seldi/, besto av duplikat spektra for 168 kreft og 81 normale serumprøver målt ved SELDI-TOF MS (IMAC -3 chips), med den masse-til-ladning (
m /z
) forhold varierende fra 0 til 200 kD [31]. Blodprøvene av diagnostisert stadium I-IV pasienter ble anskaffet fra Department of Urology, Eastern Virginia Medical School og prøver av friske menn ble hentet fra gratis screening klinikker er åpne for allmennheten (se detaljer i [31]). Serumprøver ble oppnådd fra Virginia Prostata senteret vev og kroppsvæske Bank. Brystkreft data, noe som er lastet ned fra https://bioinformatics.mdanderson.org/pubdata.html, besto av duplikat-spektrene for 26 kreft og 14 normale plasmaprøver målt ved SELDI-TOF MS (IMAC-Cu chip), med den
m /z
forhold i området fra 10 til 100 kDa [32]. Blodprøver ble oppnådd fra diagnostisert stadium I-III bryst karsinom pasienter og friske forsøkspersoner (se detaljer i [32]). Plasmaprøvene ble gjennomført på Nellie B. Connally Breast Center ved University of Texas MD Anderson Cancer Center.
For hvert par av duplikat spektra, de to spektrene var pre-behandlet separat og deretter gjennomsnitt å produsere en konsensus profil. Vurderer målestøy og gjenkjenning begrensninger, vi bare brukte disse toppene i
m /z
spekter av 1-10 kDa for brystkreft og 2-40 kDa for prostatakreft i våre analyser som i de originale papirene [31 ], [32].
data~~POS=TRUNC pre-prosesseringsalgoritmer
Som vist i figur 1, SELDI-TOF-MS-data er vanligvis forbehandlet ved flere trinn inkludert denoising (glatting), baseline subtraksjon, normalisering, peak deteksjon, clustering av topper og topp kvantifisering [17]. De tre algoritmene analysert i denne studien detektere toppene tilsvarende den gjennomsnittlige spekteret av alle spektrene, og pre-prosesseringsprosedyrer er beskrevet nedenfor. De spesifikke parameterinnstillingene som brukes for hver algoritme kan finnes i tekst S1.
(A) Raw spektrum. (B) Glattet spektrum. Grunnlinjen anslås utifra glattet spekteret er representert som den grå linjen. (C) Normalisert spektrum. Grunnlinjen trekkes fra den utjevnede spekteret. Da er grunnlinjen korrigert spektrum normalisert. Toppene oppdaget basert på normalisert spekteret vises i sirkler.
(1). SpecAlign [25] pre-prosesser data som følger: a) spektrum glatting bruker Savitzky-Golay filter; b) trekke grunnlinjen anslått av en behersket glidende gjennomsnitt; c) Reskalere intensiteter til positive verdier ved å gjøre den minste verdien 0; d) normalisering intensiteter for å la alle spektra har samme total ion strøm; e) å generere en gjennomsnittlig spekteret; f) ved hjelp av hurtig Fourier-transformasjon (FFT) /kortvarig tilpasnings kombinert metode for å tilpasse de detekterte toppene av individuelle spektra for de som er identifisert i den gjennomsnittlige spektrum; og g) plukke topper. Standardhøydeforhold som tjente som signal-til-støy-forhold (SNR) var 1,5.
(2). Den MassSpecWavelet pakke for toppdeteksjon [20] kombinert med prosessen pakke for topp kvantifisering [33] (angitt MSW /PRO). MassSpecWavelet har blitt rapportert å ha høy følsomhet med en lav FDR til toppdeteksjons [17]. Men det betyr ikke tallfeste de oppdagede topper. Dermed er basert på arbeid av Cruz-Marcelo
et al
. [17], brukte vi prosessen for å kvantifisere topper oppdaget av MassSpecWavelet. MassSpecWavelet detekterer topper ved hjelp av den kontinuerlige bølgetransformasjonen på den gjennomsnittlige spektrum av alle spektrene. For hvert spektrum, subtraherer prosess grunnlinjen, som er beregnet ved lineær interpolering, normaliseres deretter intensitetene ved å bruke median arealet under kurvene for alle spektrene, og til slutt kvantifiserer de detekterte toppene av individuelle spektra av det lokale maksimum innenfor de forhåndsdefinerte intervallet . Standard SNR for toppdeteksjon var 3.
(3). Cromwell [21] pre-behandler data ved a) å beregne et gjennomsnitt spekteret; b) denoising gjennomsnittlig spekteret av undecimated diskret wavelet transform; c) å korrigere intensiteter for den gjennomsnittlige spekteret ved å subtrahere basislinjen, som beregnes ved hjelp av en monoton kurve minimum; d) å finne topper med lokale maksimal intensitet for den gjennomsnittlige spekteret; e) gjentagelse av b) og c) for hvert spektrum, normal intensiteter med gjennomsnittlig total ionestrøm, og kvantifisering av toppintensitetene ved hjelp av den maksimale innenfor intervallene som definerer toppene i gjennomsnitt spektrum; og f) trekke ut topper med en brukerdefinert SNR. Standard SNR ble satt til 5, i henhold til anbefaling av utviklerne.
Utgangen av en pre-prosessering algoritmen er en topp profil for datasettet, som består av de oppdagede topper og deres tilsvarende intensitet i hvert spektrum. For enkelhets skyld, peak profiler produsert av SpecAlign, MSW /PRO og Cromwell er betegnet SpecAlign profil, MSW /PRO profil og Cromwell profil, henholdsvis.
To topper med en
m /z
ratio forskjellen innenfor et skift rekkevidde kan tilsvare den samme biologiske molekyl [17], [34]. I denne studien brukte vi forskyvningsverdiområder på ± 0,1%, ± 0,2% og ± 0,3%, og resultatene var tilsvarende. For enkelhets skyld, vi bare presenterer resultatene basert på de mest brukte skift intervall på ± 0,3% [17],.
Fordi optimalisering mål for spissregistrering ikke er definert i reelle data, standard parameterinnstillingene for pre -prosessutstyr algoritmer brukes for å detektere toppene i de fleste applikasjoner. Men noen studier kan tune SNR for å finne mer eller mindre topper [17], [18], [35], [36]. Dermed kan vi på samme måte innstilt SNR i vår studie for å sammenligne pre-prosesseringsalgoritmer. I tillegg, fordi en lavere SNR kan oppdage mer ekte og nyttige topper, vi hovedsakelig regnes som den nederste av de to SNR når du sammenligner en algoritme med en annen (se detaljer i
Diskusjon
).
påvisning av dE topper og konsistens score
Student
t
-test ble benyttet for å vurdere betydningen av forskjellene mellom intensiteten betyr av kreft og normale prøver. For flere testing korreksjon, vi brukte Benjamini-Hochberg prosedyre for å kontrollere FDR på et gitt nivå [37].
Konsistensen av to topplistene ble målt ved PO (prosentandel av overlappinger) scorer [38] . Enn liste 1 med
l
1 topper og liste 2 med
l
2 topper dele
k
topper, da PO score fra liste 1 ( eller 2) å liste 2 (eller 1) er
PO
12 =
k Twitter /
l
1 (eller
PO
21 =
k Twitter /
l
2). Fordi PO resultatet avhenger listelengder vi også beregnes den normaliserte PO stillingen (
n
PO), som er definert som den andel av den observerte stillingen utover mulighet til det tilsvarende maksimalt potensial stillingen utover mulighet [38 ] 🙁 1) (2) hvor E (PO
12) (eller E (PO
21)) ble beregnet som gjennomsnittet av PO
12 (eller PO
21) score for 1000 par av topplistene (med lengder
l
1 og
l
2) hentet tilfeldig fra de to rå
m /z
lister. Blant resultatet for 1000 tilfeldige par av topplistene,
p
-verdi av å observere PO poengsum ved tilfeldig sjanse ble beregnet som andel av resultatet ikke mindre enn den observerte poengsum.
den PO (
n
PO) score mellom to lister over dE topper ble beregnet ved den samme tilnærmingen som beskrevet ovenfor, bortsett fra at en dE toppen ble definert som blir delt av to lister bare dersom det ble regulert i samme retning i begge topp profiler [38]. E (PO) ble evaluert med DE topplistene tilfeldig trukket ut fra de to topp profiler. Her presenterer vi PO (
n
PO) score fra kortere liste til lengre liste og vurdere graden at kortere liste dekkes av lengre liste.
Vi betegne PO (
n
PO) score fra toppene oppdaget av algoritmen
En
til de oppdaget av algoritmen
B
som PO
AB (
n
PO
AB), mens PO
DE
AB (
n
PO
DE
AB) er for DE topper.
Stratifisert FDR kontroll tilnærming
i storskala testing med gjeldende flere test justeringer, kan strømmen minker når antall tester øker [27], [30], [39]. For å øke kraften, har en lagdelt FDR kontroll tilnærming foreslått [24]. Som et bevis på prinsipp, analyserte vi om konsistensen av DE toppdeteksjon kan økes ved å forbedre evnen til å identifisere DE topper i store topp profiler med stratifisert FDR kontroll tilnærming, som er basert på antagelsen om at topper med stor fold endring ( FC) verdier kan være mer sannsynlig å være sanne DE topper [40]. Først påføres vi k-means algoritme for å partisjonere toppene i
k
grupper, ved å minimere summen av de kvadrerte euklidske avstanden mellom FC verdien for hver topp og dens nærmeste klynge sentrum [41]. Den optimale
k
ble valgt som den skillevegg som resulterer i en maksimal gjennomsnittssilhuett av verdier, som måler hvor like en topp er til andre topper i sin egen gruppe, sammenlignet med de i en annen gruppe [42]. Så, på et bestemt FDR kontrollnivå, valgte vi DE topper i hver gruppe. Siden det ikke er overlapping mellom funnene fra ulike grupper, FDR av integrerte resultatene er fortsatt mindre enn den gitte FDR nivå [30].
Resultater
reproduserbarhet av toppdeteksjons
i det følgende blir resultatene for hver algoritme var basert på standard SNR, med mindre annet er nevnt. For prostatakreft datasettet, ble 31 og 53 topper oppdaget av henholdsvis SpecAlign og MSW /PRO, og alle av dem ble inkludert i de 420 toppene oppdaget av Cromwell. Videre evaluerte vi reproduserbarheten av toppdeteksjon ved bruk av samme antall topper ved å redusere SNR av en av de to algoritmer. Men selv med de laveste SNR av 1 og 0,1 tillatte for SpecAlign og MSW /PRO, henholdsvis bare 130 og 90 topper ble oppdaget. De fleste ble inkludert i toppene oppdages av Cromwell med PO
SC (
n
PO
SC) og PO
MC (
n
PO
MC) score så høyt som 1 (1) og 0,93 (0,93), henholdsvis (figur 2A). For sammenligningen mellom SpecAlign og MSW /PRO, PO
SM (
n
PO
SM) score var 0,84 (0,84). Når SNR ble redusert til 1,27, SpecAlign detektert samme antall topper (53) som MSW /PRO, men at resultatet ble redusert til 0,74 (0,73) (figur 2A).
(A) For prostatakreft og (B) for brystkreft. Reproduserbarhet ble evaluert mellom en algoritme (
x
-aksen etikett) med ulike SNR og en annen (tittel) med standard SNR. Standard SNRs for SpecAlign, MSW /PRO og Cromwell var 1,5, 3 og 5, henholdsvis. De fylte trekanter representerer antall topper (høyre
y
-aksen) oppdaget av algoritmen, som er vist med
x
-aksen etiketten. All PO (
n
PO) score var betydelig høyere enn forventet ved en tilfeldighet (
p
2.2E-11).
For brystkreft datasett , 19 og 47 topper ble identifisert ved henholdsvis SpecAlign og MSW /PRO, og alle av dem ble inkludert i de 287 toppene oppdaget av Cromwell. Videre, som vist i figur 2B, selv etter reduksjon av SNR for den laveste tillatte verdier for SpecAlign og MSW /PRO, bare 104 og 52 topper, henholdsvis, ble detektert, og alle av dem ble påvist ved Cromwell. Konsistensen poengsum mellom SpecAlign og MSW /PRO var ikke høy, med en PO
SM (
n
PO
SM) score på 0,68 (0,68). Etter at SNR ble redusert til 1,181, SpecAlign oppdaget det samme antall topper (47) som MSW /PRO, og PO
SM (
n
PO
SM) score redusert til 0,55 (0,55 ) (figur 2B).
resultatene ovenfor tyder på at når du bruker standard SNR for hver algoritme i disse to datasettene, SpecAlign og MSW /PRO har en tendens til å være mindre følsom på topp deteksjon enn Cromwell. Alle av de detekterte topper også en tendens til å bli detektert ved Cromwell. Cromwell fortsatt kunne fange opp nesten alle toppene oppdaget av SpecAlign og MSW /PRO når SNRs av de to sistnevnte mindre følsomme algoritmer ble senket.
reproduserbarhet av DE toppdeteksjon
Vi har evaluert reproduserbarhet DE topp identifikasjon i rush profiler produsert av ulike pre-prosesseringsalgoritmer. For prostatakreft datasettet ble 27 og 24 de topper valgt fra SpecAlign og MSW /PRO-profiler, henholdsvis med en 10% FDR kontroll. De fleste av disse var også til stede i 229 DE topper identifisert fra Cromwell profil, og PO
DE
SC (
n
PO
DE
SC) og PO
DE
MC (
n
PO
DE
MC) score var 0,81 (0,62) og 0,96 (0,92), henholdsvis. Selv om alle toppene i SpecAlign profilen var inkludert i Cromwell profilen, ble mer enn 10% av de valgte DE toppene ikke er inkludert i DE topper som finnes i Cromwell profilen. Etter at SNRs ble redusert for SpecAlign og MSW /PRO, konsistens mellom DE topper fra disse to peak profiler og de av Cromwell profilen gått noe ned (figur 3A og 3B). Konsistensen mellom 27 og 24 de topper oppdaget i SpecAlign og MSW /PRO-profiler var relativt lav, med en PO
DE
MS (
n
PO
DE
MS) score på 0,54 (0,31). Men etter SNR ble redusert for SpecAlign, økt ledelse til 0,79 (0,61) som flere topper ble inkludert i det utvidede SpecAlign profil og ble oppdaget som DE topper (Figur 3C).
(A), ( B), (C) for prostatakreft og (D) for brystkreft. Reproduserbarhet ble evaluert mellom en algoritme (
x
-aksen etikett) med ulike SNR og en annen (tittel) med standard SNR. Standard SNRs for SpecAlign, MSW /PRO og Cromwell er 1,5, 3 og 5, henholdsvis. De topper ble valgt med en 10% FDR kontroll. De fylte diamanter representerer antall DE topper (til høyre
y
-aksen) oppdaget ved hjelp av algoritmen vist av
x
-aksen etiketten. All PO
DE (
n
PO
DE) score var betydelig høyere enn forventet ved en tilfeldighet (
p
7.0E-3)
.
For brystkreft datasettet, med en 10% FDR kontroll, bare 2 dE topper ble valgt fra SpecAlign profil, og de ble inkludert i 8 dE topper valgt fra MSW /PRO-profil med en PO
dE
SM (
n
PO
DE
SM) score på en (1). Etter at SNR ble redusert til SpecAlign, ble lignende resultater observert (figur 3D). Det ble imidlertid ikke DE topper valgt fra Cromwell profilen.
To viktige faktorer påvirker konsistensen av DE peak identifikasjon
Vår analyse avdekket to viktige faktorer som kan påvirke konsistensen av DE topp identifikasjon ved hjelp forskjellige pre-prosesseringsalgoritmer. Den første faktor er at noen DE topper valgt fra en topp-profil ikke kan inngå i en annen topp-profil. For eksempel, for prostatakreft datasettet, med en 10% FDR kontroll, 11 av de 24 de toppene som er identifisert fra MSW /PRO-profil ble ikke inkludert i SpecAlign profilen. Spesielt etter at SNR av SpecAlign redusert til 1,27, 6 av disse 11 DE topper ble inkludert i SpecAlign profil og valgt som DE topper, noe som førte til økt reproduserbarhet (figur 3C). Tydeligvis denne faktoren påvirker i stor grad konsistensen av DE peak identifikasjon. Den andre faktoren er at den statistiske kraften til å identifisere DE topper i ulike peak profiler varierer. Dermed kan noen topper som deles av to topp profiler bli oppdaget som DE topper i en profil, men ikke i en annen. Den statistisk styrke kan påvirkes av mange variabler, for eksempel peak kvantifisering, antall topper for testing, utvalgsstørrelsen, andelen av sanne positive og FDR kontrollnivå [6], [26], [27], [28 ]. Her har vi analysert hovedsakelig virkningene av antall tester og prøvestørrelsen på strømmen.
Først må vi brukt et eksempel for å illustrere effekten av antall tester. I brystkreft datasettet, på en 10% FDR kontrollnivået, ble det ikke DE topper detekteres i hele Cromwell profilen, som besto av 287 topper. Men når de vurderer en subprofile av Cromwell profil sammensatt av alle toppene som inngår i MSW /PRO profil, ble 6 DE topper oppdaget og de var alle med i åtte DE topper identifisert i MSW /PRO-profil. Spesielt,
t
-test
p
-verdi cutoff for å erklære betydning basert på Benjamini-Hochberg FDR prosedyre [37] var 0,013, men det redusert til 0,0003 i hele Cromwell profil, som resulterte i null makt for å finne DE topper (dvs. ingen DE topper ble funnet). På samme måte, når man vurderer en subprofile av Cromwell profil sammensatt av alle toppene i SpecAlign profilen, 2 DE topper ble påvist på 10% FDR kontrollnivå, og de var identiske til de to DE toppene som er identifisert fra SpecAlign profilen.
for å illustrere effekten av utvalgsstørrelsen, vi tilfeldig samplet undergrupper på ulike sample size nivåer fra prostatakreft datasett av 249 prøver. Ved hver prøvestørrelse nivå, vi tilfeldig samplet 100 delsett med andelene av normale og kreft prøver i hvert delsett holdt identiske med de i den rå datasettet. Som utvalgsstørrelsen økt, antall DE topper valgt med 10% FDR kontroll i toppen profilen produseres av hver pre-prosessering algoritmen økt, noe som indikerer at kraften til å oppdage DE topper økt (figur 4). Følgelig konsistensen av DE topper valgt å bruke de forskjellige pre-prosesseringsalgoritmer økt kraftig.
Standard SNR ble brukt for hver pre-prosessering algoritmen. Ved hver utvalgsstørrelsen ble gjennomsnittlig antall DE topper detekteres på en 10% FDR kontroll beregnet basert på 100 tilfeldig samplede undergrupper. De fylte kvadrater, trekanter og diamanter representerer gjennomsnittlig antall DE topper (til høyre
y
-aksen) oppdaget ved hjelp SpecAlign, MSW /PRO og Cromwell, henholdsvis.
Forbedring reproduserbarhet av økende statistisk styrke
Som vist ovenfor for brystkreft datasettet, fullstendig mangel på statistisk styrke for å identifisere dE topper i noen store topp profiler er en viktig faktor som påvirker konsistensen av dE peak gjenkjenning. Som et bevis på prinsipp, viste vi at evnen til å finne DE topper i Cromwell brystkreft profil kan forbedres ved stratifisert FDR kontroll tilnærming, noe som kan øke konsistens mellom de identifiserte DE topper og de utvalgte fra SpecAlign og MSW /PRO profiler. Bruke k-means algoritme som beskrevet i
Metoder
, ble de 287 toppene oppdaget i Cromwell profilen gruppert i 2 grupper. Den ene gruppen inneholdt 259 topper med lave FC verdier, og den andre gruppen inneholdt 28 topper med høy FC verdier. Med en lagdelt FDR nivå på 10%, ble totalt 16 DE topper oppdaget, som omfattet det meste av DE topper oppdaget i SpecAlign og MSW /PRO-profiler ved hjelp av standard SNRs med PO
DE
SC (
n
PO
DE
MC) og PO
DE
MC (
n
PO
DE
MC) av en (1) og 0,75 (0,74), respektivt. Ved å senke SNR for SpecAlign og MSW /PRO, ble tilsvarende resultater generelt oppnås (figur 5). Men etter SNR redusert til en for SpecAlign, PO
DE
SC (
n
PO
DE
SC) score var bare 0,5 (0,47). Dette resultatet indikerer at den lagdelte FDR kontroll tilnærming kan øke deteksjons makt, men det er fortsatt noen rom for forbedring.
Ved hjelp av Cromwell på standard SNR, den lagdelte FDR kontroll tilnærming oppdaget 16 DE topper på 10% nivå. For SpecAlign og MSW /PRO, var det enkle FDR kontroll tilnærming brukes til å velge DE topper. All PO
DE (
n
PO
DE) score var betydelig høyere enn forventet ved en tilfeldighet (
p
0,013). For en detaljert beskrivelse av figurene se legenden til figur 3.
Men med Cromwell prostatakreft profil, de lagdelte og enkle FDR kontroll tilnærminger hadde samme effekt (dvs. de oppdaget det samme DE topper). Dette resultatet kan være fordi kraften av den enkle FDR kontroll for å identifisere DE topper var allerede høy.
Sammenligning med biomarkører rapportert i den opprinnelige brystkreft studie
Totalt 5 DE toppene var rapportert i den opprinnelige studium av brystkreft datasett [32] i. I korthet, den pre-prosesseringsprosedyren anvendt i det opprinnelige papir inkludert Savitzky-Golay-filter, baseline subtraksjon, normalisering til den samme totale ionestrøm og utpakking av topper med SNR ikke mindre enn 3,0, og DE toppene ble valgt med en
t
-statistic poengsum 3,5. Vi vurdert om disse 5 DE toppene kan reproduseres ved hjelp av de tre forhåndsprosesseringsalgoritmer med standard SNR. Når SpecAlign algoritmen ble brukt, ble bare to av disse fem DE topper oppdaget som topper og deretter oppdaget som DE topper på 10% FDR kontroll. Bruke MSW /PRO-algoritmen, ble alle 5 DE topper identifisert som topper og deretter oppdaget som DE topper. Bruke Cromwell algoritmen, ble alle 5 DE topper oppdaget som topper, men ingen ble valgt som en DE topp på FDR nivå på 10% av den enkle FDR kontroll tilnærming. Men alle 5 DE topper ble inkludert i de 16 DE topper valgt å bruke Cromwell algoritmen på FDR nivå på 10% ved bruk av stratifisert FDR kontroll.
Diskusjoner
reproduserbarhet er av fundamental betydning for validering av biologiske funn fra high-throughput data. I MS-studier, kan pre-prosesseringsalgoritmer i stor grad påvirke biomarkører. Ved hjelp av biologiske data for kreft, vår studie viste at antallet topper er identifisert i et datasett varierer avhengig av pre-prosesseringsmetode. Det er også åpenbart at konsistensen av DE topp identifikasjon påvirkes av to viktige faktorer, fravær av noen DE topper i en annen topp-profil og redusert statistisk kraften i DE topp identifikasjon i profiler med et stort antall topper, men et lite antall prøver . Våre funn tyder på at DE topper valgt fra små peak profiler har en tendens til å være reproduserbart oppdaget i store profiler når nok strøm for å identifisere DE topper i store profiler oppnås gjennom kraftige statistiske metoder, for eksempel lagdelte FDR kontroll tilnærming. Analysene i denne studien kan bli utvidet til andre MS-baserte proteomikk teknologier. For eksempel, for tandem massespektrometri (MS /MS), bruk av ulike pre-prosesseringsalgoritmer for topp deteksjon og ulike søkemotorer for matching proteiner kunne produsere varierte proteinprofiler [43]. Dermed kunne de to faktorene avdekket i denne studien også påvirke konsistensen av biomarkør oppdagelse i MS /MS-studier.
Basert på en simuleringsstudie Cruz-Marcelo
et al
. [17] har foreslått at en kombinasjon av MassSpecWavelet og prosessen gir høy følsomhet med en lav FDR for toppdeteksjon. Men basert på vår analyse av reproduserbarhet av topp og DE peak deteksjon basert på to virkelige datasett, MSW /PRO algoritme (dvs. kombinasjonen av MassSpecWavelet og prosess) tendens til å oppdage færre topper enn Cromwell, som indikerte at det kan være mindre sensitive for toppdeteksjon og kan gå glipp av noen DE topper påvises ved hjelp av Cromwell.