PLoS ONE: Bestemmelse av Minimum Training utvalgsstørrelsen for microarray-baserte Cancer Outcome Tippe-An Empirical Assessment

Abstract

Løftet av microarray teknologi i å gi prediksjon classifiers for kreft utfall estimering har blitt bekreftet av en rekke påviselige suksesser. Men påliteligheten av prediksjonsresultater stoler tungt på nøyaktigheten av statistiske parametre involvert i classifiers. Det kan ikke estimeres pålitelig med bare et lite antall opplærings prøver. Derfor er det av avgjørende betydning for å bestemme minimum antall treningsprøver og for å sikre den kliniske verdien av mikromatriser i kreft utfallet prediksjon. Vi evaluerte effekten av trening utvalgsstørrelse på modell ytelse i stor utstrekning basert på 3 store kreft microarray datasett som tilbys av den andre fasen av microarray Quality Control prosjekt (MAQC-II). En SSNR-baserte (skala fra signal-til-støy-forhold) protokollen ble foreslått i denne studien for et minimum av opplæring prøvestørrelse-bestemmelse. Eksterne validerings resultater basert på en annen 3 kreft datasett bekreftet at SSNR basert tilnærming ikke bare kunne bestemme minimum antall trenings prøver effektivt, men også gi en verdifull strategi for å estimere den underliggende resultatene for klassifikasjonsapparater på forhånd. Når oversatt til kliniske rutine programmer, ville SSNR-basert protokoll gir stor anvendelighet i microarray-baserte kreft utfallet prediksjon i å forbedre klassifikator pålitelighet

Citation. Shao L, Vifte X, Cheng N, Wu L, Cheng Y (2013) Fastsettelse av Minimum Training utvalgsstørrelsen for microarray-baserte Cancer Outcome Tippe-An Empirical Assessment. PLoS ONE 8 (7): e68579. doi: 10,1371 /journal.pone.0068579

Redaktør: Cynthia Gibas, University of North Carolina i Charlotte, USA

mottatt: 24 september 2012; Godkjent: 31 mai 2013; Publisert: 05.07.2013

Copyright: © 2013 Shao et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av Science Foundation National of China (30830121, 81173465) og Natural Science Foundation i Zhejiang-provinsen i Kina (R2080693) .Den finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet .

konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Nylige fremskritt i genuttrykk microarray teknologi har åpnet nye muligheter for bedre behandling av diverse sykdommer [1], [2], [3]. Et tiår med intensiv forskning på utviklings prediksjon classifiers har resultert i en rekke påviselige suksesser, særlig evnen til å forutsi ulike potensielle svar til en behandling [4]. For eksempel, det hjalp med behandling valg å forlenge overlevelsen tid og forbedre livskvaliteten til kreftpasienter. Bifall av MammaPrint ™ av US Food and Drug Administration (FDA) for klinisk bryst kreft prognose [5] illustrert løftet av mikromatriseteknologi i å tilrettelegge medisinsk behandling i fremtiden.

Flere nylig, mikromatriser Quality Control Prosjekt II (MAQC II) studie [6] bekreftet igjen at mikromatrisebasert prediksjon modeller kan brukes til å forutsi kliniske endepunkter hvis den er konstruert og anvendt på riktig måte. Imidlertid er påliteligheten av prediksjonsresultater støttet seg tungt på nøyaktigheten av statistiske parametere som er involvert i mikroarray klassifiserere, som ikke kan måles pålitelig fra et lite antall trenings prøver. Derfor ville det hjelpe ved å samle så mange kliniske prøver som mulig. Tatt i betraktning det faktum at forholdsvis sjeldne prøvene kliniske vev kan brukes for transkripsjonen profilering, er det en utfordring å estimere et passende antall treningsprøvene nok til å oppnå betydelig statistisk stilling.

Flere fremgangsmåter er blitt foreslått for prøve størrelsesbestemmelse, såsom stoppregel [7], strømanalysealgoritmen [8], parametrisk blanding modellerings kombinert med parametrisk bootstrapping [9], sekvensiell klassifisering prosedyre basert på martingale- sentralgrenseteoremet [10], den parametriske sannsynlighetsmodellen – basert metode [11], Monte Carlo, kombinert med approksimasjon metoder [12], og den algoritme basert på vektede montering av læringskurvene [13], etc. de fleste av de ovennevnte studiene var utforsk i naturen, og fokusert på forholdet mellom prøvestørrelse, meningsfull forskjell i midlere og kraft. Det er snarere mulig for disse fremgangsmåter for å fremstille enten en undervurderes eller prøvestørrelse, hvis en spesifikk varians og meningsfylt forskjell i mellom ble brukt [14]. Videre er statistiske modeller og /eller indekser brukt i ovennevnte metoder er ganske vanskelig å gjennomføre i reelle søknader, og er bare mulig når nok opplæring prøver er samlet inn. Dobbin et al. foreslått en utvalgsstørrelse beregningsmetode basert på standardiserte ganger endring, utbredelsen klasse og antall gener eller egenskaper på arrays [15]. Selv om en slik metode er ganske enkelt sammenlignet med tidligere tilnærminger, er det bare innrettet til å ta opp ex post facto bestemmelse av hvorvidt prøvestørrelsen er tilstrekkelig til å utvikle en klassifikator. Dermed noen problemer må løses før en enkel og effektiv metode for utvalgsstørrelsen estimering kunne utvikles.

Tidlig i 2005, Van Niel et al. har påpekt at det nødvendige antall treningsprøver bør bestemmes ved å vurdere kompleksiteten av diskriminering problem [16]. Standardisert ganger endring og utbredelsen klasse foreslått av Dobbin et al. er også i noen grad korrelert til klassifisering kompleksitet [15]. Popovici et al. videre vist at ytelsen til en genomisk prediktor bestemmes i stor grad av et samspill mellom utvalgsstørrelse og klassifisering kompleksitet [17]. I sammendraget, finne ut forholdet mellom utvalgsstørrelse, modell ytelse og klassifiseringen kompleksitet er til stor hjelp i å utvikle en brukervennlig utvalgsstørrelse planlegging protokollen.

Tre store microarray datasett med totalt 10 endepunkter gitt i MAQC-II [6] ble grundig evaluert for forholdet mellom trening utvalgsstørrelsen og utførelsen av bygget prediksjon klassifikasjonsapparater i denne studien. Det ble funnet at et minimum av opplæring utvalgsstørrelsen kan anslås ut fra iboende forutsigbarhet endepunkter, og vi foreslått en SSNR basert trinnvis estimering protokollen. Eksterne validerings resultater ved hjelp av et annet tre store datasett bekreftet evnen til denne protokollen. Sammenlignet med tidligere metoder, protokollen foreslått i denne studien har sine fordeler i følgende tre aspekter: For det første, er det lettere å gjennomføre og mye mer effektiv for kliniske applikasjoner; for det andre, er mindre før informasjonen som kreves, og dermed eksperimentell kostnadene kan bli bedre kontrollert; til slutt, det styrer den eksperimentelle design, i tillegg til ex post facto estimering av trening utvalgsstørrelsen.

Materialer og metoder

Datasett

Seks store kreft datasett har er samlet i denne studien for trening sample size estimering og eksterne valideringsformål. Tabell 1 illustrert en kortfattet oppsummering av de innsamlede datasettene, inkludert informasjon om utvalgsstørrelse og prøvefordeling

Tre datasett med 10 kliniske endepunkter -. Brystkreft (BR), multippel myelom (MM), neuroblastom (NB), anordnet i MAQC-II [6] ble valgt og anvendt i denne studie for å evaluere virkningen av treningen prøvestørrelsen på modell ytelse. For brystkreft, endepunkter BR-erpos og BR-PCR representerer østrogen reseptor status og suksess for behandling som involverer kjemoterapi etterfulgt av kirurgisk fjerning av en svulst, henholdsvis. For myelomatose, MM-EFS og MM-OS representerer overlevelse og total overlevelse etter 730 dager etter behandling av diagnose, mens NB-EFS og NB-OS representerer samme betydning etter 900 dager etter behandling eller diagnose. Videre endepunkter NB-PC og MM-PC, NB-NC og MM-NC ble også inkludert i denne studien som positive og negative kontroller, henholdsvis. NB-PC og MM-PC ble avledet fra NB og MM datasett med endepunktene merket med kjønn, mens endepunkter for NB-NC og MM-NC ble generert tilfeldig.

Ytterligere tre datasett, inkludert en non -hodgkin lymfom (NHL) [18] datasett og to brystkreft datasett (BR2 [19] og BR3 [20]) som brukes i tidligere publiserte prognostisk modelleringsstudier, ble anvendt i denne studien for ekstern validerings formål. NHL er relatert til overlevelse av non-Hodgkin lymfom [18] pasienter, mens BR2 og BR3 er relatert til østrogen reseptor status (BR2-erpos) [19] og 5-års metastase overlevelse (BR3-EFS) [ ,,,0],20] av brystkreftpasienter.

for å simulere den virkelige verden klinisk anvendelse av genomiske studier, to uavhengige populasjoner av pasienter for hvert datasett skapt av MAQC konsortium eller av de opprinnelige forskerne er beholdt i denne studien som opplæring og valideringssett. I tilfelle av BR2-erpos og BR3-EFS, var det ingen informasjon for prøve splitting. Således alle prøvene ble tildelt til trening og validering setter tilfeldig i denne studien. Mer detaljert informasjon om datasettene kan finnes i hoved papir av MAQC-II [6] og den tilsvarende originale papirer.

Statistical Analysis

Detaljert informasjon om studiedesign ble illustrert i Figur 1, mer informasjon om modellbygging prosedyren er tilgjengelig i Methods S1. Et datasett med en spesifikk prøvestørrelse ble først gjenvunnet fra den opprinnelige treningssett som nye treningsprøvene. Etter at modellkonstruksjon fra de hentede treningsprøvene ved hjelp av et 5-ganger kryssvalidering, den oppnådde

beste sorter

ble deretter brukt til å forutsi den opprinnelige valideringssettet. For å sikre statistisk styrke, ble en slik prosedyre gjentatt 100 ganger, noe som resulterer i 100 forskjellige sett av prediksjoner. Den gjennomsnittlige forutsigelse Resultatet ble deretter benyttet som en indikasjon på ytelsen modell som tilsvarer dette spesifikke prøvestørrelse. Antallet opplæring prøver vurderes i denne studien varierer fra 20 med et trinn av 20. Tre mest brukte maskinlæring algoritmer inkludert

NCentroid plakater (Nærmeste-Tyngdepunktet),

KNN product: (

k

-nearest naboer,

k

= 3) og

SVM plakater (Support Vector Machine) ble valgt i denne studien for å evaluere effekten av trening utvalgsstørrelsen.

arbeidsflyt for å evaluere effekten av ulikt antall opplæring prøver.

Basert på 100 drevne resultater, utviklingen av modellen ytelse (målt ved Matthews korrelasjonskoeffisient (MCC) [21] versus . trinnvis økning på trening utvalgsstørrelse er illustrert med whisker plot (5-95% persentil) The Matthews korrelasjonskoeffisient (MCC) er definert som: (1) hvor er antall sanne positive, er antall sanne negative, er det antallet av falske positiver, og er antallet av falske negativer. MCC varierer mellom -1 og +1 til 0 svarende til tilfeldige anslag.

Basert på 100-run MCC-verdier, har vi foreslått ytterligere en likning for å omtrentlig estimat den potensielle verdien av å øke størrelsen på utvalget, som vurderer både den relative forbedring av modellen ytelse og kostnaden ved å øke utvalgsstørrelsen. (2)

Her og representerer MCC verdi hentet fra

i

th og

(i-1)

th utvalgsstørrelsen, mens er antall opplæring prøver på

(i-1)

th trinn (

i = 2, …, n

). verdi mye mindre enn 1 ble anvendt i denne studien for å bistå i bestemmelse av nær-optimale klassifikator. Med andre ord, verdi kombinert med gjennomsnittet og variansen til MCC verdier ble til slutt brukt til å bestemme nær-optimal trening utvalgsstørrelsen.

Scale of Signal-til-støy-forhold (SSNR)

Anta microarray datasett

X

1 product: (

n

1

prøver og

p

gener) og

X

2 plakater (

n

2

prøver og

p

gener) ble profilert fra prøver i klasse 1 og klasse 2, henholdsvis. Signal-til-støy-forhold for

i

th gen (

i = 1,2, …, p

) reflekterer forskjellen mellom klassene i forhold til standardavvikene (SD) innenfor klassene, og kan bli presentert som følger [22] 🙁 3)

Her og betegne midlene og sikkerhetsdatablad av loggen av uttrykket nivåer av

i

th (

i = 1,2, …, p

) -genet i klasse 1 og klasse 2, henholdsvis. er ikke begrenset til [-1, 1], med store verdier for å indikere en sterk korrelasjon mellom genekspresjon og klassen skillet. Den tegn på å være positive og negative tilsvarer

i

th gen blir mer høyt uttrykt i klasse 1 eller 2. SSNR er numerisk skala fra for alle genene (

i = 1,2, … , p

) som representerer den numeriske forskjellen mellom den største positive, og de minste negativ-SNR verdier. Forutsatt at representerer vektorer av SNR verdier for alle genene i et datasett, kan SSNR defineres som følger: (4)

Resultater

Minimum Opplæring Prøvestørrelsen varierer med Endpoint Forutsigbarhet

Figur 2 viste utviklingen av modellen ytelsen versus trinnvis økning på trening utvalgsstørrelse for 10 punktene ved hjelp av

NCentroid

, med tilsvarende verdier er vist i tabell S1. To konklusjoner kan trekkes fra studien. For det første, opplæring utvalgsstørrelsen utøves tilsynelatende effekt på modellen ytelse for alle endepunkter unntatt negative kontroller. For det andre, den minimum antall trenings prøvene varierer med kompleksiteten i ulike endepunkter. For svært forutsigbare endepunkter (NB-PC, MM-PC og BR-erpos) med prediksjon MCC rundt eller større enn 0,8, 60 opplæring prøver er nok til å oppnå tilnærmet optimal prediksjon classifiers. Mens for endepunkter (NB-EFS, NB-OS, BR-PCR) med moderat prognose ytelse (MCC mellom 0,2 til 0,5), minst 120 opplæring prøver er nødvendig. For knapt forutsigbare endepunkter (MM-EFS og MM-OS), microarray-basert prediksjon modell (MCC rundt 0,1) er vanligvis ikke et godt valg i denne saken. I tilfelle når 120 prøvene er nødvendig, er det ingen mening å samle inn noen flere prøver på grunn av ubetydelig forbedring. For negative kontroller (NB-NC og MM-NC), prediksjonsmodeller mislykkes for alle opplæringsutvalgsstørrelser. Slike resultater utelukket muligheten for å få falske positive resultater. Tall S1 og S2 hentet fra

KNN Hotell og

SVM

bekreftet ovenfor resultatene.

Tippe MCC basert på ulikt antall opplæring prøver for 10 endepunkter bruker

NCentroid

.

SSNR korrelerer godt med Endpoint forutsigbarhet

resultatene ovenfor viser at et minimum av opplæring utvalgsstørrelsen som kreves for modell konstruksjon variert med endepunkt forutsigbarhet. Derfor er det av avgjørende betydning for å anslå endepunkt kompleksiteten i forkant av fastsettelse av nødvendig minimum antall trenings prøver. Vi foreslo en indeks SSNR i denne studien, og vurdert sin evne som en indikasjon på endepunkt forutsigbarhet. Figur 3 (a) viste sammenhengen mellom SSNR og modell forestilling basert på alle trenings prøver ved hjelp av

NCentroid

. Her kan vi se at SSNR korrelerer godt med modell ytelses (MCC verdier), med en Pearson korrelasjonskoeffisient på 0,897. Som en bekreftelse, vi videre byttet opprinnelige trening og valideringssett, og revurderes korrelasjonen mellom SSNR og endepunkt forutsigbarhet. Figur 3 (b) er vist tilsvarende resultater. En korrelasjon på 0,859 ytterligere bekreftet at SSNR korrelerer godt med endepunkt forutsigbarhet. En slik konklusjon ble ytterligere støttet av korrelasjonen mellom 0.875 og 0,864 for

KNN Hotell og 0,887 og 0,901 for

SVM

classifiers som vist i Figur S3.

ex post facto forholdet mellom SSNR verdier og endepunkt forutsigbarhet (prediksjon MCC) basert på (a) normal og (b) swap modellering ved hjelp av

NCentroid

på alle trenings prøver. Her grønn (a) og oransje søyler (b) representerer de SSNR verdier hentet fra originale trening og valideringssett, mens rektanglene møtt gule er tilsvarende prediksjon MCC verdier av modeller på originale validerings og opplæring prøver, henholdsvis.

SSNR Styrer Fastsettelse av Training Sample size

resultatene ovenfor bekreftet at SSNR var en gyldig estimering av endepunkt forutsigbarhet og det fungerer som grunnlag for opplæring utvalgsstørrelse estimering. Men slike resultater ble basert på ex post facto analyse ved hjelp av alle treningsprøver (langt mer enn 60 eller 120 seg), og etterlater det en uadressert spørsmålet om SSNR kunne lede opplæring sample size estimering i reelle søknader. Dermed vurderte vi videre muligheten for å bruke SSNR som en veiledning av opplæringsutvalgsstørrelse estimering fra følgende to aspekter: For det første, SSNR verdien ble inspisert basert på 60 eller 120 opplæring prøver for å se om det kan lykkes skille endepunkter med ulike prediksjon kompleksiteten; for det andre, ble effekten av SSNR bekreftet for beregning av minstekravet trening utvalgsstørrelse i reelle programmer som bruker tre eksterne validerings datasett.

Vi hentet tilfeldig 60 eller 120 prøver fra den opprinnelige treningssettet, konstruert prediksjon classifiers, spådde opprinnelig validering sett ved hjelp klassifikator, og deretter tatt opp tilsvarende SSNR og prediksjon MCC verdier. For å sikre statistisk styrke, ble en slik prosedyre gjentatt 100 ganger, noe som resulterer i 100 par SSNR og MCC verdier. Evnen til å differensiere SSNR i endepunktene med forskjellig kompleksitet ble så evaluert fra tilsvarende middelverdier og standardavvik (SDS). Figur 4 (a) demonstrerte forholdet mellom SSNR og MCC verdier ved hjelp av 60 treningsprøver basert på

NCentroid

. Vi kan se at SSNR kunne med hell skille de tre første enklere endepunkter (SSNR≥2) fra andre, mens noen åpenbar forskjell ble observert blant resten. Ekskludert de tre første endepunkter (NB-PC, MM-PC og BR-erpos), vi evaluert videre forholdet mellom SSNR og MCC for resten 7 punktene ved hjelp av 120 opplæring prøver. Som vist i figur 4 (b), ble de fem endepunkter med SSNR≥1 (NB-EFS, NB-OS, BR-PCR, MM-EFS og MM-OS) vellykket atskilt fra de andre to negative kontroller (SSNR 1 ) i denne saken. Derfor ble det bekreftet at SSNR kunne lede opplæring utvalgsstørrelse besluttsomhet effektivt. Tilsvarende resultater oppnådd fra

KNN Hotell og

SVM

vist i Figur S4 bekreftet ovenfor resultatene.

Forholdet mellom SSNR verdier og endepunkt forutsigbarhet (prediksjon MCC) basert på (en ) 60 og (b) 120 opplæring prøver å bruke

NCentroid

hhv. Her blå søylene og svarte stripene representerer midler og sikkerhetsdatablad av SSNR verdier i 100 repetisjoner, mens gule rektangler og røde søyler er midler og sikkerhetsdatablad av MCC verdier.

Videre foreslås en SSNR-basert protokoll for trening utvalgsstørrelse bestemmelse i denne studien. Først ble 60 opplæring prøver innsamlet og SSNR verdi ble vurdert. Hvis SSNR er større enn 2, er 60 opplæring prøver størrelse stor nok til å oppnå en nesten optimal forutsigelse modell. Ellers ble minst 120 opplæring prøver samlet og SSNR-verdien ble evaluert på nytt; Hvis SSNR verdi basert på 120 opplæring prøver var større enn 1, 120 opplæring prøver er nok for modell bygging av denne tiden. Ellers vil ytelsen prediksjon klassifikator anses som svært dårlig.

Tre eksterne validerings datasett (BR2-erpos, BR3-EFS og NHL) ble videre brukt for å bekrefte resultatene av ovennevnte protokoll i reelle søknader. For BR2-erpos, den SSNR verdi basert på 60 opplæring prøver (100 repetisjoner) nådde 2,16 ± 0,38 (større enn 2), og dermed 60 prøvene var nok i henhold til protokollen. For BR3-EFS, de SSNR verdier basert på 60 og 120 opplærings prøvene var 1,55 ± 0,23 ( 2) og 1,18 ± 0,11 ( 1), henholdsvis. Derfor ble 120 opplæring prøver er nødvendig for å oppnå en nesten optimal modell av denne tiden. For NHL, de SSNR verdier basert på 60 og 120 opplærings prøvene var 1,42 ± 0,22 ( 2) og 1,25 ± 0,13 ( 1), henholdsvis. Som for BR3-EFS ble minst 120 opplæring prøver nødvendig. Figur 5 (a-c), illustrert ytelsen prediksjon klassifikasjonsapparater bruker ulikt antall opplæring prøver for over validerings datasett. Det bekreftet resultatene nevnt ovenfor, og evnen til utvalgsstørrelsen besluttsomhet protokollen foreslått i denne studien.

Tippe MCC basert på ulikt antall opplæring prøver for tre eksterne validerings datasett.

diskusjon

Microarray data har vist utmerket overlegenhet i å hjelpe kreft utfallet estimering ved å gi prediksjon classifiers. Modellen pålitelighet er avhengig tungt på nøyaktigheten av statistiske parametre estimert fra opplæring prøver. Et lite antall opplærings prøver kan ikke gi en svært pålitelig prediksjon klassifikator. Derfor bestemme det nødvendige minimum antall opplæring prøver blir en viktig sak for klinisk anvendelse av mikromatriser. De fleste av dagens metoder er for komplekse til å bli utnyttet for rutinemessig anvendelse. Derfor foreslo vi en enkel SSNR basert tilnærming til trening utvalgsstørrelse bestemmelse i denne studien og illustrert sin nytteverdi basert på tre store microarray datasett gitt i MAQC-II. Resultatene på tre eksterne valideringssett bekreftet at SSNR-basert protokoll var mye enklere å implementere og mer effektiv for utvalgsstørrelse estimering i forhold til dagens statistiske metoder.

Tre viktige funn bør bemerkes i denne studien. For det første kan det sees på figur 2 at antallet opplæring prøver som utøves tydelig innvirkning på modell ytelse, og det minimale antall opplæring prøver som er nødvendig for modellkonstruksjon varieres med endepunkt forutsigbarhet. For det andre, korrelerer SSNR verdi godt med endepunkt forutsigbarhet med en korrelasjonskoeffisient rundt 0.9 (figur 3), som antydet muligheten for å bruke SSNR som en indikasjon på endepunkt forutsigbarhet. For det tredje ble en SSNR basert trinnvis funksjon foreslått i denne studien for å bestemme minimum antall treningsprøver basert på forholdet mellom trening utvalgsstørrelse, endepunkt forutsigbarhet, og SSNR verdi. Den diskrete forholdet mellom trening sample størrelsen og kompleksiteten av endepunkter ble også antydet av Mukherjee et al. tidlig i 2003 [23], noe som ytterligere støtter SSNR-basert bestemmelse tilnærming er foreslått i denne studien. Videre fant vi at den foreslåtte tilnærmingen kan også med hell utvides til toksikogenomikk (se figur S5).

En viktig del av denne studien er at tilliten til ovennevnte funnene ble også bekreftet av både interne og eksterne valideringsstrategier . For intern validering, to positive (NB-PC, MM-PC) og to negativ kontroll (NB-NC, MM-NC) datasett var avgjørende for å vurdere resultatene av klinisk relevante endepunkter mot det teoretiske maksimum og minimum ytelse levert av kontrollene . Spesifikt er mye høyere SSNR verdier for to positive kontrolldatasettene som er vist på figur 4 (a) bekreftet evnen til å bruke SSNR som en angivelse av endepunkt forutsigbarhet, mens den neglisjerbar innvirkning av trening prøvestørrelsen på modell ytelse i to negative kontroll datasett videre utelukker muligheten for å oppnå falske positive resultater. Dermed vil blant annet positive og negative kontroll datasett i slike analyser være til stor hjelp i å sikre påliteligheten av de endelige resultatene. Videre kan påliteligheten av en opplæringsprosess bare fastslås ved ekstern valideringsprøver. Derfor har de eksterne validerings datasett sammen med interne kontroller spilt en viktig rolle i å bekrefte evnen til SSNR basert opplæring utvalgsstørrelse besluttsomhet tilnærming i denne studien.

samme resultatene fra tre velkjente klassifiseringsmetoder som brukes i denne studien (dvs.

NCentroid

,

KNN og SVM

, med tilsvarende resultater er gitt i Figur 2 og Figur S1 og S2, henholdsvis) ytterligere bekreftet påliteligheten av SSNR basert opplæring sample size estimering nærme seg. Årsaken er ute av omfanget av denne studien. Men sams dette fenomenet av mangel på signifikante forskjeller mellom et stort antall klassifiseringsmetoder rapportert for microarray applikasjoner i form av prediksjon ytelse [24]. En lignende konklusjon ble også foreslått av MAQC-II [6]. Slike resultater vil være til hinder for begrensning av ulike klassifiseringsalgoritmer, og ytterligere utvide anvendelsen av SSNR basert opplæring utvalgsstørrelse besluttsomhet tilnærming.

overlegenhet og anvendelse av SSNR basert tilnærming kan oppsummeres som følger. For det første, fra et statistisk synspunkt, det var ikke partisk av fradrag prosedyrer ved å unngå avanserte statistiske beregninger. For det andre, med hensyn til kliniske rutinemessige anvendelser, er det mye mer enkel og effektiv, da det eneste krav er å samle 60 og /eller 120 samples og beregning av tilsvarende SSNR verdier. I mellomtiden kan det SSNR-basert protokoll gir også en verdifull strategi for å estimere for klassifikasjoner på forhånd. Tar eksterne validerings datasett som er vist i figur 5 som et eksempel, SSNR verdier er 2,16 ± 0,38 og 1,18 ± 0,11 for BR2-erpos, og BR3-EFS innebar også at resultatene av endelige prediksjon klassifikasjonsapparater i dette tilfellet ville være utmerket, og moderat henholdsvis.

Konklusjoner

Microarray teknologi kombinert med mønstergjenkjenning er påvist som en lovende strategi i å gi prediksjon classifiers for kreft diagnose, prognose og behandlingsrespons estimering og så videre. Sammenlignet med tradisjonelle erfaringsbaserte diagnose avhengig av komplekse biokjemiske testing og diverse bildesystemer, mikromatrisebasert prediksjon klassifiserere, hvis pålitelig konstruert av nok opplæring prøver, ville gi en mye mer objektiv, nøyaktig og gyldig avbildning av kreft utfall. Følgelig ville det SSNR basert opplæring utvalgsstørrelsen besluttsomhet tilnærming gir stor anvendelighet for klinisk anvendelse av mikromatriser i kreft utfallet vurdering ved å tilby en enkel og pragmatisk måte å beregne trening utvalgsstørrelsen. Videre det faktum at trening prøvestørrelse påvirker ytelsen av endelige prediksjon classifiers forstått betydningen av systematisk evaluering av hver prosedyre i modellen byggeprosessen og utvikle praktisk veiledning for microarray-baserte klasse sammenligning analyse ytterligere.

Hjelpemiddel Informasjon

Figur S1.

En ekstra tall for effekten av trening utvalgsstørrelse ved hjelp av

KNN

. Tippe MCC basert på ulikt antall opplæring prøver for 10 punktene ved hjelp av

KNN

doi:. 10,1371 /journal.pone.0068579.s001 plakater (TIF)

Figur S2.

En ekstra tall for effekten av trening utvalgsstørrelse ved hjelp av

SVM

. Tippe MCC basert på ulikt antall opplæring prøver for 10 punktene ved hjelp av

SVM

doi:. 10,1371 /journal.pone.0068579.s002 plakater (TIF)

Figur S3.

En ekstra tall for forholdet mellom SSNR og endepunkt forutsigbarhet basert på alle trenings prøver. Den ex post facto forholdet mellom SSNR verdier og endepunkt forutsigbarhet (prediksjon MCC) basert på normal og swap-modellering ved hjelp av

KNN Hotell og

SVM

på alle treningsprøver

doi:. 10,1371 /journal .pone.0068579.s003 product: (TIF)

Figur S4.

En ekstra tall for forholdet mellom SSNR og endepunkt forutsigbarhet basert på 60 og 120 opplærings prøver. Forholdet mellom SSNR verdier og endepunkt forutsigbarhet (prediksjon MCC) basert på (a) 60 og (b) 120 opplæring prøver å bruke

KNN Hotell og

SVM

henholdsvis

doi:. 10,1371 /journal.pone.0068579.s004 product: (TIF)

Figur S5.

En ekstra tall for effekten av trening utvalgsstørrelse for toxicogenomic datasett NIEHS

doi:. 10,1371 /journal.pone.0068579.s005 plakater (TIF)

Tabell S1.

Tilsvar v verdier for annen trening utvalgsstørrelse på 10 endepunkter ved hjelp av

NCentroid

doi:. 10,1371 /journal.pone.0068579.s006 plakater (docx)

Metoder S1 ..

doi: 10,1371 /journal.pone.0068579.s007 plakater (DOC)

takk

forfatterne ønsker å takke dataleverandører for å dele sine data og informasjon til MAQC Consortium.

Legg att eit svar