PLoS ONE: Skiftende fra populasjons utenfor til personlig Cancer Prognoser med Mikromatriser

Abstract

æra av personlig medisin for kreftbehandling har tatt et viktig skritt videre for å gjøre nøyaktige prognoser for individuelle pasienter med vedtakelsen av høy gjennomstrømming microarray teknologi. Imidlertid har mikromatriseteknologi i kreftdiagnose eller prognose er først og fremst brukes for statistisk evaluering av pasientgrupper, og dermed utelukker inter-individuell variasjon og pasientspesifikke spådommer. Her foreslår vi en beregning kalles klinisk tillit som fungerer som et mål på prognostisk pålitelighet for å lette overgangen fra befolkningen bred til personlig kreft prognose ved hjelp av microarray-basert prediktive modeller. Ytelsen til samplebaserte modeller spådd med ulike kliniske betroelser ble evaluert og sammenlignet systematisk ved hjelp av tre store kliniske datasett studerer følgende kreftformer: brystkreft, multippel myelom, og neuroblastom. Overlevelseskurver for pasienter med ulike betroelser, ble også avgrenset. Resultatene viser at det kliniske tilliten metrisk skiller pasienter med forskjellige nøyaktig prediksjon og overlevelsestider. Prøver med høy klinisk tillit var sannsynlig å ha nøyaktige prognoser fra prediktive modeller. Videre vil pasienter med høy klinisk tillit forventes å leve for et spesielt lengre eller kortere tid hvis deres prognose var bra eller dystre basert på modeller, henholdsvis. Vi konkluderer med at klinisk tillit kan tjene som en nyttig beregning for personlig kreft prognose prediksjon utnytte mikromatriser. Tillegge et sikkerhetsnivå til prognose med den kliniske tillit måltallet gir klinikeren en objektiv, personlig beslutningsgrunnlag for eksempel velger alvorlighetsgraden av behandling

Citation. Shao L, Vifte X, Cheng N, Wu L Xiong H, Fang H, et al. (2012) Giring fra populasjons utenfor til personlig Cancer Prognoser med Mikromatriser. PLoS ONE 7 (1): e29534. doi: 10,1371 /journal.pone.0029534

Redaktør: Christina Chan, Michigan State University, USA

mottatt: 20 juni 2011; Godkjent: 30 november 2011; Publisert: 25 januar 2012

Copyright: © 2012 Shao et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av Science Foundation National of China (nr 30801556 og 30830121), National S T Major Project (No. 2008ZX09312-001), Stiftelsen for kinesiske universitetet (No. 2009QNA7031) Science, og Foundation of Zhejiang Provincial Natural Science Kina (No. R2080693). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Ikke alle personer svare på medikamentell behandling på samme måte. Følgelig utvikling av tilpassede terapeutiske regimer som er optimalisert for den enkelte pasient representerer et hovedmål med 21

st-tallet medisin [1]. Moderne verktøy blir brukt til å hjelpe leger i effektiv behandling av pasienter som individer og tilby personlig narkotika intervensjon.

Inter-individuell variasjon i respons på behandling er sterkt påvirket av pasientens fysiologiske tilstand på tidspunktet for behandlingen. Denne tilstanden kan være preget av genuttrykk profiler [2]. Derfor kan mikromatriser lede valget av medikamenter eller terapeutiske regimer og anvendes for å vurdere i hvilken grad en pasient for visse sykdommer, slik at en personlig plan for forebygging overvåking og behandling [3]. De potensielle fordelene av mikromatriseteknologi i kliniske applikasjoner har blitt demonstrert av flere landemerke studier [4] – [7]. Microarray-baserte prediktive modeller (eller genomisk signaturer) har vist nytte i å knytte ulike undergrupper av brystkreft med distinkte kliniske utfall [8] – [13], som MammaPrint ™ [4], [5], en milepæl i microarray-baserte prognose for brystkreft [14]

utviklingen av en microarray-baserte prediktiv modell for svulst klassifisering innebærer vanligvis to sekvensielle trinn [4], [15] -. [17]. Først blir modell utviklet basert på et treningssett av pasienter med kjente klassemerker (f.eks tumorstatus) og genuttrykk data. Det neste er at opplæringsmodell validert ved hjelp av en valideringssett som inneholder pasienter med kjente klasse etiketter. Gyldigheten av opplæringsmodell i ytelse på valideringssettet har vært fokus for «klasse prediksjon» forskning. For å sikre opplæring modellen kan brukes i virkelige kliniske anvendelser, ble det foreslått at modellen må vurderes på et stort antall uavhengige utvalg i denne eksterne valideringsprosessen [18].

Det er viktig å oppmerksom på at ovennevnte eksterne godkjenningsstrategi vurderer resultatene fra en opplæringsmodell ved hjelp av en befolkning definert av valideringssettet. Den gjennomsnittlig ytelse (f.eks spesifisitet, sensitivitet) over befolkningen brukes til å vurdere om modellen kan være en pålitelig diagnostisk eller prognostisk test. Denne strategien er utført under den forutsetning at modellen utfører likt for alle uten hensyn til individuelle variasjoner. Dermed kan den gjennomsnittlige ytelsen basert på en populasjon av pasienter ikke sikre sin prediksjonsevne for den enkelte pasient, noe som kan resultere i potensielt upålitelige diagnoser eller prognoser i den virkelige verden søknad. Dette one-size-fits-all strategi må endres fra populasjons utenfor til personlig medisin i microarray data-baserte applikasjoner.

Vi foreslår en beregning kalles klinisk tillit som måler modellens pålitelighet i prediksjon ytelse på en individuell basis. Klinisk tillit kan være nyttig for å bestemme passende behandlinger; for eksempel kan pasienter med høy selvtillit og dårlig prognose gis strengere behandlinger. I tillegg kan pasienter med lavere kliniske betroelser være førsteklasses kandidater for videre evaluering av deres forhold med alternative metoder. Nøyaktigheten av den kliniske tillit metrisk ble undersøkt på tre store kliniske datasett med totalt seks kliniske endepunkter [19].

Vi har nærmere bestemt først deles hvert datasett i to, dvs. trening og valideringssettet. Å etterligne virkelige kliniske scenarier, gjorde vi valideringssettet som inneholder kun de pasienter som microarray data ble samlet inn på et senere tidspunkt enn de i treningssettet. Vi avledet klinisk tillit fra trenings modell, etterfulgt av vurderingen av dens korrelasjon med prediksjonsnøyaktigheten for prognose og overlevelsestiden for pasientene i valideringssettet. Så langt vi kjenner til, er dette første forsøk på å gi et mål på tillit til enkeltpasienter i microarray-baserte «class prediksjon» forskning, som er et viktig skritt fremover i personlig medisin.

Materialer og Metoder

datasett

Tre stor skala, kliniske kreft datasett ble brukt i denne studien: brystkreft (BR) [20], multippelt myelom (MM) [21], og neuroblastom (NB) [22]. En kortfattet oppsummering av datasettene er gitt i tabell 1. Mer detaljert informasjon om disse datasettene kan finnes i hoved papir av den andre fasen av microarray Quality Control prosjekt (MAQC-II) [19].

Hver datasett har to kliniske endepunkter relatert til kreft prognose (inkludert overlevelsesdata) eller behandling: BR-PCR og BR-erpos i behandlingsrespons datasettet, NB-EFS og MM-EFS i overlevelse datasettet, og NB -OS og MM-OS i total overlevelse datasett (tabell 1). Disse tre kliniske datasett ble studert i MAQC-II-prosjektet ledes av FDA [19]. For å etterligne en reell klinisk scenario i bruk genomiske signaturer, ble to uavhengige populasjoner av pasienter for hver av de tre kliniske datasett definert av MAQC Consortium som trening og valideringssett ved hjelp av en kronologisk tilnærming der prøvene i validerings settene ble generert på et senere tidspunkt enn de i treningssett. Utvalgsstørrelsene for opplæring sett varierte mellom 130 og 340, og forholdet mellom positive hendelser til negative hendelser varierte 0,18 til 1,60; i mellomtiden, utvalgsstørrelsene i valideringssett varierte 100-214, og forholdet mellom positive hendelser til negative hendelser varierte mellom 0,14 og 1,56.

To positive og to negative kontrollpunktene ble også brukt i denne studien. De positive kontrollpunktene, dvs. NB-PC og MM-PC, ble avledet fra NB og MM datasett separat, med prøvene merket med kjønn. For de to negative kontrollpunktene, dvs. NB-NC og MM-NC (som svarer til de NB og MM datasett, henholdsvis), ble prøve etiketter (dvs positive eller negative hendelser) tilfeldig generert. Ved hjelp av disse to kontrollene tillater oss å vurdere ytelsen til klinisk relevante endepunkter mot forventet maksimum og minimum ytelse levert av kontrollene.

Klinisk tillit

Den kliniske tillit måler tillit til en prøve blir tildelt en bestemt klasse av en prediktiv modell. For prøve

i

, sin kliniske tillit metrisk () er konfidensnivået av en prøve i å bli riktig tildelt av en prediktiv modell og er definert som: (1) Der og er likheten tiltak mellom prøven og prøvene i klasse 1 og klasse 2, henholdsvis. Likheten mål varierer i henhold til classifiers brukt. To godt studert classifiers for genuttrykk data ble benyttet i denne studien, dvs. Nærmeste-Tyngdepunktet klassifisering regelen (

NC

) [4] og

k

-nearest naboer (

KNN

,

k

= 5) [23]. For

NC

klassifikator, og ble definert som korrelasjonskoeffisientene av den ukjente prøven til centroids av klasse 1 og klasse 2, henholdsvis. Tyngdepunktet er definert som vektorer av de gjennomsnittlige uttrykksverdier. For

KNN

klassifikator, og er definert til å være antall nærmeste naboer til den ukjente prøven som tilhører klasse 1 og klasse 2, henholdsvis.

verdier mellom 0,5 og 1, hvor en verdi på 0,5 indikerer at prediksjonen skyldes tilfeldigheter. Stadig større verdier tilsvarer stadig høyere prediksjon tillit. For enkelhets skyld, ble all analyse basert på tre tillit nivåer: lav selvtillit (LC; 0.5≤≤0.6), middels sikkerhet (MC; 0,6 ≤0.8) og høy tillit (HC; 0,8 ≤1.0 )

Statistisk analyse

Den generelle analyse arbeidsflyten er avbildet i figur 1.; ytterligere detaljer er gitt i Methods S1. Analysen protokollen starter ved å utvikle en best klassifikator basert på treningssettet, og ender ved å forutsi valideringssettet. Den spådde klasse og tilsvarende kliniske betroelser er registrert i matriser

L Hotell og

C

, henholdsvis. For å sikre den statistiske gyldigheten, er prosedyren gjentas 500 ganger, noe som resulterer i 500 forskjellige klassifiserere fra opplæringssettene og 500 prediksjoner for valideringssettet. Ytelsen til både opplæringsmodeller og prediksjoner blir vurdert ved hjelp Matthews korrelasjonskoeffisient (MCC) [24], [25].

Flere detaljer er gitt i Methods S1.

En permutasjon testen ble også brukt for å sammenligne klassifiserings prediksjonsnøyaktigheten versus mulighet [26], [27]. I hver permutasjon ble for analyse er vist i figur 1 gjentatt med det unntak at klassemerker i treningssettet ble randomisert. Med andre ord, ble modeller konstruert med randomiserte treningssett benyttet for å forutsi valideringssett. Etter 500 repetisjoner, ble graden av sjansen sammenheng og forutsigbarhet endepunkter beregnet med Cohens

d product: [28], som måler den standardiserte forskjellen mellom to måter.

Resultater

den kryssvalidering ytelse måles i MCC-verdier for alle former for trening modeller sammen med den gjennomsnittlige prediksjon ytelse på valideringssett er oppsummert i tabell S1. Modellen ytelse følger rekkefølgen av NB-PC, MM-PC, BR-erpos, NB-EFS, NB-OS, BR-PCR, MM-EFS, MM-OS, MM-NC, og NB-NC. De to positive kontroller utført beste mens de to negative kontroller utføre verste, som er konsistent med forventninger fra forsøket design.

Klinisk tillit positivt korrelerer med resultatene

modell prediksjon

Vi først undersøkt modellen ytelse på valideringssettet for pasienter som faller inn i ulike kategorier av klinisk tillit. Som vist i figur 2, er en positiv sammenheng vist mellom prediksjonsnøyaktigheten og konfidensnivået for de seks kliniske og fire kontrollpunktene ved hjelp av

KNN

klassifikator. Blant de seks kliniske endepunkter, BR-erpos datasett viste den sterkeste korrelasjon. For BR-erpos, gjennomsnittlig MCC verdi spådommer med lav selvtillit (LC) var bare 0,19, mens den gjennomsnittlige MCC verdi betydelig økt til ca 0,78 som konfidensnivået nærmet 1. Dermed sammenlignet med den generelle MCC verdi (0,71) ( Tabell S1), klinisk tillit kunne med hell stå for inter-individuell variasjon i diskriminerende pasienter med lavere eller høyere enn gjennomsnittet prediksjon nøyaktighet.

The Circle radier er skalert til prosentandelen av totalt prøver i det kliniske sikkerhetsnivå. Tillit nivåer er «0,6», «0,8», og «1».

Det er klart at den iboende forutsigbarhet av genuttrykk profiler varierer for ulike endepunkter, som dokumentert av den gradvise nedgangen i bratt modell ytelse i seks kliniske endepunkter over ulike konfidensintervall (dvs. bakkene i figur 2, ble data vist i tabell S2) og antall prøver fordelt på ulike konfidensnivå regioner (dvs. markør størrelse i figur 2). Som vist i figur 3, ble en positiv lineær korrelasjon observert mellom helningen oppnådd fra figur 2 og den iboende forutsigbarhet (kvantifisert ved hjelp av Cohen

d product: [28]) av de seks kliniske og fire kontroll endepunkter. De forutsigbare endepunkter (f.eks BR-erpos, NB-EFS) tendens til å ha en større andel av pasientene (representert som markør størrelse i figur 2) i høy tillit regioner med høy prediksjonsnøyaktigheten enn mindre forutsigbare endepunkter (f.eks MM -EFS, MM-OS). Detaljert informasjon om prøvefordeling i hvert tillit regionen ble gitt i tabell S3. Disse observasjonene ble ytterligere bekreftet ved hjelp av en annen mønstergjenkjenning metode (dvs.

NC

) (figur S1 og S2), og også en annen prøve splitting strategi (80/20 deling, Figurer S4 og S5).

bakkene er hentet fra regresjonsanalyse basert på den lineære delen av tillit MCC kurve, mens Cohen

d

representerer iboende forutsigbarheten i datasettet.

resultatene viser at en høyere iboende forutsigbarhet av et sluttpunkt er relatert til en høyere prosentandel av pasienter som faller inn i høyere konfidensnivå ved bruk av mikromatrisebasert prediktive modeller. Som korrelasjonen av et genomisk signatur med en klinisk resultat er sjelden perfekt, kan den kliniske tillit være nyttig for å skille de pasienter i forskjellige grupper for dem bestemte behandlingsprosedyrer kan utvikles.

Forholdet av kliniske tillit med pasientens overlevelse tim

e

Vi vurderte også om klinisk tillit er forutsigbare for overlevelse for pasientene i valideringssettet. Pasientene ble delt i to grupper prognose (dvs. god og dårlig prognose) for både NB og MM datasett med endepunkter OS (total overlevelse) og EFS (overlevelse), henholdsvis (Methods S1). Figur 4 viser OS kurver for pasienter med ulike kliniske betroelser for både prognosegrupper. Pasienter med høy klinisk tillit utviste en øket overlevelsesrate ved god prognose gruppe og en minsket overlevelse i dårlig prognose gruppen, noe som indikerer at den kliniske tilliten forbedret nøyaktighet av prognose utledet fra de prediktive modeller. Inntak av MM-OS som et eksempel, er overlevelse tilsynelatende høyere for pasienter i god prognose gruppe med høy pålitelighet (HC) i forhold til de med lav (LC) (log-rank-test p-verdi 0,01) og middels (MC) de (log-rank test p-verdi 0,13), spesielt for hver dag mark mer enn 1000 dager (figur 4). For pasienter med dårlig prognose, mer enn 80% av de med lav klinisk tillit levd så lenge som 300 dager, mens ca 30% av pasientene for de med høye betroelser levde på den tiden, henholdsvis. Lignende tendenser ble også observert i NB-OS datasett.

Figur S3, som viser EFS kurver for pasienter med ulike kliniske betroelser, viser en lignende trend som OS kurvene vist i figur 4. Den positive korrelasjon mellom klinisk tillit med EFS rente er tydelig vist i figur S3c og s3D for pasienter med god prognose. Imidlertid er korrelasjonen mindre viktig for pasienter med dårlig prognose (fig S3a og S3b). Tilsvarende resultater for 80/20 splitting ble vist i figur S6 og S7, og likedannet med de ovennevnte observasjoner.

Resultatene viser at når pasientene ble gruppert i enten god eller dårlig prognose grupper av prediktive modeller , klinisk tillit kan karakterisere videre overlevelse av den enkelte pasient i hver prognose gruppe.

Diskusjoner

Flere befolkningsdekkende diagnostiske /prognostiske tester basert på genuttrykk er rapportert [4], [6], [7]. De populasjonsbaserte modellene gir bare en gjennomsnittlig indikasjon for befolkningen med tilsvarende gjennomsnittsbefolkningen nøyaktighet. I denne studien viste vi at klinisk tillit er begge i stand til å skille pasienter som kan bli mer pålitelig spådd fra de som er mindre nøyaktig spådd, og forutsigbare for overlevelse for pasientene etter at de er gruppert i ulike prognostiske grupper. Dermed tillegge et sikkerhetsnivå til prognose med den kliniske tillit beregningen vil gi klinikeren en mer personlig, objektivt grunnlag for beslutninger ved bruk av biomarkører som stammer fra microarray data.

Vi fant spesielt at den kliniske tillit gitt en bedre estimering for overlevelse når pasientene ble klassifisert i ulike prognose kategorier basert på både 70/30 og 80/20 eksempeloppgaver. For pasienter med god prognose, ble høyere klinisk tillit sterkt korrelert med lengre overlevelse tid. Tilsvarende for pasienter med dårlig prognose, overlevelsesraten var signifikant lavere for de med høye betroelser enn for de andre. Tar endepunkter MM-EFS og MM-OS som eksempler, til tross for det faktum at de er ganske vanskelig å forutsies, pasienter med høy pålitelighet viser en vesentlig høyere eller lavere overlevelse når de er gruppert i samsvar med god eller dårlig prognose, respektivt. Viktigere, alle pasientene i høy tillit gruppen overlevde til 5000 dager (figur S3c), viser at klinisk tillit er en informativ overlevelsestid prognose verktøy.

En viktig del av denne studien er at to positive (NB-PC MM-PC) og to negativ kontroll (NB-NC, MM-NC) datasett var involvert, som er avgjørende for å vurdere resultatene av klinisk relevante endepunkter mot det teoretiske maksimum og minimum ytelse levert av kontrollene. Nærmere bestemt, positiv korrelasjon mellom modell ytelse og klinisk trygghet for de to positive kontroll datasett som er vist i figur 2 bekrefter potensialet av kliniske tillit til å gi et mål på pålitelighet for personlig medisin, mens den neglisjerbar innvirkning av klinisk tillit i de to negative kontroll datasett videre begrenset muligheten for å få falske positiver. Dermed vil inkludering av positive og negative kontroll datasett i en slik analyse være til stor hjelp for å sikre påliteligheten av resultatene.

Det gjenstår enigma hvorfor noen av de punktene var vanskeligere enn andre for å forutsi. Figur 2 og Figur 3 sammenligner forutsigbarhet i de tre datasettene og tilhørende seks endepunkter. Lett forutsigbar endepunkter har en høy prosentandel av pasienter som faller i høy tillit regionen. For eksempel, er prosentandelen av pasienter som viste høy klinisk sikker (74,70%) for BR-erpos endepunkt mye høyere enn den til den MM-EFS endepunktet (37,51%) (figur 2), noe som kan tyde på at BR-erpos endepunkt inneholder et sterkere genekspresjon signal enn MM-EFS gjør. I tillegg er forutsigbarheten i datasettet (Cohens

d

) er direkte relatert med korrelasjonskoeffisienten mellom sikkerhetsnivå og MCC prediksjon ytelse (figur 3).

Muligheten til å kvantifisere kliniske betroelser kan kraftig forbedre kliniske beslutningsprosesser basert på microarray-baserte prediksjonsmodeller, spesielt for personlig behandlingstilbud. For eksempel kan de modellene som presenteres her teste for potensielle behandlingsrespons med høy tillit og lav selvtillit spådommer blir brukt på forskjellige måter. Pasienter med god prognose og høy betroelser er kandidater for å bruke rutine protokoller for å unngå overbehandling, mens strenge strategier bør velges for de med dårlig prognose og høye betroelser å forlenge overlevelse så lenge som mulig. Men for pasienter i de lave tillit regioner, ytterligere evaluering ved hjelp av alternative metoder bør vurderes.

Det er viktig å merke seg at strategien foreslås i denne studien understreker skiftet fra populasjonsbasert til personlig kreft prognose ikke negere betydningen av populasjonsbasert prediksjon, men heller bygger på dens suksess. Dersom ytelsen til en prediktiv modell er ikke informativt, slik som vist i de to negative kontroller (dvs. MM-NC og NB-NC), vil den kliniske tillit ikke være logisk. Dermed modell valideringsmetoder som inkluderer kryssvalidering og uavhengig ekstern validering er fortsatt avgjørende for å sikre gyldigheten av microarray-baserte prediktive modeller. Men siden populasjonsbasert prediksjon ikke gir en nøyaktig vurdering for hver pasient i befolkningen, og har klinisk tillit et middel til å måle pålitelighet for enkelte spådommer basert på populasjonsbasert prediksjon.

Fordelene med personlig medisin i helsevesenet er godt anerkjent [1]. Det gjør at både pasient og lege for å bli mer klar over fordelene og risikoen ved eventuelle behandlinger og potensielle utfall påvirkes av genetiske make-up eller andre miljøpåvirkninger. Dermed informert, skreddersydd, og helserelaterte beslutninger kan gjøres for hver person [29]. Kombinere microarray teknologi som kan profilere uttrykket nivåer av hundretusener av gener med mønstergjenkjenning teknikker har vært et viktig skritt mot individuell beslutnings [30]. Vi presenterte eksempler som gjelder selvtillit vurdering til kreft prognose og overlevelse prediksjon for modeller som er utviklet fra microarray data. Imidlertid kan tilnærming generaliseres til biomarkører og modeller bygget basert på data fra andre high throughput plattformer. Videre er konseptet som gjelder generelt for alle overvåket læring klassifiseringsmetoder som kan definere en klinisk tillit.

Hjelpemiddel Informasjon

Figur S1.

Tippe MCC som en funksjon av klinisk tillit i ti datasett ved hjelp av

NC

. Circle radier er skalert til prosentandelen av totalt prøver i det kliniske sikkerhetsnivå. Tillit nivåer er «0,5-0,6 «,» 0,6-0,8 «og» 0,8-1 «, henholdsvis

doi:. 10,1371 /journal.pone.0029534.s001 plakater (TIF)

Figur S2.

Sammenheng mellom skråningen rate og Cohens

d

for

NC

klassifikator. Bakkene er hentet fra regresjonsanalyse basert på den lineære delen av tillit MCC kurve, mens Cohen

d

representerer iboende forutsigbarhet datasettet

doi:. 10,1371 /journal.pone.0029534.s002 product: (TIF)

Figur S3.

overlevelse (EFS) kurver for pasienter med ulike kliniske betroelser ved hjelp av

KNN

der «LC», «MC «og» HC «betegne» lav selvtillit (0,6) «,» medium tillit (0,8) «og» høy tillit (1) «, henholdsvis.

doi: 10,1371 /journal.pone.0029534.s003 plakater (TIF)

Figur S4.

Tippe MCC som en funksjon av klinisk tillit i ti datasett som bruker 80/20 splitting og

KNN

. Sirkelen radier er skalert til prosent av totale prøver i det kliniske sikkerhetsnivå. Tillit nivåer er «0.6», «0.8», og «en «

doi:. 10,1371 /journal.pone.0029534.s004 plakater (TIF)

Figur S5.

Sammenheng mellom skråningen rate og Cohens

d

for

KNN

klassifiserer basert på 80/20 prøve oppdrag. Bakkene er hentet fra regresjonsanalyse basert på den lineære delen av tillit MCC kurve, mens Cohen

d

representerer iboende forutsigbarhet datasettet

doi:. 10,1371 /journal.pone.0029534.s005 product: (TIF)

Figur S6.

Total overlevelse (OS) kurver for pasienter med ulike kliniske betroelser bruker 80/20 splitting og

KNN

, der «LC», «MC «og» HC «betegne» lav selvtillit (0.6)» , «middels sikkerhet (0,8) «og» høy tillit (1)», henholdsvis.

doi: 10,1371 /journal.pone.0029534.s006 plakater (TIF)

Figur S7.

overlevelse (EFS) kurver for pasienter med ulike kliniske betroelser bruker 80/20 splitting og

KNN

, der «LC», «MC «og» HC «betegne» lav selvtillit (0,6 ) «,» middels sikkerhet (0,8) «og» høy tillit (1) «, henholdsvis.

doi: 10,1371 /journal.pone.0029534.s007 plakater (TIF)

Tabell S1.

MCC ytelse for opplæring og valideringssett

doi:. 10,1371 /journal.pone.0029534.s008 plakater (docx)

Tabell S2.

Slope og Cohens

d

for hvert datasett

doi:. 10,1371 /journal.pone.0029534.s009 plakater (docx)

tabell S3.

Prosent av pasientene i lav selvtillit (LC), middels sikkerhet (MC) og høy tillit (HC) regioner

Doi:. 10.1371 /journal.pone.0029534.s010 plakater (docx)

Metoder S1.

Byggingen av beste klassifikator og beregne korrelasjonen mellom klinisk tillit og overlevelse

doi:. 10,1371 /journal.pone.0029534.s011 plakater (DOC)

Takk

forfatterne ønsker å takke MAQC dataleverandører for å dele sine data og informasjon til MAQC Consortium. Synspunktene som presenteres i denne artikkelen reflekterer ikke nødvendigvis de av U. S. Food and Drug Administration.

Referanse

1. Loscalzo J, Kohane jeg, Barabasi AL (2007) Menneskelig sykdom klassifisering i postgenomic era: En komplekse systemer tilnærming til menneskelig patobiologi. Mol Syst Biol 3: 124.

Se artikkel

PubMed /NCBI

Google Scholar

to. Holmes E, Wilson ID, Nicholson JK (2008) Metabolsk fenotyping i helse og sykdom. Cell 134: 714-717.

Se artikkel

PubMed /NCBI

Google Scholar

tre. Abrahams E (2009) personlig medisin realisere sitt løfte. Genet Eng Biotechnol News 29 (15). Tilgjengelig: https://www.genengnews.com/gen-articles/personalized-medicine-realizing-its-promise/3025/. Nås: 2012 Jan 2.

Se artikkel

PubMed /NCBI

Google Scholar

4. van’t Veer LJ, Dai HY, van de Vijver MJ, han YDD, Hart AAM, et al. (2002) Gene ekspresjonsanalyse forut kliniske resultatet av brystkreft. Nature 415: 530-536.

Se artikkel

PubMed /NCBI

Google Scholar

5. van de Vijver MJ, han YD, van «t Veer LJ, Dai H Hart AAM, et al. (2002) Et gen-uttrykk signatur som en prediktor for overlevelse ved brystkreft. N Engl J Med 347: 1999-2009.

Se artikkel

PubMed /NCBI

Google Scholar

6. Ayers M, Symmans WF, STEC J, Damokosh AI, Clark E et al. (2004) genuttrykk profiler forutsi komplett patologisk respons på neoadjuvant paclitaxel og fluorouracil, doksorubicin, og cyklofosfamid kjemoterapi i brystkreft. J Clin Oncol 22: 2284-2293.

Se artikkel

PubMed /NCBI

Google Scholar

7. Iwao-Koizumi K, Matoba R, Ueno N, Kim SJ, Ando A, et al. (2005) Prediksjon av docetaxel respons i human brystkreft med genuttrykk profilering. J Clin Oncol 23: 422-431.

Se artikkel

PubMed /NCBI

Google Scholar

8. Sørlie T, Perou CM, Tibshirani R, Aas T, Geisler S, et al. (2001) genuttrykksmønster av brystcarsinomer skille kreftunderklasser med kliniske implikasjoner. Proc Natl Acad Sci U S A 98: 10869-10874.

Se artikkel

PubMed /NCBI

Google Scholar

9. Sotiriou C, Neo SY, McShane LM, Korn EL, Long PM, et al. (2003) Brystkreft klassifisering og prognose basert på genuttrykk profiler fra en populasjonsbasert studie. Proc Natl Acad Sci U S A 100: 10393-10398.

Se artikkel

PubMed /NCBI

Google Scholar

10. Sørlie T, Tibshirani R, Parker J, Hastie T, Marron JS, et al. (2003) Gjentatt observasjon av brystkreft subtyper i selvstendige genuttrykk datasett. Proc Natl Acad Sci U S A 100: 8418-8423.

Se artikkel

PubMed /NCBI

Google Scholar

11.

Legg att eit svar