Abstract
Bakgrunn
De fleste kvinner med en klinisk presentasjon forenlig med eggstokkreft har godartede tilstander. Derfor metoder for å skille kvinner med eggstokkreft fra de med godartede tilstander ville være fordelaktig. Vi beskrive utviklingen og preliminær evaluering av et serum-baserte multivariabel analyse for ovarian cancer. Denne hypotesen drevet studie undersøkt om en informativ mønster kunne påvises i stadium I sykdom som vedvarer gjennom senere faser.
metodikk /hovedfunnene
Sera, samlet etter ensartede protokoller fra flere institusjoner, som representerer 176 tilfeller og 187 kontroller fra kvinner som presenterer for kirurgi ble undersøkt ved hjelp av høy gjennomstrømning, multipleksede immunologiske analyser. Alle stadier og vanlige undertyper av ovarialcancer, og de vanligste godartet eggstokkene forholdene var representert. Et panel av antigener 104, 44 autoimmune og 56 infeksiøse sykdomsmarkører ble analysert og informative kombinasjoner identifisert. Ved hjelp av et treningssett med 91 stadium I datasett, som representerer 61 enkeltprøver, og et tilsvarende antall kontroller, en 11 analytt-profil, bestående av CA-125, CA 19-9, EGF-R, C-reaktivt protein, myoglobin , apolipoprotein A1, apolipoprotein CIII, MIP-1α, IL-6, IL-18 og tenascin C ble identifisert og synes informativ for alle stadier og vanlige undertyper av eggstokkreft. Ved hjelp av et testsett 245 prøver, omtrent dobbelt så stor som den modellbyggesettet, klassifikator hadde 91,3% sensitivitet og 88,5% spesifisitet. Selv om disse foreløpige resultatene er lovende, videreutvikling og omfattende validering av sorter i en klinisk studie er nødvendig for å avgjøre om testen har klinisk verdi.
Konklusjon /Betydning
Vi beskriver en blod- baserte analysen bruker 11 analyttene som kan skille kvinner med eggstokkreft fra de med godartede tilstander. En foreløpig vurdering av sorter antyder den har potensial til å gi omtrent 90% sensitivitet og 90% spesifisitet. Mens lovende, må resultatene vurderes i en blindet klinisk valideringsstudie
Citation. Amonkar SD, Bertenshaw GP, Chen T-H, Bergstrom KJ, Zhao J, Seshaiah P, et al. (2009) Utvikling og foreløpig vurdering av en multivariat indeks analyse for eggstokkreft. PLoS ONE 4 (2): E4599. doi: 10,1371 /journal.pone.0004599
Redaktør: Ewout W. Steyerberg, University Medical Center i Rotterdam, Nederland
mottatt: 21 november 2008; Godkjent: 14 januar 2009; Publisert: 25 februar 2009
Copyright: © 2009 Amonkar et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Alle forfattere er ansatt i Correlogic Systems, Inc.
Konkurrerende interesser: Alle forfatterne er heltidsansatte i Correlogic Systems, Inc. og opsjon rettigheter. Correlogic Systems, Inc. har innlevert patentsøknader på aspekter ved dette arbeidet.
Innledning
Eggstokkreft er den dødeligste gynekologisk kreft i USA [1]. I 2008 vil anslagsvis 21,650 nye tilfeller av eggstokkreft bli oppdaget. Tidlig diagnose er assosiert med en 92% 5-års overlevelse, men bare 19% av eggstokkreft blir oppdaget tidlig [1], [2]. Flertallet av tilfellene oppdages er avansert stadium sykdom hvor 5-års overlevelse for kvinner med regional malignitet og fjernt sykdom er henholdsvis 71% og 30%. Som et resultat av mer enn 15.000 kvinner dør av eggstokkreft i USA hvert år [1].
Den tidlige symptomer på eggstokkreft, som inkluderer bekken og magesmerter, urin haster og frekvens, abdominal oppblåsthet, og vanskeligheter med å spise er ikke-spesifikke, og typisk for mange ikke-kreft og godartede tilstander [3]. Derfor ikke diagnose vanligvis ikke skje før utviklingen av enten en betydelig mengde av væsken i bukhulen, eller et bekken masse, påvist ved fysisk undersøkelse eller med radiologisk evaluering [4]. En fersk rapport har antydet at en unik kombinasjon av symptomer, hvis fullt dokumentert for hver pasient, kan være mer informativ enn tidligere anerkjent, selv om funnene gjenstår å bli bekreftet [5]. Mange rapporter tyder på at de mest brukte bildeteknikker – transvaginal sonography (TVS), positron-emisjon tomografi (PET), magnetisk resonans imaging (MRI), radioimmunoscintigraphy og computertomografi (CT) mangler tilstrekkelig spesifisitet til å skille mellom godartede og ondartede ovariesyndrom [6]. Noen nyere studier har antydet at ultralyd alene, eller i kombinasjon med andre prognostiske variabler kan være betydelig mer informativ i hendene på en spesialisert ovarial ultralyd ekspert [7], [8], men mange pasienter har ikke tilgang til ferdighetene slike spesialister. Videre klar diagnose vanligvis nødvendig, minst, kirurgiske inngrep i form av laparotomi eller laparoskopi. Derfor ville en nøyaktig og informativ, men ikke-invasiv, test være av klinisk verdi.
Det er ingen FDA-godkjente biomarkører for diagnostisering av kreft i eggstokkene, eller for triage av kvinner mistenkt for å ha eggstokkreft . Til tross for den omfattende bruk, kreft antigen 125 (CA-125) er eneste FDA-godkjent for overvåking av tilbakefall og terapeutisk respons [9] – [11]. I studier av kvinner med kjent eller mistenkt eggstokkreft, de rapporterte sensitiviteten for CA-125 i å oppdage stadium I og II kreft varierer mye 29-75% og 67-100%, henholdsvis. Imidlertid er CA-125 heves i et bredt spekter av normale, benigne og maligne tilstander [12] – [14] og 86% av kvinner som opplever unormale CA-125 testene over i løpet av 3-6 måneder [15]. Mange forsøk er blitt gjort for å bedre prediktiv verdi av CA-125 gjennom seriemålinger [16], [17] eller i kombinasjon med andre markører [18] – [21]. Imidlertid gjenstår unnvikende en enkel og klinisk praksis, eggstokkreft-screening verktøy
En fersk studie [22] beskrev et panel av seks markører -. CA-125, prolaktin, leptin, makrofag hemmende faktor (MIF), osteopontin og insulin-lignende vekstfaktor II (IGF-II) som når det kombineres hadde meget høy følsomhet (95,3%) og spesifisitet (99,4%). Testen er ment som en skjerm på høy-risiko kvinner, men de endelige ytelse egenskaper ble ikke vurdert på høy-risiko kvinner og inkludert prøver også brukes til å bygge modeller som kan ha resultert i over-estimering av klassifikator ytelse. Videre inklusjons- og eksklusjonskriteriene for deltakerne ble ikke klart definert, og kreft og kontrollprøver ble samlet under forskjellige kliniske omgivelser, som kan føre til skjevhet i utvalget. Prolaktin og IGF-II ble hver rapportert å være individuelt mer informativ enn CA-125, i denne studien, men dette er i strid med rapporter om andre uavhengige prøvesett [23], [24]. I en annen studie, Moore og medarbeidere benyttet logistisk regresjon for å finne markører kombinasjoner i stand til å skille mellom godartede og ondartede tilstander hos kvinner med bekken massene [25]. Ved å kombinere HE-4 og CA-125, 76,4% sensitivitet og spesifisitet 95% ble oppnådd. Mens lovende, bare 67 av de 233 prøvene var fra personer med eggstokkreft, og bare 15 av dem fra kvinner med stadium I og II kreft. I tillegg rapporterte resultatene var basert på kryssvalideringsresultater som manglet en uavhengig holdout sett av prøver.
Eggstokkreft er en samling av ulike enheter med mer enn 30 undergrupper av maligniteter, hver med en særegen histologi, patologi og klinisk oppførsel [26]. Mangfoldet og lav forekomst av kreft i eggstokkene hemmer letingen etter biomarkører. I en separat, post-hoc analyse av en undergruppe av prøvene som brukes i denne studien, var vi ikke i stand til å identifisere en enkelt markør stand av seg selv til å forutsi tilstedeværelsen av eggstokkreft [24]. I denne studien beskriver vi utviklingen og foreløpig evaluering av en multi-analytt profil som kan klassifisere kvinner mistenkt for å ha eggstokkreft, til de med og uten eggstokkreft.
Metoder
Prøve Cohort
Alle unntatt 20 prøver var fra vevet-bank oppbevaringssted for National Cancer Institute finansiert gynekologisk Oncology Group (GOG, Columbus, OH, Tabell 1, Tabell S2). Skriftlig samtykke ble innhentet av GOG for alle deltakere og GOG Institutional Review Board (IRB) godkjente bruken av prøvene i vår studie. Disse prøvene ble samlet inn fra flere nettsteder under protokoller godkjent av GOG IRB. Kvalifiserte pasienter var kvinner planlagt for kirurgi med mistanke om å ha en gynekologisk kreft eller planlagt for profylaktisk kirurgi på grunn av økt eggstokkreft risiko (første eller andre graders slektning med sykdommen). Alle prøvene, inkludert de kategorisert som normaler, etter operasjonen, ble samlet før en eventuell diagnostisk eller terapeutisk intervensjon. Serum porsjoner videresendt til Correlogic Systems, Inc.® (Rockville, MD) hadde blitt avidentifisert og kodet med en unik GOG identifikator. Hver prøve ble ledsaget av en fullstendig rapport clinicopathology, pasientens alder og rase, og en de-identifisert kode som angir returpunkt. Patologi ble gjennomgått og bekreftet av GOG patologer for å sikre konsistens. Prøvene ble valgt fra GOG samlingen til å balansere pasientens aldersfordeling, dato for serum samling, og representasjon av saker og kontroller over samling nettsteder. Den resterende sera bestod av 20 prøver fra individer med godartede tilstander fra en Correlogic prospektiv samling, som bruker en tilsvarende serumsamling protokoll. Skriftlig samtykke ble innhentet fra alle deltakerne. Correlogic er «potensielle» samples blir innsamlet etter IRB godkjennelse for å støtte utviklingen av en klinisk test for eggstokkreft. Studiepopulasjonen er kvinner som har symptomer på eggstokkreft og planlagt kirurgi. Som sådan er sykdomsstatus bekreftet ved patologi etter operasjonen. De 20 prøver ble tatt ut fra den potensielle samling på en måte for å unngå å innføre en hvilken som helst skjevhet i de resterende samling og som sådan ble ikke bevisst valgt for å representere en bestemt populasjon. Studien ble godkjent av den vestlige IRB (Olympia, Washington) og av IRB fra hver deltakende nettstedet.
Serum bearbeiding, lagring, håndtering og forsendelse
Blodprøver (5- 20 ml) ble samlet i røde beste glass Vacutainer-rør (Becton-Dickinson, NJ), klumpete i 30-180 minutter ved 4 ° C, og deretter sentrifugert ved 3500 g i 10 minutter ved 4 ° C. Serum ble dekantert inn i cryotubes, og som er lagret umiddelbart ved -80 ° C. Aliquoter fra lagrings ble sendt til Correlogic på tørris og lagret umiddelbart ved -80 ° C. Frosne prøver ble varmet forsiktig for hånd inntil nesten tint, utført på is, vortex-blandet, alikvotert i 150 ul volumer og fryses på nytt ved -80 ° C. Til slutt prøver ble sendt på tørris til regelbasert Medicine, Inc. (RBM, Austin, TX). En ledsagende dokument gitt en kodet prøve identifikasjonsnummer og en bestemt rekkefølge for analyse. RBM analytiske området ble fullstendig blind for alle prøve detaljer inkludert sykdomsstatus.
Multiplex Immunoassays
De multipleksede immunanalyser er beskrevet andre steder [24]. Kort fortalt ble to runder med multipleksede immunologiske analyser utført ved RBM i sin Luminex baserte CLIA-sertifisert laboratorium. Analytter ble kvantifisert ved henvisning til åtte-punkts kalibreringskurver og maskinytelse ble bekreftet ved hjelp av tre kvalitetskontroll (QC) prøver for hver analytt. QC prøvene ble fordelt relativt jevnt over det dynamiske området av analysen ved lave, middels og høye nivåer og generelt hadde koeffisienter av variansen under 15%. Kalibreringsstandarder og QC-prøvene ble i en kompleks plasma-basert matriks for å tilpasse samplings bakgrunn og ble analysert i duplikat. I runde en, ble til sammen 204 analytter som representerer 104 antigener, 44 autoimmune og 56 smittsomme sykdommer molekyler målt i 147 ovarialcancer prøver (40 stadium I, 23 trinn II, 67 stadium III, 12 stadium IV, fem unstaged) og 149 kontrollprøver (104 godartede tilstander, 29 friske, 14 andre kreftformer og to lav malignt potensial) ved hjelp av proprietære multipleksede immunologiske analyser (Tabell S1). En andre runde med analyse ble utført 86 dager etter den første analyserunde, på 104 antigener, ved anvendelse av en andre aliquot serum som hadde blitt utsatt for en identisk fryse /tine-historie som prøvene som brukes i første runde. På grunn av prøvevolum restriksjoner ble 27 prøver ikke analyseres på nytt i runde to. Derfor, i runde to, 132 eggstokkreft prøver (30 stadium I, 21 trinn II, 65 stadium III, 11 stadium IV og fem unstaged) og 135 kontroller (94 godartede tilstander, 28 friske, 13 andre kreftformer) ble reanalysert. I tillegg ytterligere 69 prøver, som ikke inngår i runde én, ble analysert (21 stadium I, åtte trinn II, 36 godartet, tre normal sunn og en tykktarmskreft). For begge runder med analyse, ble rekkefølgen av analysen ble etablert for å unngå en hvilken som helst sekvensiell skjevhet på grunn av sykdom nærvær eller fravær, subtype eller stadium av sykdommen, pasientens alder, eller alder av serumprøven. Vanligvis prøver vekslet mellom saker og kontroller.
Datahåndtering
Siden sera ble analysert ved en tidligere optimalisert fortynning, en hvilken som helst prøve som overstiger den maksimale konsentrasjonen av kalibreringskurve ble vilkårlig tildelt konsentrasjonen av høyeste standard, mens de undersøkes under den minimale konsentrasjon av kalibreringskurve ble satt til verdien 0,0. En enkelt assay (IL-1α) som viste ingen variasjon i uttrykk på tvers av alle prøvene ble ansett invariant /uninformative og fjernes fra det ekstraherte datasettet. Resten av dataene ble deretter skalert ved biweight skalaen; en robust og effektiv skalering mekanisme som står for variansen i løpet av hver av de enkelte analysene [27]. En enkelt skala for hver analyse ble bestemt i en populasjon vektet måte. En hvilken som helst analyse, hvilket ga en skalafaktor på null ble fjernet fra datasettet. De resulterende dataene ble deretter eksportert til individuelle filer der hver fil representert resultatene av alle kvalifiserte analyser for en enkelt prøve
Modeling -. «Out-of-Bag» Feil Estimering og Bootstrap Validering
for å minimere prøvesett skjevhet og til hjelp i vurderingen av mellommodeller, ansatt vi en tredjedel «out-of-bag» (OOB) feil estimering og en ekstern 100 ganger bootstrap validering med 10% holdbarhet bootstraps. Disse bootstrap estimater tillatt oss å vurdere den potensielle verdien av mange modeller som bruker bare treningsdataene. På denne måten kunne vi opprettholde uavhengighet av hold-out testing sett av prøver. Først etter en spesifikk klassifiserings hadde blitt låst inn i en sporbar dokumenthåndteringssystem (DMS) var hold-out testing datasettet brukes til å teste ytelsen til den valgte modellen
Modeling -. Proof-of-prinsippet Klassifiserings
å begynne med modellering ble utført med data som er generert i en rund (figur 1) ved bruk av en modifikasjon av Breiman Random Forest kode [28]. Metoden ble forbedret ved at batch automatisering, og legger et ytre lag av bootstrapping, noe som gir større kontroll over kjøre parametre, og tilpasse produksjonen. De resulterende trær ble frelst og en proprietær rutine ble brukt til rilleprøver og utgang sample informasjon, sannsynlighetsresultater og klassifisering resultat. Førti trinn I eggstokkreft og 40 kontrollprøver ble anvendt for modellbygging. Kontrollene ble valgt for å sikre at modelleringen settet representerte de samme andelene av normale, benigne og andre kreft betingelser som hele kontrollsettet, men innenfor hver av disse kategorier, ble prøver valgt tilfeldig. Modellering ble optimalisert ved å variere både treet teller (50, 100, 500 og 1000) i en skog, og antallet av biomarkører (5, 10, 15, 20, 25, 30, 35, 40, 45, 50) undersøkt ved hvert forgreningspunkt, noe som resulterer i 40 modeller. Fra disse modellene, ble de 20 mest informative analytter identifisert ved hjelp av den variable betydning verdi. I det andre trinnet, ble en serie av modeller bygd som var begrenset til den viktigste analytt (1-analytt-modellen), er de to viktigste analytter (2-analytt modell) og så videre til en 20-analytt-modellen, totalt 20 modeller. Den OOB og eksterne bootstrap feil, og deres standardavvik, ble ordnet for hver av disse modellene. Fra disse resultatene ble det fastslått at minst syv analyttene var nødvendig for å oppnå mest mulig nøyaktig klassifisering. En endelig, singel, modell ble deretter bygget på disse syv analyttene og deponert i DMS som en «låst» modell
Modeling -. Endelig Klassifiserings
Den endelige modellering innlemmet alle scenen jeg kreft data fra runder en og to, inkludert duplikater – totalt 91 scene jeg datasett, som representerer 61 uavhengige utvalg, og en identisk antall kontroller, matchet som før, og balansert i samme runde en til runde to ratio (Figur 1). Bare disse datasett (det vil si treningssettet) ble anvendt i modellbygging og seleksjon. Mønsteret Analysen ble utført ved hjelp av et unikt og patentsøkt algoritme, Knowledge Discovery Engine-VS (KDE-VS ™). KDE-VS benytter en gruppe av stemme strukturer som ligner på beslutningstrær med en unik metode for å bygge og definere cut-off-verdier innenfor hver valgsystem, bruker ikke bare den målte verdien av en analytt men også laboratoriebaserte feilestimat knyttet til denne målingen og er avledet fra de historiske QC målinger for hver analytt. Brukeren kan variere fraksjonert verdien av feilestimatet inkorporert i en sorterer under modellering. Resultatet er en robust klassifikator som tåler betydelig forstyrrelse av eksperimentelt bestemte verdier av punkt analyttkonsentrasjoner. Under modellbygging, er hver terminal node på valgsystem er tildelt en gitt tilstand – enten eggstokkreft eller ikke-eggstokkreft. Å score et ukjent, trekker vår programvare verdiene for analyttene av interesse å finne ut hvilken node prøven faller i.
To ulike modellerings løper, med brøk verdien av feiltoleranser på 1,0 og 3,0, ble utført ved hjelp av data for de 104 antigen analyser. De 20 mest robuste analytter ble bestemt for hvert forsøk og disse ble deretter satt sammen til en fullstendig sett av 7-markør-modeller. Men alle modellene var nødvendig for å inneholde en invariant kjerne av de tre mest robuste og informative analytter, nemlig CA-125, C-reaktivt protein og EGF-R, noe som reduserte leteområdet til 2380 kombinasjoner. For begge nivåer av feiltoleranse vi identifisert de ti mest sensitive og ti mest spesifikke modeller – som gir totalt 40 modeller. Hyppigheten av bruk av både individuelle analytter og ulike analysekombinasjoner på tvers av alle 40-modeller, førte til identifisering av 11 analytter som sammen dukket robust og informativ. Til slutt ble en enkelt modell er bygget på disse 11 analyttene og låst i DMS. Bare etter å ha låst modellen var de resterende data, ikke brukes i opplæring, scoret å teste modellen (figur 1).
Data Analysis
Konfidensintervallene ble beregnet ved hjelp av Newcombe metoden [29] .
Resultater
en foreløpig vurdering av
Proof-of-prinsippet Klassifiserings
det første settet med data, som genereres på 147 eggstokkreft og 149 ikke-eggstokkreft kontrollprøver var brukes til å undersøke mulighetene for å bruke en høy gjennomstrømming multipleks immunoassay plattform som en oppdagelsesverktøy. Vi antok at en klassifisering mønster for stadium I eggstokkreft vil vedvare gjennom alle senere stadium sykdommer, så bare stadium I kreftprøver ble brukt til modellutvikling. Denne tilnærmingen også balansert gjennomsnittsalderen for case og kontrollpasienter, fjerne aldersrelatert skjevhet under modellering (tabell 1). Gjennom flere runder med berikelse for de mest informative biomarkører, drevet av vurderingen av bootstrap feil for modellutvikling prøvesett, en 7-analytt modell utviklet seg, bestående av CA-125, EGF-R, C-reaktivt protein, apolipoproteins CIII og A1, IL-18 og tenascin C. Dette trinn i spesifikk profil ble låst inn i DMS. Først etter at modellen ble låst inn i DMS var data for testprøvene (de som ikke brukes i modellering) åpnes og scoret av modellen for å gi de resultatene som er beskrevet nedenfor (figur 1).
Siden alle stadium I data generert i den første runden av analysene hadde blitt brukt i modellering, var det ingen uavhengige data til test stadiet jeg følsomhet. Imidlertid er 100-fold bootstrap estimat av fase I sensitivitet var 87% (tabell 2). Bootstrap estimat for spesifisitet, basert på kontroller som brukes i modellutvikling var 82,3%. Klassifikator ble deretter evaluert ved hjelp av runde en testprøver, et sett av uavhengige utvalg som ikke brukes i noen aspekter av modellutviklingen. Klassifikator hadde 95,3% sensitivitet og 70,6% spesifisitet. Resultater for godartede prøvene var lavere (67,1%) enn andre kontroller. Det var ingen enkel subtype av kreft som skåret signifikant forskjellig fra de andre, og når de blir brutt ned av scenen, følsomheten variert litt (94,0 til 100%), støtter hypotesen om at en scene jeg mønster kunne vedvare gjennom alle stadier av sykdommen. Etter den andre runden av analyser, ble all round to data scoret på denne låst modell. Prøvene er felles for runde viste en reproduserbar ytelse med 97,1% sensitivitet (95% CI, 91,0 til 99,2%) og 74,5% spesifisitet (95% CI, 64,7 til 82,4%). De ekstra 69 prøver, ikke tidligere analysert, gitt en andre testsett og ga 85,7% sensitivitet for stadium I, 100% sensitivitet for stadium II og 67,5% spesifisitet.
En foreløpig vurdering av Final Klassifiserings
proof-of-prinsippet klassifikator bekreftet vår hypotese om at med bare fase i-data for både modellutvikling og vurdering vi kunne identifisere en informativ mønster som kan eksistere og vedvarer gjennom senere stadier av kreft. Derfor søkte vi å utvikle scenen jeg modellen videre ved hjelp av alle stadium I prøvene tilgjengelig. Den samme strategien modellering ble gjentatt med to viktige modifikasjoner. Først ble en annen, proprietær algoritme implementeres, og andre, ble alle trinn I prøvene analysert på tvers av både en og to runder benyttes for å øke størrelsen på den modellutvikling datasettet (figur 1). Modellering strategien gikk gjennom flere iterative trinn for å berike for de mest informative biomarkører, basert på en vurdering eneste av stadium I treningsdata før kulminerte i en nær-uttømmende søk av biomarkør kombinasjoner som genereres 2380 modeller. Førti modeller ble valgt basert på deres bootstrap sensitivitet og spesifisitet på fase I prøvesettet. Ved å sammenligne de biomarkør kombinasjoner blant de øverste 40 modeller (tabell 3), og med tanke på balansen de viste i bootstrap nøyaktighet, følsomhet, spesifisitet, og standardavvik, ble et endelig sett av 11 informative biomarkører identifisert. Visse analytt kombinasjoner var vanlig i mange modeller, og det var tydelig «erstatningsmønstre» der en annen analytt eller kombinasjon av analytter kan gi tilsvarende modeller. De 11 biomarkører – CA-125, C-reaktivt protein, EGF-R, CA 19-9, apolipoproteiner A1 og cIII, myoglobin, MIP-1a, IL-6, IL-18 og tenascin C – ble satt sammen til en endelig modell bruker KDE-VS algoritme og låst inn i DMS som den endelige modellen (figur 1).
som en innledende test av klassifikator ytelse, alle data som ikke brukes i modellutvikling ble scoret, noe som ga 91,3 % sensitivitet og 88,5% spesifisitet (tabell 4, figur 1). Spesielt, stadium II sensitivitet var 83,9% og ytelse på godartet prøvene forbedret til 90,4%. Andre stadium I prøvene ikke var tilgjengelig på den tiden, for testing av denne forestillingen. Men bootstrap estimat av følsomhet for trening settet var 83,4% for stadium I sykdom og 84,2% (± 12.5%) spesifisitet (tabell 4). Som en egen øvelse, ble alle like data fra runde to ikke brukt i modellutvikling scoret. Som forventet fra tidligere resultater, ytelsen var lik med 96,1% sensitivitet (95% CI, 89,7 til 98,7%) og 88,1% spesifisitet (95% CI, 80,8 til 93,0%) med godartede prøver scoret 87,0% (95% CI, 76,2 til 93,5%). For å gi en referanseramme, sammenlignet vi modellen ytelse som for en klinisk beslutning basert på CA-125 uttrykk nivåer. Siden cut-off-verdi på 35 IU /ml allerede er etablert, ble det fullstendige datasettet som brukes til å vurdere den prediktive verdi av CA-125. Med denne cut-off-verdi, CA-125 ga 94,9% sensitivitet og 58,6% spesifisitet (tabell 5). For stadium I prøvene alene, følsomheten falt til 88,5%.
Vi gjennomførte to metoder for å anslå betydningen av de ulike analyttene til den generelle klassifikator. Først vurderte vi modell ytelse når alle unntatt en analytt ble holdt konstant i datafilene, med verdien av den valgte analytten randomisert. Dette ble gjentatt sekvensielt for hver analytt. Den relative verdien av hver analytt ble så rangert etter bestemme hvilke analytt forårsaket klassifisering ytelse å avta mest når randomisert. Vi observerte at biomarkør betydning tendens til å gruppere sammen. Nærmere bestemt, CA-125 var den viktigste biomarkør, fulgt en gruppe bestående av C-reaktivt protein, CA 19-9 og EGF-R, etterfulgt av MIP-1α, etterfulgt av myoglobin, apolipoprotein CIII, apolipoprotein A 1, IL-18 og IL-6 og endelig tenascin C. Som en annen fremgangsmåte for estimering av analytt betydning, analyserte vi forgreningspunktene for de stemme strukturer. På tvers av alle forgreninger interessante stemmene strukturer, ble CA-125 involvert hyppigst (15,8%), etterfulgt av CA 19-9 (12,1%), myoglobin (11,1%), C-reaktivt protein (10,8%) og EGF-R (9,9%). CA-125 ble brukt i 80% av toppforgreningspunkter, som representerer den første store prøven partisjonering, etterfulgt av C-reaktivt protein (11,2%), EGF-R (5,0%) og CA19-9 (1,8%). På den andre tier, ble CA19-9 brukt hyppigst (20,3%), etterfulgt av EGF-R (18,8%), CA-125 (11,4%), myoglobin (9,8%), tenascin C (8,0%), IL-18 (7,2%), og apolipoprotein A1 (6,9%). De akutte fase markører MIP-1a og IL-6 ble sett henholdsvis bare 6,2% og 1,3% på dette nivået.
Diskusjoner
I denne studien identifiserte vi en klassifisering mønster for eggstokkreft i serum proteomet av pasienter med stadium i sykdom, som fortsatt er tydelig gjennom senere stadium sykdommen. Sera fra pasienter med patolog-bekreftet forhold – enten med eller uten epitelial eggstokkreft – ble profilert ved hjelp av en perle-basert multi-analytt profilering tilnærming. Analyttene dekket et bredt spekter av biologiske strukturer og funksjoner, inkludert kreft antigener, hormoner, koagulasjonsfaktorer, vev modellering faktorer, lipoprotein bestanddeler, proteaser og proteasehemmere, markører for kardiovaskulær risiko, vekstfaktorer, cytokiner /kjemokiner, løselige former av celle- aliserte reseptorer, og inflammatoriske og akuttfase-reaktanter, så vel som markører for autoimmunitet og infeksjon (tabell S1). To uavhengige analyser av prøvene ble utført 86 dagers mellomrom. Det var flere reagenspartinumrene og satsendringer i denne perioden, noe som gir en virkelig verden utfordring til robusthet av de underliggende analyser og modell.
Fire store komponentene var avgjørende for å lykkes i denne studien. Først var det viktig å identifisere en svært konsekvent, godt dokumentert og klinisk representativt utvalg sett bekreftede tilfeller og kontroller. For eggstokkreft, kan bekreftelse bare komme fra patologisk undersøkelse av kirurgisk excised vev. Vi valgte serumprøver fra godt karakteriserte samlinger fra kvinner som allerede er planlagt for kirurgi. Den betydelig flertall av kontrollene i denne populasjonen hadde patologi-bekreftet godartede tilstander, som basert på univariat analyse, bør utgjøre en større utfordring for klassifisering enn sera fra ikke-symptomatiske kvinner (figur 2; [24]). For det andre, benyttet vi et panel av fullt kvalifisert, høy gjennomstrømning, immunanalyser som måler et bredt mangfold av molekyler inkludert autoimmune og smittsomme sykdomsmarkører, og et bredt spekter av godt karakterisert serumproteiner, inkludert de tidligere innblandet i eggstokkreft. For det tredje, anvendte vi en ny multivariabel modellering tilnærming for å identifisere en robust mønster av molekyler informative for ovarian cancer. Den proprietær algoritme (KDE-VS) forbedret klassifisering ytelse sammenlignet med Random Forest og andre klasse algoritmer ved å bygge robuste beslutningsgrenser i sine stemme strukturer, som inkorporerer virkelige verden eksperimentell variabilitet i data blir modellert. Endelig var det et klart skille mellom prøver som brukes for å utvikle og identifisere en enkelt informativ modell, og prøvene anvendt til å evaluere den modeller ytelsen
For hver analytt, kasse whisker plott viser:. Den laveste observasjon, nedre kvartil, medianverdien, øvre kvartil, og høyeste observasjon. Alle analyser, inkludert duplikater vises. CA-125 – en eggstokkreft, 11 godartet og fem normale prøver under laveste kalibrering verdi; CA 19-9 – 14 eggstokkreft, 18 godartede, ni normale og fire andre kreftprøver under laveste kalibreringsverdi; C-reaktivt protein – 93 eggstokkreft, 21 godartet, to normal og to andre kreftprøver over høyeste kalibrering verdi; IL-6-82 eggstokk-kreft, godartet 161, 28 normale og 14 andre kreftprøvene under laveste kalibrerings nivå; MIP-1α – 50 eggstokkreft, 53 godartet, 10 normal og fire andre kreftprøver under laveste kalibreringsnivå; tenascin C – to eggstokkreft og en godartet eksempelet ovenfor høyeste kalibreringsnivået. OvCa, eggstokkreft; Ca, kreft; Apo, apolipoprotein; CA-125, kreft antigen 125; CA 19-9, kreft antigen 19-9; EGF-R, epidermal vekstfaktor-reseptor (oppløselig form); IL, interleukin; . MIP-1a, makrofag inflammatorisk protein en alpha
Vår studie fokusert på analyse av tidlig stadium sykdom med 50% av kreftprøvesett som representerer stadier I og II sykdom (tab 1). I samsvar med litteraturen, den gjennomsnittlige pasienten alder ved diagnose korrelert med stadium av sykdommen ved diagnose (tabell 1; [22]). Den subtype fordelingen var representant for den amerikanske befolkningen, med en større andel av serøs (42%) og endometrioid (26%) karsinom (tabell 1). Kontrollprøvene var hovedsakelig fra personer med vanlige benigne eggstokkbetingelser (75%), så vel som andre gynekologiske og ikke-gynekologiske kreftformer (8%), og et lite antall ikke-syke prøver (17%), i samsvar med behovet for en klinisk test for symptomatiske kvinner (tabell 1).
Vår begrunnelse for å fokusere på tidlig stadium sykdommen var todelt. For det første er tidlig stadium eggstokkreft betraktes herdbart, men i mange tilfeller symptomene er subtil og vanskelig å oppdage.