Abstract
Bakgrunn
Evaluere diagnostiske og tidlig oppdagelse biomarkører krever sammenligne serum proteinkonsentrasjonen blant biosamples konstatert fra pasienter med og uten kreft . Som hovedregel søkes å standardisere blod behandling og lagringsforhold for saker og kontroller, men blodprøven samling forhold kan ikke være helt kontrollert. For eksempel er blodprøver fra tilfeller ofte hentet fra personer som er klar over sine diagnoser, og samlet inn etter faste eller kirurgi, mens blodprøver fra noen kontroller kan fås i forskjellige forhold, for eksempel en klinikk besøk. Ved å måle effekten av forskjeller i innsamlings forhold på tre ulike markører, undersøkte vi potensialet av disse effektene til skjevhet valideringsstudier.
Metodikk og Prinsipp Funn
Vi har analysert serumkonsentrasjonen av tre tidligere studert antatte eggstokkreft serum biomarkører-CA 125, Prolaktin og MIF-hos friske kvinner, kvinner med eggstokkreft under gynekologisk kirurgi, kvinner som gjennomgår kirurgi for benign eggstokk patologi, og kvinner som gjennomgår kirurgi med patologisk normale eggstokker. For kvinner som gjennomgår kirurgi, ble en blodprøve samles enten i klinikken 1 til 39 dager før kirurgi, og på dagen for kirurgi etter anestesi ble administrert, men før den kirurgiske prosedyren, eller begge deler. Vi fant ut at en markør, prolaktin, ble dramatisk påvirket av innsamlings forhold, mens CA 125 og MIF var upåvirket. Prolaktinnivå var ikke forskjellig mellom case og kontrollgrupper etter regnskap for vilkårene for prøvetaking, noe som tyder på at prøven konstatering kan forklare noen av eller alle de tidligere rapporterte resultater om sitt potensial som en biomarkør for kreft i eggstokkene.
Konklusjoner
Biomarker valideringsstudier bør bruke standardiserte innsamling, bruk flere kontrollgrupper, og /eller samle inn prøver fra tilfeller før påvirkning av diagnose når det er mulig å oppdage og korrigere for eventuelle skjevheter knyttet til prøvetaking.
Citation: Thorpe JD, Duan X, Forrest R, Lowe K, Brown L, Segal E et al. (2007) Effekter av blod samling betingelser på eggstokkreft Serum Markers. PLoS ONE 2 (12): e1281. doi: 10,1371 /journal.pone.0001281
Academic Redaktør: Alice Rumbold, Menzies School of Health Research, Australia
mottatt: 17 oktober 2007; Godkjent: 09.11.2007; Publisert: 05.12.2007
Copyright: © 2007 Thorpe et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Vi er takknemlig for generøs støtte fra Pacific Ovarian Cancer Research Consortium (POCRC) /SPORE i Ovarian Cancer (P50 CA83636, NU), Department of Defense /CDMRP (DAMD17-02-1-0691, NU), og Canary Foundation.
Konkurrerende interesser: Elliot Segal er president og CEO i Onco detektorer International LLC, som produserer den MIF ELISA-analysen brukt i denne studien. Ingen andre konkurrerende interesser eksisterer.
Innledning
Vi hypotese at selv med identisk utvalgets behandling og lagring protokoller miljø og betingelser for prøvetaking kan påvirke nivåene av biomarkører, og at disse potensielle skjevheter bør påregnes i biomarkør valideringsstudie design. Spesielt miljøet rundt diagnose og innsamling av prøver fra tilfeller, for eksempel kirurgisk forberedelse, kan påvirke blodkjemi på en måte som introduserer systematiske endringer som kan være feilaktig tilskrives sykdomstilstanden. Vi viser disse effektene ved å evaluere betingelsene for blodprøvetaking i ett etablert og to nye eggstokkreft serummarkører: CA 125, prolaktin og macrophage Migration hemmende faktor (MIF). Vi viser at CA 125 og MIF oppfører seg som tidligere rapportert, men at prolaktin ytelse er sterkt påvirket av skjevheter i utvalget konstatering.
kreft tidlig deteksjon biomarkør valideringsstudier er laget for å finne ut hvilke proteiner kan skille mellom friske mennesker og de med kreft. I motsetning til dette, har til hensikt en diagnostisk markør for å skille mellom mennesker med kreft og de med godartede tilstander. Til potensielt innvirkning kreft dødelighet en markør må vise unormale nivåer i blodet tilfeller sammenlignet med deres hensiktsmessige kontroller, og for tidlig deteksjonsformål må de heve tidlig nok i sykdomsprosessen for å identifisere sykdommen på et tidlig og mer behandles tilstand [1] . Evaluering av et protein i pre-kliniske prøver samlet godt før mistanke eller diagnose av kreft ville være ideelt for tidlig deteksjon studier, mens prøvene oppnådd ved klinisk presentasjon av sykdommen er mest relevant for diagnostiske markører. Men fordi pre-kliniske prøver er sjelden tilgjengelig, spesielt for sjeldne sykdommer, første fase tidlig deteksjon valideringsstudier ofte søke å avgjøre hvorvidt en markør kan skille personer med symptomatisk sykdom fra friske kontroller før videre investeringer [2].
den primære hensikten med vår biomarkør valideringsstudie er å finne ut i hvilken grad klassifiseringen ytelsen til en biomarkør kan tilskrives sykdom forbundet respons fremfor å konstatering skjevheter i prøvetakingen. Det er vanlig å konstruere case og kontrollgrupper som velges ut på eksempel samling protokoller, lagring varighet, emne alder og annen epidemiologisk informasjon, for å redusere potensielle skjevheter knyttet til disse faktorene. Mindre vekt er lagt på å bruke flere kilder til kontroll eller case-grupper for å oppdage mulige skjevheter eller på ved hjelp av prosedyrer som kan justere for skjevheter som vilkår for prøvetaking. I dette manuskriptet viser vi den potensielle verdien i å gjennomføre biomarkør valideringsstudier ved hjelp av flere kilder til godt kommenterte saken og kontrollgrupper. Vi viser at prolactin er svært følsomme for forholdene i samlingen: etter justering for forholdene i samlingen markøren er ikke lenger ansett som en levedyktig kandidat. CA 125 og MIF blir vist seg å ikke være svært utsatt for disse forholdene.
Vi har valgt tre markører-CA 125, Prolaktin og MIF-å vurdere i en svært annotert sett med case og kontrollprøver.
CA 125 er et mucin-lignende glykoprotein, som er blitt vist å være forhøyet i de fleste kvinner med OC sammenlignet med en frisk befolkning [3]. CA 125 har også blitt evaluert i prekliniske serumprøver, og hver studie antyder at CA 125 er en prediktiv markør som blir stadig kraftigere med nærhet til diagnose [4] – [6]. Imidlertid er CA 125 også forhøyet i flere godartede tilstander, og kan også være en markør for inflammasjon [7]. På grunn av manglende sensitivitet og spesifisitet er CA125 ikke brukes klinisk som en frittstående screeningtest. Fallende CA 125 nivåer etter behandling blir brukt til å bekrefte respons til spesifikke behandlinger [8] og heve CA 125 nivåer signal gjentakelse [9]. CA 125 er en ligand av Mesothelin [10], som kan spille en rolle i den metastasering av OC til peritoneum [11].
MIF er et proinflammatorisk cytokin som er blitt identifisert som en kandidat for tidlig deteksjon markør OC [12], selv om analyse av ytelsen som en biomarkør for tidlig stadium eggstokkreft antydet at det ikke viser høyere sensitivitet eller spesifisitet enn CA 125 [13]. Hemming av de anti-inflammatoriske egenskaper glukokortikoider er en viktig effekt av MIF [14], [15]. MIF kan også formidle noen av de stimulerende effekt på betennelse på kreft progresjon. Bevis på MIF rolle i reguleringen av tumor-suppressor-gener såsom p53 [16], [17] og angiogenese [18], [19] peker på en mulig sammenheng mellom kronisk betennelse og utvikling av kreft.
Prolaktin har blitt identifisert som en kandidat tidlig deteksjon markør for eggstokkreft med rapporter om imponerende høy følsomhet ( 90%) og spesifisitet ( 98%) [12]. Forhøyede nivåer av sirkulerende prolaktin (hyperprolaktinemi), har lenge vært forbundet med hypofyse-tumorer [20], men mer nylig prolaktin er blitt rapportert i forbindelse med en rekke andre kreftformer, inkludert bryst [21] – [23], prostata [24], og tykktarmskreft [25].
Metoder
Studier befolkning og serum prøveinnsamling
serum~~POS=TRUNC prøver~~POS=HEADCOMP ble samlet av Pacific Ovarian Cancer Research Consortium for bruk i biomarkør valideringsforsøk. Prøvene brukt i denne studien var samlet på Swedish Medical Center eller Virginia Mason Hospital (Seattle, WA, USA) mellom 1 juli 2004 og 30. juni ble 2006. Deltakerne rekruttert fra følgende pasientgrupper: tilsynelatende friske kvinner som deltar regelmessig brystkreft screening eksamener (friske kontroller), kvinner som gjennomgår gynekologisk kirurgi for en rekke forhold, men med normal eggstokk patologi (kirurgiske kontroller), kvinner uten kreft, men med benign ovariesyndrom (godartet kontroller), og kvinner diagnostisert med kreft i eggstokkene, egglederen kreft, eller primær peritoneal invasiv kreft. Identiske prøvebehandlingsprotokoller ble brukt for alle grupper.
En prøve av fag fra hver av disse forholdene ble valgt for biomarkør valideringsstudier. Pasienter med tidligere ooforektomi eller diagnose av eggstokkreft ble ekskludert fra studien befolkningen. Tilfeller omfattet 50 etter hverandre som er rekruttert til pasienter med ovarial (n = 45), eggleder (n = 1), og peritoneal kreft (n = 4). Kontrollgrupper friske kontroller (n = 36), kirurgiske kontroller (n = 14), og benigne kontroller (n = 30). Valideringsstudien ble drevet til å oppdage en markør med 30% sensitivitet på 95% spesifisitet, eller bedre. Demografi pasientene i denne studien er beskrevet i Utfyllende Tabeller S1 og S2.
Den sunne, kirurgiske og godartede kontroller som brukes i denne studien ble valgt fra større kontroll populasjoner (n = 346, 63 og 38 henholdsvis ) å matche tilfeller av alder, rase, familiehistorie med eggstokkreft og brystkreft [26], og blod samling dato. Vi brukte tilbøyelighet stillingen matching for å balansere den totale fordelingen av gruppene [27]. I korthet ble en tilbøyelighet poengsum estimert ved å forutsi tilfelle status ved hjelp av logistisk regresjon på hver av de variable av interesse. Etter først å velge tilfellet gruppen, ble individuelle kontroller valgt som best matchet et tilfeldig identifisert medlem av saken gruppe på tildelt tilbøyelighet poengsum før pre-spesifiserte tall for hver kontrollgruppen hadde blitt valgt.
Deltakere i kirurgisk kontroll, godartet kontroll og case populasjoner donert serumprøver enten ved en pre-kirurgisk avtale 1 til 39 dager før kirurgi eller på operasjonsdagen etter administrasjon av anestesi, men før kirurgisk behandling eller kjemoterapi. For å maksimere muligheten til å oppdage forskjeller i markør nivåer på grunn av forholdene i samlingen, inkludert vi prøver samlet både på operasjonsdagen og i pre-kirurgisk avtale fra samme pasient (n = 30) når det er mulig. Deltakere i frisk kontrollgruppe donert blod på en vanlig mammografiscreening avtale.
Laboratoriemetoder
Prolactin og MIF-analyser.
Serum nivåer av prolaktin og MIF ble målt med ELISA bruker kits kjøpt fra Diagnostic Systems Laboratories (Webster, Texas) og Onco detektorer International LLC henholdsvis (Bethesda, MD). Analysene ble utført i henhold til produsentens instruksjoner. Konsentrasjonene av humant prolaktin og MIF ble bestemt ved anvendelse av en lineær standardkurve som ble konstruert ved å plotte den midlere absorbans mot den kjente konsentrasjonen for hver referansestandard. Se Tekst S1 for detaljer.
CA 125 analysen.
Serum nivåer av CA 125 ble målt ved perle-baserte immunanalyser som tidligere beskrevet [28] ved hjelp av anti-CA 125 mus monocolonal antistoffer × 306 (fangst) og × 52 (deteksjon) kjøpt fra Forsknings Diagnostics, Inc (RDI, Flandern, NJ). Readings fra immunoassay ble normalisert og deretter z-score ble beregnet ved sentrering og skalering observasjoner slik at friske kontroller har gjennomsnittlig 0 og varians 1. Se Tekst S1 for detaljer.
Prøvene ble randomisert på to plater med 80 eksemplarer hver, og laboratoriepersonell ble blindet for saksstatus til alle tider.
Statistisk analyse
Receiver Operating kurver (ROC) ble benyttet for å bestemme om serum markør konsentrasjoner diskriminert mellom saker og friske kontroller [29 ]. Arealet under hver ROC-kurven (AUC) ble beregnet og betydning for markør diskriminering (AUC forskjellig fra 0,5) ble bestemt ved bruk av Mann-Whittney U-statistikk. ROC-kurver for sunn kontrollprøver og case-prøver samlet enten før kirurgi eller på operasjonsdagen for hver markør ble sammenlignet ved hjelp av metoden beskrevet av Metz et al [30].
For å vurdere om markør nivåer skilte mellom case og kontrollgrupper etter justering for betingelsene for blodprøvetaking, vi montert flere lineære regresjonsmodeller til hver markør som avhengig variabel med indikatorvariabler for hver sak /kontroll befolkning og en indikatorvariabel for betingelsene for blodprøvetakning (klinikk besøk eller i kirurgi ) som uavhengige variabler. Regresjonsmodellen for
i
th kvinne på tidspunktet
t
var:
Referansegruppen i hver modell er den friske kontrollgruppen. Denne modellen kan potensielt skille komponentene av variansen skyldes forhold til prøvetaking og tilstedeværelse av malignitet. Spesielt for markører som hever på grunn av tilstedeværelsen av eggstokkreft, og er også påvirket av forholdene i blodsamling, hver effekt kan beregnes fra modellparametrene. Regresjoner ble utført ved hjelp av generalisert estimering av ligningene (GEE) metoder for å unngå skjevhet i estimater for standardfeil fordi markør nivåene ble målt to ganger for 30 kvinner i studien.
P-verdier for forskjeller mellom delvis korrelerte ROC-kurver ble beregnet med ROCKIT programvarepakken [31] med bivariate test. Alle andre beregninger ble utført ved hjelp av R statistisk programmeringsspråk [32].
Resultater
Marker nivåer fra hvert enkelt tilfelle /kontrollgruppe samlet i kirurgi og på pre-kirurgisk klinikk besøk er vist i Figur 1 og oppsummert i tabell 1. ROC-analyse viste at CA 125 og MIF-konsentrasjoner diskriminere mellom friske kontroller og hylstre som samles enten ved kirurgi eller en 39 dager før kirurgi (figur 2a, b; p 0,05 for hver markør og tilstand) . Videre AUC var ikke signifikant forskjellig mellom de to innsamlingsforhold (figur 2a, b, p = 0,297 og 0,416 henholdsvis)
Prikkete linjer koble kirurgiske og pre-kirurgisk markør nivåer målt innenfor de samme kvinner under begge. kirurgiske og ikke-kirurgiske tilstander
case-prøvene ble oppnådd enten ved kirurgi (kirurgisk sammenligning, stiplet linje) eller 1-39 dager før kirurgi (pre-kirurgisk sammenligning, heltrukket linje). Den pre-kirurgisk sammenligning antyder at prolaktinnivå ikke diskriminerer mellom kvinner med og uten kreft i klinikken innstillingen. * Viser AUC forskjellig fra 0,5 til alfa = 0,05 signifikansnivå (Mann Whitney U test)
prolaktinnivåer ble sterkt forhøyet i tilfelle prøver samlet ved kirurgi (figur 1c) og prolaktinnivå diskriminert mellom case-prøver samlet på kirurgi og friske kontroller med høy sensitivitet og spesifisitet (figur 2c, stiplet linje). Men forsvant denne forskjellen når vi sammenlignet case prøver samlet 1 til 39 dager før kirurgi for å friske kontroller (figur 2c, heltrukket linje). AUC for å skille mellom saker og kontroller var betydelig lavere i prøver samlet på kort intervall før kirurgi enn for prøvene oppnådd ved kirurgi (figur 2c, p
forskjell i AUC 0,0005). Videre gjorde serumprolaktinnivå ikke diskriminere mellom friske kontroller og fall prøver samlet 1 til 39 dager før kirurgi (figur 2c, heltrukken linje AUC = 0,497).
Vi brukte flere lineære regresjonsmodeller for å undersøke om forskjeller i markør nivåer var assosiert med saksstatus og /eller med betingelsene for blodprøvetakning. I regresjonsmodeller, ble CA 125 og MIF-konsentrasjoner ikke signifikant påvirket av forholdene i blodprøvetaking (tabell 2, p = 0,60 og 0,71 henholdsvis), og ble forhøyet i sakene i forhold til friske kontroller (tabell 2, p 0,005 for hver markør). Prolaktinnivåer ble imidlertid signifikant økning i serumprøver tatt ved kirurgi (tabell 2, s 0,005) og etter justering for betingelser for blodprøvetaking, prolaktin ble ikke hevet i tilfeller sammenlignet med friske kontroller (tabell 2, p = 0,69). Disse dataene antyder at forskjellene observert med prolaktin kan tilskrives helt til blodforhold, uten rest signal assosiert med malignitet.
Diskusjoner
tilnærming for å bruke kommersielt tilgjengelige metoder for å validere kandidat biomarkører er svært lovende. Imidlertid kan resultatene være misvisende dersom betingelsene for blodprøvetakning for saker og kontroller ikke er standardisert eller på annen måte gjort rede for. Vi viser her at serumprolaktinnivå er sterkt påvirket av forholdene i blodprøvetaking og at prolactin ikke diskriminerer mellom kreft og ikke-kreftpasienter i serumprøver samlet inn på samme måte i en klinikk setting. Derimot ble CA 125 og MIF ikke påvirket av forholdene i blod samling; begge merkene diskrimineres mellom saker og kontroller uavhengig av om serumprøver ble samlet inn ved kirurgi eller i et kort intervall før operasjonen.
Dette funnet er i samsvar med tidligere rapporter som prolaktinnivå heve under operasjonen og etter operasjonen i kvinnelig pasienter som gjennomgår kirurgi med halotan (generelt) anestesi [33]. Prolaktin-nivåer er forhøyet også i rotter mot narkose med pentobarbital, uavhengig av kirurgi [34]. I vår studie, ble prøver samlet på operasjonsdagen oppnådd etter generell anestesi ble gitt, men før noen snittene ble gjort. Serum prolaktinnivå ved kirurgi kan ha blitt påvirket av anestesi eller ved andre forhold av kirurgi som stress [20].
I flere lineære regresjonsmodeller, ble forskjeller i CA125 og MIF nivåer forbundet med saksstatus, men ikke av vilkårene for prøve konstatering. For prolaktin, det motsatte var sant som tyder på at prolaktinnivået er påvirket av forholdene i kirurgi og kan ikke være en markør for eggstokkreft. Disse multivariate analysene suppleres ROC analyser ved å justere for vilkårene for blodprøvetaking, og dermed åpner for muligheten for at en markør signaler malignitet tross for å bli påvirket av forholdene i blodprøvetaking. Justering for samling forhold i analysen er nyttig mer generelt når blodprøver tatt under identiske betingelser er ikke tilgjengelig fra hver deltaker i en studie.
Bruk av flere kilder til kontrollprøver samlet inn under ulike forhold kan varsle forskere til potensielle skjevheter. Vi har vist at å tillate innsamling forhold til å variere i saker og kontroller, men bruker riktig merknader kan varsle forskere til potensielle problemer. Når det ikke er mulig å få flere samlinger fra saker (både i og utenfor kirurgi) bruk av kirurgiske kontroller kan brukes som en skjerm for mulige effekter av samlingen tilstand. For eksempel, kan det sees i figur 1c at prolaktin-nivåene er høyere i kontrollgruppene, hvor prøvene ble innsamlet ved kirurgi enn i friske kontroller, igjen antyder at forhøyede prolaktinnivåer ikke kan være spesifikke for malignitet.
begrensede tilgjengeligheten av pre-kliniske prøver fra eggstokkreft pasienter presenterer en betydelig utfordring for forskerne prøver å oppdage eller validere nye biomarkører for tidlig deteksjon. Flertallet av prøver fra kreftpasienter som er tilgjengelige for forskning er ikke samlet inn fra kvinner eller klinikere som er blind for sin forestående diagnose. Våre resultater viser at skjevheter mellom sak og kontrollpopulasjoner kan føre til falske positive eksperimentelle resultater og at styring for vilkårene for blodprøvetaking kan redusere falske funn og falsk validering i biomarkør eksperimenter. Det er viktig å oppdage, og når det er mulig å korrigere for, skjevheter i forhold til blodprøvetaking ved forsøk på å oppdage og validere nye biomarkører.
Hjelpemiddel Informasjon
Tabell S1.
Oppsummering av pasientens demografi av saksstatus
doi: 10,1371 /journal.pone.0001281.s001 plakater (0,03 MB DOC)
Tabell S2.
Oppsummering av eggstokkreft ved scenen og histologi
doi: 10,1371 /journal.pone.0001281.s002 plakater (0,03 MB DOC)
Tekst S1.
detaljerte beskrivelser av Analyseprosedyrer
doi: 10,1371 /journal.pone.0001281.s003 plakater (0,03 MB DOC)