Abstract
Bestemme uttrykk nivået av human epidermal vekstfaktor reseptor 2 (HER2) i svulstvev er av stor betydning for personlig terapi i magekreft. Selv om flere studier har undersøkt hvorvidt serum HER2 kan tjene som et surrogat for vev HER2 status, har resultatene vært inkonsekvent. Vi utførte derfor en meta-analyse av publiserte kliniske studier i et forsøk på å løse dette problemet. PubMed, Embase, Web of Science, Cochrane Library og Science Direct ble spørres for kvalifiserte studier som kan gi tilstrekkelige data til å lage 2 × 2 krysstabeller. Kvaliteten av studiene som inngår i meta-analysen ble vurdert i henhold til revidert kvalitetsvurdering av diagnostisk nøyaktighet Studies (QUADAS-2) kriterier. Den samlede sensitivitet, spesifisitet og diagnostiske odds ratio (DOR) ble beregnet for de kvalifiserte studier. Sammendraget mottaker som opererer karakteristikk (SROC) kurve ble konstruert og arealet under SROC (AUSROC) ble anvendt for å vurdere generell diagnostisk ytelsen. Åtte studier med totalt 1170 deltakere ble inkludert i vår meta-analyse. Den samlede sensitivitet, spesifisitet og DOR var 0,39 (95% KI: 0,21 til 0,61), 0,98 (95% KI: 0,87 til 1,00), og 27 (95% KI: 9-81), henholdsvis. Den AUSROC var 0,77 (95% KI: 0,73 til 0,80) og Deeks trakt tomten antydet fravær av publikasjonsskjevhet (p = 0,91). Meta-regresjonsanalyse indikerte at terskelen effekten var den viktigste kilden til heterogenitet. Analyser for å vurdere serum HER2 nivåene er svært spesifikke og demonstrere moderat diagnostisk ytelse for HER2 vev status i magekreft
Citation. Zhang K, Cui J, Xi H, Bian S, Ma L, Shen W, et al . (2015) Serum HER2 er en potensiell surrogat for Tissue HER2 status i Gastric Cancer: en systematisk oversikt og meta-analyse. PLoS ONE 10 (8): e0136322. doi: 10,1371 /journal.pone.0136322
Redaktør: Elda Tagliabue, Fondazione IRCCS Istituto Nazionale dei Tumori, ITALIA
mottatt: 17 mars 2015; Godkjent: 02.08.2015; Publisert: 20 august 2015
Copyright: © 2015 Zhang et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer
Finansiering:. Dette arbeidet ble støttet med tilskudd fra Nature Science Foundation National Kina, et stipend fra Folkets frigjøringshær Medical Technology (nr 81272698, 81101883, 81172368.) prosjekt for Fremme Youth (13QNP185), en bevilgning fra Special Scientific Research Foundation of Health Sector fra National Health and Family Planning Commission of China (nr 201 302 016), et stipend fra hovedstaden helseforskning og utvikling av spesielle (No. 2011 -5001-01), et stipend fra PLA medisinsk og helsefaglig forskning fond prosjekt (No.11BJZ17), et stipend fra PLA Medical Technology viktig prosjekt for vitenskapelig forskning i det 12. forskningsprosjekter i 12. femårs-Plan (No. BWS12J049), og et stipend fra prosjekt støttet av National High Technology Research and Development Program of China (No. 2012AA02A504)
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
de siste årene har vært vitne til banebrytende fremskritt i bruk av personlig behandling basert på pasientens genetiske bakgrunn. For magekreft, i 2010 fase III Trastuzumab for magekreft (toga) klinisk studie viste effekt og sikkerhet av trastuzumab i forvaltningen av human epidermal vekstfaktor reseptor 2 (HER2) -positivt avansert mage eller gastroøsofageal krysset (GEJ) kreft [1 ]. HER2 er kodet av
HER2 /neu
onkogen og tilhører hennes familie av tyrosin kinase reseptorer. Disse reseptorene spille en sentral rolle i reguleringen av ulike cellulære prosesser, inkludert vekst, overlevelse og migrasjon, og representerer kandidat molekylære terapeutiske mål i en rekke krefttyper [2]. Økt forekomst av HER2 er observert i 6% til 35% av magekreft [3] og forholdet mellom denne overekspresjon og pasient prognose er fortsatt kontroversielt [4-6]. HER2-positive pasienter med magekreft kvalifisere for trastuzumab basert terapi, og derfor bestemme HER2 status i pasient svulstvev er av stor betydning før administrering av anti-HER2 rettet behandling.
I dagens kliniske praksis , vevsprøver oppnås ved kirurgi eller biopsi er først og fremst brukes til å vurdere pasientens HER2 status følgende analyse av immunhistokjemi (IHC) eller fluorescens in situ hybridisering (FISH) [7, 8]. Men disse invasive prosedyrer ikke utføres flere ganger for å sjekke for dynamiske endringer i HER2 status under pasientbehandling eller oppfølging fordi de representerer upraktisk metoder for overvåking behandlingsrespons. Videre kan komplikasjoner forbundet med biopsi påtreffes [9]. I tillegg motstridende resultater fra IHC eller FISH-analyse, som kan oppstå på grunn av variasjoner i prøvebehandlingsprosedyrer mellom ulike laboratorier, eksistensen av ikke-standardiserte analyser og scoring systemer, eller iboende heterogenitet innen kreftceller, kan også vise seg å være problematisk [10, 11]. I lys av slike potensielle ulemper, har etterforskerne blitt stadig mer interessert i å utvikle mer praktisk, reproduserbar og mindre invasive deteksjonsmetoder for å identifisere HER2-positive pasienter.
Uttrykket serumnivået av HER2 representerer en ikke-invasiv biomarkør som kan supplere dagens HER2 testing. Undersøkelser har avdekket en relativt høy samstemmighet mellom forhøyede serum HER2 nivåer og positiv HER2-status i tumorvev [12, 13]. Det har også blitt rapportert at serum HER2 kan potensielt brukes til å overvåke tilbakefall av brystkreft [14]. Sammenlignet med biopsi, gir serum HER2 analyse en mer reproduserbar og egnet alternativ som en generell screening test for karakterisering av en kreftpasient genetiske profilen, og vil derfor ha stor nytte innen målrettet kreftbehandling. Med hensyn til magekreft, har flere kliniske sentre undersøkt korrelasjon mellom serum HER2 og clinicopathological egenskaper i tillegg til vevet HER2 status av pasienter [15-17]. Endringer i serum HER2-nivåer under kjemoterapi har blitt rapportert å korrelere med respons på kjemoterapi hos pasienter med HER2-positive tumorer [18]. Likevel, disse studiene skiller seg på mange aspekter som gruppestørrelse, prøvetaking tid, tumor-node-metastaser (TNM) scenen, og cut-off-verdier, som alle komplisere evnen til å trekke endelige konklusjoner.
I denne studien gjennomførte vi derfor en meta-analyse for å undersøke den diagnostiske nøyaktigheten av serum HER2 for å bestemme svulst HER2 status. Så langt vi kjenner til, har dette arbeidet ikke er utført tidligere.
Metoder
Den meta-analyse ble utført i samsvar med standard retningslinjer for systematisk gjennomgang av diagnostisk test nøyaktighet [19] og brukte Preferred Reporting Varer til systematiske oversikter og meta-analyser (PRISMA) Vern [20] som mal for rapportering (S1 PRISMA sjekkliste).
Søkestrategi strategi~~POS=HEADCOMP
PubMed, Embase, Web of Science, ble Cochrane Library og Science Direct elektroniske databaser søkte på ringer fra tidspunktet for databasen begynnelse til 17. januar ble 2015. elementene i følgende tre kategorier brukt i ulike kombinasjoner når avhør databaser: ( «serum» eller » løselig «) og (» human epidermal vekstfaktor-reseptor-2 «eller» HER2 «eller» c-erbB-2 «) og (« gastrisk cancer «eller» mage neoplasme «eller» mage svulst «). Engelsk begrensning ble brukt på alle søk. Artikler og referanselister ble også manuelt screenet for relevante studier.
Study utvalg
To etterforskere uavhengig vurdert det abstrakte og tittel på hver publikasjon for å identifisere de artiklene som var sannsynlig å vurdere diagnostisk verdi av serum HER2 i magekreft. Når slike artikler ble identifisert full-tekstene ble videre undersøkt for å vurdere studien relevans. Utvalgte studier ble valgt i henhold til de følgende inklusjonskriterier: i) uttrykket nivåer av både serum og vev HER2 ble påvist i magekreftpasienter; ii) diagnosen magekreft ble bekreftet av histopatologiske eller cytologisk undersøkelse; iii) tilstrekkelige data var tilgjengelig for å lage en 2 × 2 contingency tabellen. Eksklusjonskriterier var som følger: i) duplikater; ii) konferanse abstracts, kommentarer, brev og dyreforsøk; iii) tilstrekkelige data til å beregne for sensitivitet og spesifisitet, dvs. falske og sanne positive og negative var ikke tilgjengelig. Når det var usikkerhet knyttet til valgbarhet, ville en diskusjon avholdes mellom de to etterforskere og en senior etterforsker til enighet ble nådd.
Data utvinning og kvalitetsvurdering
To etterforskere uavhengig hentet data fra hver studie , slik som etternavn på første forfatter, utgivelsesår, opprinnelsesland, innrullert deltakere, TNM stadium, stor svulst subtype (Lauren klassifikasjon), metoder for serum HER2 deteksjon, cut-off verdi og antall sanne positive (TP ), falske positiver (FP), falske negative (FN) og sanne negativer (TN). Når forskjellige grenseverdier ble brukt i den samme studien ble den pre-spesifiserte verdien og den tilhørende sensitivitet og spesifisitet hentet [16, 21].
Den metodiske kvaliteten på hver kvalifiserte studier ble vurdert ved hjelp av den reviderte kvalitetsvurdering av diagnostisk nøyaktighet Studies (QUADAS-2) kriterier [22], som består av fire sentrale områder som diskuterer pasientens valg, indeks testen, referansestandard og flyt og timing. Hvert domene omhandler risiko for skjevhet, mens de tre første domenene har også avtale med bekymringer angående anvendelse. Signale spørsmål er inkludert for å bistå dom i form av risiko for systematiske feil og bekymringer med anvendelse. Spørsmål besvares som «ja», «nei» eller «uklar» og er formulert slik at «ja» innebærer lav risiko for skjevhet /bekymringer og «nei» innebærer høy risiko for skjevhet /bekymringer.
Statistisk analyse
En 2 x 2 tabell ble konstruert for å beregne sensitivitet, spesifisitet, positiv sannsynlighet forholdstall (PLR), negative sannsynlighetsforhold (NLR) og diagnostiske odds ratio (DOR) ved hjelp av bivariate regresjonsmodeller, som anbefalt av Cochrane Diagnostic Test Nøyaktighet Working Group [19]. Den bivariate modellen tar hensyn til den potensielle trade-off effekt mellom sensitivitet og spesifisitet [23]. PLR er beregnet som følger: følsomhet /(1-spesifisitet) mens NLR er beregnet som følger: (1-sensitivitet) /spesifisitet. Vanligvis en PLR 5,0 og en NLR 0.2 ble ansett som klinisk nyttig [24, 25]. DOR er en prevalens uavhengig indikator som kombinerer sensitivitet og spesifisitet, og er beregnet som: PLR /NLR [26]. Sammendraget mottaker drift karakteristikk (SROC) kurve ble bygget og området under SROC (AUSROC) beregnet.
Jeg
2
statistikk [27], som beskriver andelen av den totale variasjonen på tvers av studier som skyldes heterogenitet snarere enn en tilfeldighet, ble brukt for å vurdere mellom-studie heterogenitet, med en verdi som overstiger 50% indikerer eksistensen av betydelig heterogenitet.
Jeg
2
statistikken er beregnet som følger: 100% x (Q-df) /Q, hvor Q er Cochran heterogenitet statistikk og df er grader av frihet. Verdien av
Jeg
2
varierer fra 0-100%, med 0% antyde ingen observert heterogenitet, og større verdier indikerer økende heterogenitet. Heterogenitet forårsaket av terskel effekt ble evaluert ved Spearmans korrelasjonskoeffisient som beskrevet tidligere [28-30]. Univariable og multivariable meta-regresjon analyser ble utført for å påvise mengden av ikke-terskel effekt heterogenitet mellom studiene. Deeks trakt tomten ble brukt til å evaluere publikasjonsskjevhet og et signifikansnivå på α = 0,05 ble benyttet for å bestemme statistisk signifikans [31].
Alle analyser ble utført ved bruk av Stata (versjon 12.0, StataCorp, College Station, Texas USA).
Resultater
etter unntatt duplikasjoner, det første søket ga 1504 poster, hvorav 15 artikler ble vurdert potensielt egnet for inkludering i meta-analysen. Etter en gjennomgang av fulltekstartikler, ble ytterligere sju ekskludert [32-38], og etterlater en totalt åtte artikler for den samlede analysen [15-18, 21, 39-41]. Et flytdiagram oppsummerer utvelgelsesprosedyren for studier valgbarhet er vist i figur 1.
Totalt 1170 pasienter med magekreft ble inkludert i meta-analyse med median pasientens alder blant studier som spenner fra 53 til 71 år. Fire studier ble utført retrospektivt måte, mens de resterende spesifiserte ikke design. Syv studier tok blodprøver før noen behandling, og en undersøkelse tok prøver etter behandling. Forekomsten av økt forekomst av HER2 i magekreftpasienter i studiene varierte fra 6,7% til 61,6%. Den optimale cut-off verdien ble pre-spesifisert i fem av studiene. I disse studiene et serum HER2 konsentrasjon på 15,0 ng /ml (anbefalt av Food and Drug Administration for brystkreft) eller 15,2 ng /ml (anbefalt i produsentens instruksjoner for den aktuelle kommersielle kit) ble brukt. De resterende tre studiene brukte konsentrasjonen av serum HER2 av friske kontrollpersoner som cut-off point. For å bestemme serumnivået HER2, ble en Chemiluminescence immunoanalyser (clia) anvendt i fem av de studier og en enzymbundet immunosorbent assay (ELISA) ble anvendt i de resterende tre studiene. Enkelte studie egenskaper er oppsummert i tabell 1.
Kvaliteten på de inkluderte studiene ble vurdert i henhold til QUADAS-2. En grafisk oppsummering av metodevurdering av de inkluderte studiene er vist i figur 2.
For de inkluderte studiene, var den samlede sammenslåtte sensitiviteten var 0,39 (95% KI: 0,21 til 0,61) og den samlede spesifisitet var 0,98 (95% KI: 0,87 til 1,00, fig 3). Den sammenslåtte PLR og NLR var 16,6 (95% KI: 4,5 til 61,5) og 0,62 (95% KI: 0,46 til 0,85), henholdsvis. Arealet under SROC var 0,77 (95% KI: 0,73 til 0,80; fig 4) og DOR var 27 (95% KI: 9-81). Resultatene ble oppsummert i tabell 2. En Fagan nomogram ble benyttet for å bestemme posttest sannsynlighet basert på faste pre-test sannsynlighet (figur 5).
mellom-studie variasjon (dvs. heterogenitet) ble funnet å være høy for både sensitivitet (
jeg
2
= 80,27%) og spesifisitet (
jeg
2
= 95,67%). Vi neste undersøkt om det var terskeleffekt hvor variasjoner i sensitivitet og spesifisitet korrelert med forskjeller i cut-off-verdien av serum HER2 i de medfølgende studiene. Overraskende, bivariate modell analyse viste at det var en negativ korrelasjon mellom sensitivitet og spesifisitet, og at 100% av heterogenitet var trolig tilskrives terskeleffekt. The Spearmans korrelasjonskoeffisient var -1. Denne type virkning kan ofte resultere i et skulder-lignende kurve når følsomheten er plottet mot spesifisitet [23], som vist i figur 4. Vi har også undersøkt andre potensielle kilder til heterogenitet av meta-regresjonsanalyse. TNM stadium, pasientgruppen størrelse, prøvetakingstidspunkt, deteksjonsmetode og etnisitet ble brukt som kovariater. Univariable meta-regresjonsanalyse viste at pasientgruppen størrelse stod for heterogenitet av følsomhet, mens TNM stadium, prøvetaking tid og etnisitet sto for heterogenitet av spesifisitet (fig 6). Men når alle de ovennevnte kovariater ble inkludert i et felles analysemodell, meta-regresjonsanalyse viste at ingen var ansvarlige for heterogenitet (p-verdier på 0,66, 0,07, 0,68 0,79 og 0,15 for scene, pasientgruppen størrelse, samplingstid, deteksjon metode og etnisitet, henholdsvis).
til slutt, Deeks trakt tomten viste fravær av publikasjonsskjevhet (p = 0,91) (figur 7).
Diskusjoner
HER2-rettet behandling nødvendiggjør fastsettelse av HER2 status hos pasienter med kreft. I klinisk praksis, er kirurgiske prøver og biopsi ofte brukt for å løse dette problemet. Imidlertid kirurgiske prøver er vanligvis ikke tilgjengelig for pasienter som ikke krever tumorreseksjonen og vevsprøve vev kan gi et falskt negativt resultat på grunn av heterogene HER2 ekspresjon i tumor [42]. Kirurgiske prøver og biopsi vev bare gi begrenset informasjon om pasientens HER2 status fordi de ikke tillater en real-time bilde av HER2 status under sykdomsprogresjon og behandling. I motsetning til dette, kan serumnivåene HER2 undersøkes lett og gjentatte ganger, og i en mindre invasiv måte. Serum HER2 overvåkning er også mindre arbeidskrevende enn kirurgiske teknikker og har potensial til å bli utført av automatiserte analyser muliggjør en objektiv analyse. Flere studier har vist høy konkordans priser mellom serum HER2 konsentrasjon og vev HER2 status [12, 43]. I vår nåværende meta-analyse fant vi at serum HER2 viste høy spesifisitet for påvisning av vev HER2-status i magekreft.
AUSROC gir en global estimat av diagnostisk ytelse. Ifølge de foreslåtte retningslinjer for tolkning av AUSROC verdi [44], serum HER2 hadde en moderat (0,7 AUC 0,9) diagnostisk evne til å diskriminere HER2-positiv magekreftpasienter fra HER2-negative pasienter. Den DOR kan ta verdier mellom null og uendelig, med høyere verdier indikerer bedre diskriminerende teste ytelsen. Vår samlet analyse ga en DOR av 27, noe som indikerer en moderat diagnostisk verdi av serum HER2 i HER2 tumorstatus forutsigelse. I kliniske settinger, er det viktig å vite hvordan en bestemt testresultat spår risiko for unormalt, og dermed sannsynlighet forholdstall brukes ofte, som indikerer i hvilken grad en gitt test ville heve eller senke sannsynligheten for å få sykdommen [24]. Fagan nomogram er en grafisk verktøy som hjelper klinikere bruke testresultater for å beregne en pasients sannsynlighet for å ha en sykdom [45]. I nomogram, en linje trukket fra pasientens pre-test sannsynlighet (vanligvis beregnet i henhold til lokale prevalensdataene og publiserte rapporter) gjennom sannsynligheten forholdet mellom test skjærer med posttest sannsynlighet, som angir pasientens sjanse for å ha sykdommen etter at testresultatene foreligger. I figur 5, med en samlet PLR på 17 og en hypotetisk pre-test sannsynlighet på 16% (medianen prevalens for de åtte studier), bruk av serum HER2 som en test for HER2-positiv tumor-diagnose ville øke post-test sannsynlighet til 76%, noe som betyr at sannsynligheten for magekreftpasienter som har vev-HER-2 positive øker status fra 16% til 76% i tilfelle av en positiv serum-HER2-test. Motsatt, med en pooled NLR på 0,62, avtar etter test sannsynlighet fra 16% til 11% etter et negativt serum-HER2-test. Disse funnene derfor vise at HER2 serum testresultat er av moderat diagnostisk verdi i å bestemme HER2 status for en pasient.
Samlede anslag av sensitivitet og spesifisitet var assosiert med en
Jeg
2
på henholdsvis 80,27% og 95,67%, noe som tyder på tilstedeværelsen av heterogenitet. Til vår overraskelse, bivariate modellen analyse viste at all heterogenitet var sannsynlig å være konsekvensen av terskeleffekt. Terskel effekten oppstår når de inkluderte studiene i meta-analysen bruke ulike tall cut-off verdier for å definere et testresultat som positivt [19]. Cut-off verdier i diagnostiske tester representerer et stort problem som ulike terskler kan føre til variasjoner i sensitivitet og spesifisitet. Av de studiene som inngår i vår meta-analyse, fem brukte cut-off punkter som ble anbefalt enten av Food and Drug Administration for brystkreft eller av produsenten av en bestemt kommersiell kit brukt i en studie. De resterende tre studiene brukte serum HER2 nivåer beregnet for friske kontrollpersoner som en cut-off point og disse kontrollkonsentrasjoner varierte mellom de tre studiene. Ved hjelp av terskler som ble etablert for brystkreft kan være upassende for pasienter med magekreft. Peng et al. har identifisert den optimale cut-off point of serum HER2 som 10,65 ng /ml for mage kreftpasienter, som er lavere enn 15,0 ng /ml cut-off point mer generelt brukt [21]. Ved bruk av denne 10,65 ng /ml terskel, ROC-analyse ga en bedre følsomhet sammenlignet med det som ble oppnådd for 15,0 ng /ml terskel (67,4% vs. 40%), mens spesifisiteten var uendret på 78,9%. I en annen studie [16], ble det optimale serum HER2 cut-off-verdi for å forutsi vev HER2 status i magekreft funnet å være 16,35 ng /ml, som overstiger 15,0 ng /ml terskel. Disse resultatene tyder på at den optimale serum HER2 cut-off-verdi for pasienter med magekreft kan være forskjellig fra den som anvendes for brystkreftpasienter. Kong et al. har selv antydet at ulike etniske grupper har ulike grenseverdier, og at det kan være gunstig å etablere cut-off verdier for hver etnisk befolkning [46]. Dette er et område av forskning som klart tilsier videre undersøkelser.
For å utforske andre mulige faktorer som kan forklare heterogenitet, også utførte vi meta-regresjonsanalyse. Multivariable meta-regresjonsanalyse viste at TNM stadium, pasientgruppen størrelse, prøvetakingstidspunkt, deteksjonsmetode, og etnisitet ikke var ansvarlige for heterogenitet. Dette funnet støttes videre vår forrige resultat at heterogenitet var sannsynlig å være helt konsekvensen av terskeleffekt. På bakgrunn av det lille antall studier er inkludert i analysen, vil vi tolke data på en mer varsom måte, og tyder på at forholdsvis lite antall utvalgte studier kan forhindre strømmen av testen.
Det er viktig å erkjenne de potensielle begrensningene for den foreliggende meta-analyse. Først, til tross for en grundig søk av flere elektroniske databaser, antall inkluderte studiene var små. For det andre, alle studiene var fra Asia, noe som kan føre til en viss iboende forspenning. Tredje, vi kunne ikke finne den ideelle cut-off verdien for serum HER2 test fordi rådata ikke ble gitt i publiserte rapporter. Store prospektive randomiserte studier er nødvendig for å løse dette problemet. Fjerde, kvalitetsvurdering resultatene vist i figur 2 viser at det var en mulig risiko for skjevhet og bekymringer angående anvendelse i pasienten utvelgelsesprosessen i de inkluderte studiene.
Så langt vi kjenner til, representerer vår studie først rapportert meta-analyse rettet mot evaluering av den kliniske nytten av serum HER2 i diagnosen av HER2 tumorstatus. Vår analyse har vist at serum HER2 hadde høy spesifisitet og moderat diagnostisk verdi for å skille HER2-positiv magekreftpasienter fra HER2-negative pasienter, noe som tyder på dens potensial som en surrogat biomarkør av HER2-status. Prospektive studier er nå nødvendig å ytterligere bekrefte våre funn. Spesielt evnen til å forutsi pasientens prognose og respons ved å overvåke serum HER2 nivåer under sykdomsprogresjon og garanterer behandling ytterligere etterforskning.
Hjelpemiddel Informasjon
S1 PRISMA sjekkliste.
doi: 10,1371 /journal.pone.0136322.s001 plakater (DOC)