PLoS ONE: Metode for evaluering av flere Meklere: medierende effekten av røyking og kols på foreningen mellom CHRNA5-A3 Variant og Lung Cancer Risk

Abstract

En mekling modell utforsker de direkte og indirekte effekter mellom en uavhengig variabel og avhengig variabel ved å inkludere andre variabler (eller meklere). Mekling analyse har nylig blitt brukt til å dissekere de direkte og indirekte effekter av genetiske varianter på komplekse sykdommer ved hjelp av case-kontrollstudier. Men skjevhet kan oppstå i beregningene av den genetiske varianten-megler foreningen fordi tilstedeværelsen eller fraværet av megler i studien prøvene ikke er samplet følge prinsippene case-control studie design. I dette tilfellet, kan mekling analyse ved hjelp av data fra case-control studier føre til partisk estimater av koeffisientene og indirekte effekter. I denne artikkelen har vi undersøkt en fler mekling modell som involverer en tre-sti mediere effekten gjennom to meklere som bruker case-control studie data. Vi foreslår en tilnærming til rette skjevhet i koeffisienter og gi nøyaktige anslag over de spesifikke indirekte effekter. Vår tilnærming kan også brukes når den opprinnelige case-control studie er frekvensen matchet på en av meklere. Vi ansatt bootstrapping for å vurdere betydningen av indirekte effekter. Vi gjennomførte simuleringsstudier for å undersøke ytelsen til den foreslåtte tilnærmingen, og viste at det gir mer nøyaktige estimater av de indirekte effektene samt prosent mediert enn standard regresjoner. Vi deretter brukt denne tilnærmingen til å studere de medierende effekten av både røyking og kronisk obstruktiv lungesykdom (KOLS) på sammenhengen mellom CHRNA5-A3 genet locus og risikoen for lungekreft ved hjelp av data fra en lungekreft case-control studie. Resultatene viste at den genetisk variant påvirker risikoen for lungekreft indirekte gjennom alle tre forskjellige veier. Prosentandelen av genetisk tilknytning mediert var 18,3% gjennom røyking alene, 30,2% gjennom KOLS alene, og 20,6% gjennom banen med både røyking og kols, og den totale genetiske kreft foreningen variant-lunge forklart av de to meklere var 69,1%.

Citation: Wang J, Spitz MR, Amos CI, Wu X, Wetter DW, Cinciripini PM, et al. (2012) metode for å evaluere flere Meklere: medierende effekten av røyking og kols på foreningen mellom CHRNA5-A3 Variant og Lung Cancer Risk. PLoS ONE 7 (10): e47705. doi: 10,1371 /journal.pone.0047705

Redaktør: Juan P. de Torres, Clinica Universidad de Navarra, Spania

mottatt: 02.07.2012; Akseptert: 14. september 2012; Publisert: 15 oktober 2012

Copyright: © Wang et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av United States National Institutes of Health (NIH) tilskudd R01CA131324 (SS) og av et fakultet fellesskap fra The University of Texas MD Anderson Cancer Center Duncan Family Institute for Cancer Prevention and Risk Assessment (JW). Denne studien gjør bruk av lungekreft data generert av støtte fra NIH tilskudd U19CA148127 og R01CA121197. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

en mekling modellen er en statistisk metode som utforsker de direkte og indirekte virkningene av en uavhengig variabel (dvs. første variabel) på en avhengig variabel (dvs. utfallet variabel) ved å inkludere en eller flere medierende variabler (eller meklere ) [1]. I enkelte tilfeller kan det mekling modellen antyde årsaks effekter fra den opprinnelige variabelen til megler variable og deretter til utfallet variabel [1]. Mekling modeller har blitt mye brukt i mange ulike felt [2], som psykologi, atferdsmessige vitenskap, genetisk epidemiologi, forebygging forskning, og politisk kommunikasjon forskning. Nylig har det vært arbeidet med å bruke mekling analyse for å dissekere de direkte og indirekte effekter av genetiske varianter på komplekse sykdommer i genetiske varianten assosiasjonsstudier [3] – [7]. De fleste av disse studiene ble det brukt data fra genomomfattende forening (GWA) studier, hvor utfallsvariabler ble valgt på bakgrunn av case-control studie design. For eksempel har vår gruppe brukt én mellommann analyse (dvs. Baron-Kenny prosedyre) for å identifisere mekling effekten av røyking og kronisk obstruktiv lungesykdom (KOLS) på sammenhengen mellom CHRNA5-A3 genetiske locus og risikoen for lungekreft ved hjelp data fra en case-control GWA studie av lungekreft [6]. Men ignorerer case-control studie design og anvende standard regresjoner kan føre partisk beregninger av de indirekte effektene. Ifølge nyere studier av sekundære fenotyper, kan skjevhet oppstå i beregningene av den genetiske varianten-megler foreningen fordi tilstedeværelsen eller fraværet av megler (dvs. saker og kontroller med hensyn til mekler) er ikke samplet etter prinsippene om saken -kontroll studiedesign [8] – [12]. I dette tilfellet, kan mekling analyse ved hjelp av data fra case-control studier føre til partisk indirekte effektestimater, enten over- eller undervurdert avhengig av prevalens verdier av utfallet og meklere.

Lung kreft GWA studier har konsekvent vist at CHRNA5-A3 clusteret er sterkt assosiert med økt risiko for lungekreft. Også har flere studier knyttet SNPs spenner over denne regionen med tunge røyking, nikotinavhengighet, røykeslutt og KOLS [13] – [19]. Dermed er det en debatt om hvorvidt de genetiske variantene har en innvirkning på risikoen for lungekreft direkte eller utøver sin effekt hovedsakelig gjennom dyp effekt av variantene på røykeintensitet [20] – [22] eller KOLS [23]. Videre arbeid undersøker denne foreningen konkludert med at det er to trasé mellom genetisk variant og lungekreft forening, uavhengig via en direkte effekt på lunge kreftutvikling og gjennom røykevaner [6], [7], [15], [24] – [26 ]. Nyere studier av pasienter som røyker, har vist at genetiske varianter på CHRNA5-A3-klyngen har en sterkere tilknytning til kotininnivåer enn med selvrapportert røykeatferd, og foreslo at effekten av genetiske varianter på risikoen for lungekreft, er i stor grad, om ikke utelukkende, ved deres effekt på røyking intensitet [27] – [29]. Men i en ledsagende redaksjonell Spitz et al [21] konkluderte med at i hvilken grad foreningen formidles av røyking er ennå ikke bestemt. Tidligere undersøkelser fokusert på en mediator (f.eks røyking) om gangen, og ingen har studert av flere mediatorer samtidig i en modell. Men i virkeligheten, kan mer enn én mellommann påvirke sammenhengen mellom genetisk variant og risikoen for lungekreft. I vår forrige analyse [6], fant vi at i én mellommann analyser røyking og kols var meklere i foreningen mellom enkeltnukleotidpolymorfi (SNP) rs1051730 og risiko for lungekreft. Men analysere flere meklere i en modell kan ha noen fordeler i forhold til en slik enkelt megler analyser [30].

Den fler mekling modellen for studiet av SNP, røyking, KOLS og lungekreft er avbildet som en bane diagram i figur 1. den multiple-mekling modellen inkluderer en tre-sti medierende effekt gjennom både røyking og COPD, noe som tillater en mediator (dvs. røyking) til årsaks påvirke den annen mediator (dvs. COPD) [31]. Denne årsakssammenheng er biologisk bevisende fordi røyking er den kjente viktig risikofaktor for KOLS [32]. Den underliggende forutsetningen om denne tre-banen mediere effekten er at personer som bærer den skadelige allelet av rs1051730 er mer sannsynlig å være storrøykere, som igjen fører til en høyere risiko for KOLS, som igjen øker risikoen for lungekreft. Derfor, i tillegg til de indirekte virkningene som passerer gjennom hver av meklere alene, vil vi undersøke den indirekte effekten som passerer gjennom begge meklere

X

. Innledende prediktor variable (SNP).

M

1

: mekler (røykeatferd).

M

2

: mediator (KOLS).

Y

. Variabelen av interesse (lungekreft)

Så vidt vi vet, har det ikke vært tidligere studie undersøker en slik multippel mekling modell i case-control studie utforming innstilling , i hvilken den standard regresjon tilnærming kunne gi forspenning estimater for indirekte virkninger som vi beskrevet ovenfor. Derfor utviklet vi en tilnærming til å gjennomføre en fler mekling analyse ved hjelp av modellen vist i figur 1. Vi har utført simuleringer for å undersøke ytelsen til den foreslåtte tilnærmingen, og disse viste tilnærmingen kan gi nøyaktige estimater av de indirekte effektene. Den bootstrapping tilnærming ble brukt for å vurdere betydningen av de indirekte effekter og total effekt. Vi har også utviklet en metode for når den opprinnelige case-control studien er frekvensen matchet på en av meklere, som i vårt lungekreft case-control studie der kontrollene er frekvens tilpasset tilfeller i forhold til røykestatus. Vi benyttet den foreslåtte tilnærming til flere meklings studie av samtidige medierende effekten av røyking og kols på sammenhengen mellom SNP rs1051730 og lungekreft risiko ved bruk av lungekreft case-control GWA studiedata.

Metoder

La

X

,

M

1

,

M

2

og

Y

betegne den genetiske variant, to mediator-fenotyper, og sykdommen variabel, henholdsvis. Vi antok binære variable for både mediator variabler og sykdommen variabel, betegnet som,, og henholdsvis med 0 representerer ikke inntreffer og en som representerer forekomst av mekleren fenotyper eller sykdommen. Vi vurderte en SNP locus med to alleler: skadelige allel

A Hotell og normal allele

en

. Vi først antatt en dominant eller recessiv genetisk modell for genetisk variant og også betegnet det som en binær tilfeldig variabel,. For en dominant genetisk modell, 0 representerer genotype (

en

,

en

) og en representerer genotyper (

En

,

en

) og (

En

,

A

); for en recessiv genetisk modell, 0 representerer genotyper (

en

,

en

) og (

En

,

en

) og 1 representerer genotype (

En

,

A

). Merk at hvis en additiv genetisk modellen ble antatt, var en kategorisk tilfeldig variabel betegnes å representere genotyper (

en

,

en

), (

En

,

en

), og (

En

,

A

), henholdsvis. Gitt de tilfeldige variabler,

X

,

M

1

,

M

2, etter og

Y

, foreningen blant alle tilfeldige variabler er vist i figur 1 kan uttrykkes ved hjelp av følgende betingede sannsynligheter med logistiske modeller: (1) (2) (3) der

a

0

,

b

0

,

c

0

,

et

1

,

a

2

,

b

1

,

b

2

,

d

, og

c «

er regresjonskoeffisienter og

i

,

j

,

k

= 0, 1. det finnes ulike indirekte effekter i denne modellen [33] (se figur 1): (i) den indirekte effekten som passerer gjennom megler

M

1

, omgåelsen

M

2

, som kan vurderes som

a

1b

1 product: (betegnet som

IE

1

); (Ii) den indirekte effekten som passerer gjennom megler

M

2

, utenom

M

1

, som kan vurderes som

a

2b

2

(angitt som

IE

2

); og (iii) de tre-banen indirekte effekt som passerer gjennom begge meklere, som kan vurderes som

a

1 dB

2 plakater (betegnet som

IE

3

) . Derfor kan den totale indirekte effekt som passerer gjennom meklere gis som summering av de ovennevnte indirekte effekter:

a

1b

1

+

a

2b

2

+

a

1 dB

2 plakater (betegnet som

IE

t

). Regresjonskoeffisienten

c «

representerer effekten av den genetiske variant av sykdommen ikke mediert ved enten mediator og som vanligvis kalles den direkte virkning. Generelt er den totale effekten av genetisk variant av sykdommen estimert ved tilbakegang av sykdommen variabelen på genetisk variant variable direkte. Imidlertid har den tidligere analysen viser at den totale effekten beregnet på denne måten, kan bli forspent når sykdom variable og /eller mediator variabler er binært [34]. Derfor, i denne studien rapporterte vi den totale effekten (

TE

) ved hjelp av en alternativ formel definert som summen av de indirekte og direkte effekter (angitt som

TE

=

IE

t

+

c «

). I dette tilfellet prosenter av foreningen forklares med de ulike meklings baner (prosent mediert,

PM

) kan vurderes som de spesifikke indirekte virkningene dividert med den definerte totale effekten, henholdsvis, og betegnes som

PM

1

=

IE

1 Twitter /

TE

,

PM

2

=

IE

2

/

TE

,

PM

3

=

IE

3 Twitter /

TE

, og

PM

t

=

IE

t Twitter /

TE, etter som representerer

PM

av

M

1

forbi

M

2

,

PM

av

M

2

forbi

M

1

,

PM

av både

M

1 Hotell og

M

2

, og den totale

PM

gjennom forskjellige baner, henholdsvis.

Når data av interesse er tilfeldig samplet fra den generelle befolkningen, de beregninger av de indirekte effektene og prosent mediert er nøyaktige. Men dersom opplysningene er samplet basert på en case-control studie design, de estimerte sammenhengene mellom den opprinnelige variable og begge formidlere (dvs.

et

1

,

a

2

og

d

) vil være partisk hvis standardlogistikk regresjoner er ansatt, som i sin tur vil føre til partisk beregninger av indirekte effekter og prosent formidlet [8] – [12]. For å få nøyaktige beregninger av koeffisientene

et

1

,

a

2

, og

d

, vi endret bias-korreksjon tilnærming foreslått i vår tidligere studie [12]. I korte trekk, kan forspent koeffisienten beregnes ut fra logistisk regresjon, utbredelsen verdier av sykdommen, og begge mediator fenotyper bli uttrykt ved hjelp av ikke-lineære ligninger. Prevalensen verdier er hentet fra litteraturen, og robustheten av denne tilnærmingen til misspecification av prevalen verdier har blitt undersøkt i våre tidligere arbeider [12], [35]. Løse system av ikke-lineære ligninger gir oss de korrigerte koeffisienter. For formålet med multippel-mediator modell ble forskjellige ikke-lineære ligninger som anvendes for å korrigere forskjellige koeffisienter. Korreksjonen tilnærming for regresjonskoeffisienten

d

for

M

1 Anmeldelser –

M

2

forening, mens regressing

M

2

M

1 Hotell og

X plakater (se figur 1), er gitt nedenfor. Korreksjonen nærmer for de andre parametrene, nemlig

et

1 Hotell og

a

2

, er gitt i tekst S1.

Korrigering av Coefficient

d

Som nevnt ovenfor, regresjonskoeffisienten

d

, av

M

1 Anmeldelser –

M

2

forening mens tilbakegang

M

2

M

1 Hotell og

X

kunne være partisk. Vi brukte følgende ikke-lineære estimering ligning tilnærming for å korrigere skjevheter. Gitt et utvalg av

N

deltakere, hvorav

N

1

er tilfeller (

Y

= 1) og

N

0

er kontrollene (

Y

= 0) i forhold til sykdommen, odds ratio (OR) for sammenhengen mellom meklere

M

1 Hotell og

M

2 plakater (exp (

d

)) kan uttrykkes som følger: (4) der

E

kj

er forventet antall individer i prøven, med

M

2

=

k Hotell og

M

1

=

j

, som er gitt aswhere

j

k

,

r

= 0, 1. betinget sannsynlighet

p

kj

Legg att eit svar