PLoS ONE: Pathway-Based analyse ved hjelp av Genome-wide Association data fra en koreansk Ikke-småcellet lungekreft Study

Abstract

Pathway basert analyse, som brukes i forbindelse med genome-wide forening studie (GWAS) teknikker, er et kraftig verktøy for å oppdage subtile, men systematiske mønstre i genomet som kan bidra til belyse komplekse sykdommer, som kreft. Her, vi gikk tilbake fra genetisk polymorfisme på et enkelt locus og undersøkt hvordan flere forenings signaler kan orkestrert å finne veier knyttet til lungekreft mottakelighet. Vi brukte enkeltnukleotidpolymorfi (SNP) array-data fra 869 ikke-småcellet lungekreft (NSCLC) saker fra en tidligere GWAS ved National Cancer Center og 1,533 kontroller fra den koreanske Association Resource prosjekt for veien basert analyse. Etter kartlegging single-nukleotid polymorfismer i gener, vurderer sin kodende region og regulatoriske elementer (± 20 KBP), multivariat logistisk regresjon av additiv og dominerende genetiske modellene ble montert mot sykdomsstatus, justert for alder, kjønn og røykestatus. Pathway statistikken ble evaluert ved hjelp av Gene Set Enrichment Analysis (GSEA) og Adaptive Rank avkortet Produkt (ARTP) metoder. Blant 880 trasé, 11 viste relativt betydelige statistikk i forhold til våre positive kontroller (P

GSEA≤0.025, falske funn rate≤0.25). Kandidat trasé ble validert ved hjelp av ARTP metode og likheter mellom banene ble beregnet mot hverandre. Den topprangerte trasé var

ABC transportører product: (P

GSEA 0,001, p

ARTP = 0,001),

VEGF signalveien product: (P

GSEA 0,001, P

ARTP = 0,008),

G1 /S Check Point product: (P

GSEA = 0,004, p

ARTP = 0,013), og

NRAGE Signaler Død gjennom JNK

(P

GSEA = 0,006, p

ARTP = 0,001). Våre resultater viser at veien analysen kan belyse post-GWAS forskning og bidra til å identifisere potensielle mål for kreft mottakelighet

Citation. Lee D, Lee GK, Yoon KA, Lee JS (2013) Pathway-basert analyse ved hjelp Genome-wide Association data fra en koreansk ikke-småcellet lungekreft Study. PLoS ONE 8 (6): e65396. doi: 10,1371 /journal.pone.0065396

Editor: William C. S. Cho, Queen Elizabeth Hospital, Hong Kong

mottatt: 05.02.2013; Godkjent: 24 april 2013; Publisert: 06.06.2013

Copyright: © 2013 Lee et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Forskningen ble støttet av National Cancer Center forskningsstipend 1210360. de bevilgende myndighet hadde noen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Lungekreft er en av de viktigste årsakene til kreftdødelighet i Korea og over hele verden [1] -. [3]. Blant de mange lungekreft histologiske typer, mer enn 70% av koreanske lungekrefttilfellene er ikke-småcellet lungekreft (NSCLCs), den ledende subtype være adenokarsinom [4].

Selv om årsakene til sykdommen kan stamme fra miljømessige faktorer, slik som kreftfremkallende som finnes i sigarettrøyk og innånding av giftige kjemikalier, i arbeidet med å fastslå etiologien av sykdommen, har forskerne vurdert det genetiske mangfoldet av individer. Flere genom-wide assosiasjonsstudier (GWASs), som fokuserer på scanning for sykdomsassosierte SNPs over hele genomet, har demonstrert mulig lungekreft mottakelighet loci det siste tiåret. De fleste av disse GWASs var basert på europeiske og amerikanske befolkninger og kjente mistenkte identifisert var 5p15 (hTERT-CLPTM1L) [5], [6], 6p21 (BAT3-MSH5) [7], og 15q25 (CHRNA 3-5) [8 ] – [10]. I forrige GWAS involverer 1,425 NSCLC pasienter og 3,011 kontroller fra Korea, rapporterte vi at en roman locus, 3q29, og et locus tidligere rapportert hos pasienter med europeisk avstamning, 5q15, var assosiert med lungekreft på koreansk befolkning [11].

til tross for vellykket identifikasjon av disse sykdomsresistens loci ved hjelp GWASs, er det antatt at de forklarer bare en liten andel av den estimerte arve [12]. GWASs sammenligne en halv million til millioner av markører på en gang og varianter med beskjedne foreninger er sannsynlig å bli neglisjert etter gjen testing korreksjon [13]. Ved sin natur, er det svært usannsynlig at en enkelt variant er forbundet med en kompleks sykdom som kreft. Det antas at lav-penetrans varianter hele genomet vil bedre forklare biologien i spørsmålet [14]. For å kompensere for svakhetene i GWAS, i stedet for å stole på en streng genom-wide betydning cutoff, til alternative metoder forbedre strøm, som for eksempel bruk av kombinasjoner av SNP markører [15] – [20], inkorporering av kalkulatoriske genotyper og linkage informasjon [21] – [23], og nå nylig, pathway baserte tilnærminger [24] har blitt utviklet

pathway baserte tilnærminger er basert på prinsippet om at gener som er involvert i den samme funksjonelle sti samhandle med hverandre. annet og utgjør et nettverk, slik at deres sykdoms foreninger henger sammen [25]. Strømbanen baserte analyser har blitt inspirert hovedsakelig fra genuttrykk microarray dataanalyse. Basert på tidligere biologisk kunnskap, gen sett berikelse analyse (GSEA) [26] måler hvor mye foreningen signaler er beriket i et definert sett av gener. Fordi GSEA krever microarray data som input, har flere grupper foreslått endringer i den opprinnelige algoritmen til å innlemme GWAS data [27] -. [30]

I denne studien har vi brukt GSEA baserte pathway analyse foreslått av Wang et al. [24] med vår forrige koreanske lungekreft GWAS data, fra 869 saker og 1,533 kontroller, med håp om å finne ytterligere mottakelighet loci og for å få innsikt i den underliggende patogenesen (figur 1). Pathways viser høy statistisk signifikans ble validert ved hjelp av en annen sti-basert metode som kalles adaptiv rang avkortet produkt (ARTP) [31]. I motsetning til GSEA, er ARTP en selvstendig test [32] som direkte knytter gener i en vei til sykdommer og fungerer uavhengig av gener utenfor veien. Vi rapporterer syv baner inndelt i fire cellulære prosesser som viste konsistente assosiasjoner med koreansk NSCLC mottakelighet.

Materialer og metoder

Etikk erklæringen

Studiet ble godkjent av Institutional Review Board og etikkomiteen av National Cancer Center Korea. Blodprøver ble tatt fra NSCLC pasienter som har besøkt National Cancer Center Korea og tok en frivillig helse spørreundersøkelse mellom mai 2002 og desember 2005. For hver blodprøve, skriftlig informert samtykke, godkjent av Institutional Review styremedlemmer, ble oppnådd. Alle kliniske undersøkelser ble gjennomført i henhold til prinsippene i Helsinkideklarasjonen.

Studiepopulasjon

I utgangspunktet vi rekruttert 2,441 koreanske NSCLC tilfeller og kontroller (871 tilfeller og 1,570 kontroller) for denne studien. De fleste NSCLC prøver (621 tilfeller) ble delt fra en tidligere GWA studie ved National Cancer Center Korea [11], og ytterligere 250 pasienter med NSCLC ble nylig rekruttert for genotyping. Til sammenligning ble genotyping data på 1,570 kontrollpersoner uten kreft levert av koreanske Association Resource (KARE) prosjekt, en pågående populasjonsbasert kohort studie som er utført av Korea National Institute of Health (KNIH) og Center for Disease Control og Prevention (KCDC) siden 2007 [33]. Vi søkte streng prøve kvalitetskontroll (QC) kriterier, vurderer rå signalintensitet, genotyping rate (≥95%), klinisk informasjon, og befolkningen stratifisering å filtrere ukvalifiserte prøver. Spesielt fjernet vi 19 prøver med lav-genotyping kvalitet, 18 med utilstrekkelig demografisk informasjon, og to med kjønn forveksling. Som et resultat, 869 tilfeller og 1,533 kontroller passert QC og forble for etterfølgende analyse. Blant 869 histologisk bekreftet NSCLC tilfeller 623 tilfeller var adenokarsinomer, mer enn 70% av våre NSCLC pasienter, 175 tilfellene var plateepitel-karsinom, og resten var andre NSCLC histologiske typer (tabell 1). Mer enn 97% av pasientene (n = 2334) ble genotypet ved hjelp av Affymetrix Genome-Wide Menneskelig SNP Array 5.0 (Affymetrix, Santa Clara, CA, USA), og resten (n = 68) ble genotypet ved hjelp av Affymetrix Genechip Menneskelig Mapping 500 K Array Set. Ved genotyping og sammenslåing datasettene, søkte vi følgende SNP QC filtre: SNPs med en mindre allel frekvens (MAF) på mindre enn 5% og genotyping samtalepriser på mindre enn 95%; Hardy-Weinberg likevekt (HWE) test P-values≤0.0001 ble ekskludert fra videre analyse.

Pathway Definisjon av

Vi laget en liste over pathway definisjoner basert på tre store offentlig tilgjengelig veien databaser: spesifikt, 217 gensettene fra BioCarta [34], 186 fra Kyoto Encyclopedia of gener og genomer (KEGG) [35], og 430 fra Reactome [36]. Vi har også inkludert flere kuraterte pathway gensettene fra SABiosciences [37], Sigma-Aldrich [38], signaltransduksjon Kunnskap Environment of Science magazine [39], og signalveien Database (SPAD) av Kyushu University [40] for å dekke totalt 880 av biologiske mekanismer (vedlegg S1).

for å måle resultatene av vår analyse og å sette en baseline, vi også utarbeidet seks tilpassede trasé fra tidligere rapporterte lungekreft mottakelighet gener. Først lånte vi ni onkogener (IL1B, MTHFR, AKAP9, CAMKK1, SEZ6L, FAS, FASLG, TP53, og TP53BP1) fra en undersøkelse gjennomført av International Lung Cancer Consortium (ILCCO) [41]. Ifølge ILCCO studien, genetiske varianter med sterke bevis for en sammenheng med risikoen for lungekreft tilhørte gener fra ulike kreftrelaterte veier, for eksempel betennelse (IL1B), folat metabolisme (MTHFR), regulerende funksjon (AKAP9 og CAMKK1), celle adhesjon (SEZL6) og apoptose (FAS, Fasl, TP53, TP53BP1, og BAT3). I tillegg vedtok vi 11 NSCLC driver mutasjon gener (EGFR, KRAS, erbB2, ALK, BRAF, PIK3CA, akt1, MAP2K1, MET, ROS1, og NRAS) fra en gjennomgang av Pao og kolleger [42], [43]. I lys av sin gjennomgang av hvordan disse genene påvirker kreftcelle spredning og overlevelse, inkludert vi disse klinisk viktige gener som grunnlag for vår positive kontroller. Til slutt la vi gener dekket i lungekreft mottakelighet loci rapportert i flere tidligere GWA studier: C3ORF21 og TP63 fra 3q28-29 [11], [44], TERT og CLPTM1L fra 5p15 [5], [7], BAT og MSH5 fra 6p21 [7], CHRNA5, CHRNA4, og CHRNA3 fra 15q25 [8] – [10], og DNA-reparasjonsgener (XRCC1, RRM1, ERCC1) [45]. Vi kategorisert gener etter sted eller etter funksjon og designet seks ulike kombinasjoner av lungekreftrelaterte gensettene som positive kontroller (tabell 2).

SNP Association og kartlegging

Multivariat logistisk regresjon av additiv og dominerende genetiske modellene ble montert mot sykdomsstatus, justert for alder, kjønn og røykestatus, til nøyaktig fange SNP foreningen signaler. Fordi vi var interessert i hovedsak i de genetiske effektene av å ha en variant allel og MAF var generelt lav for vår studie bassenget, vi utelukket recessive genetiske modellen fra vår analyse.

Også 20 kbp oppstrøms for 5′ enden og 20 kbp nedstrøms for 3′-enden ble ansett for å være en del av et gen, slik som å inkludere den kodende region og regulatoriske elementer. Den mest signifikant assosiert SNP innenfor et gen region ble valgt til å representere hele genet området. Bare gensettene med minimum 20 gener og maksimalt 200 gener ble vurdert i den påfølgende analysen.

Pathway Analysis

Vi delte veien analyse i to-trinns screening og valideringsprosesser. Først brukte vi en SNP tilpasning av GSEA metode utviklet av Wang et al. [24] for å screene kandidat pathways forbundet med NSCLC risiko. Deretter, ved hjelp av ARTP algoritmen utviklet av Yu et al. [31], bekreftet vi de statistiske betydninger av kandidat trasé.

Gene Set Enrichment Analysis (GSEA).

For hvert gen, SNP med høyest testobservator (koeffisient t-statistikken fra logistisk regresjon i vårt tilfelle) ble bestemt til å representere genet. For alle N gener, ble foreningen statistikk sortert fra størst til minst (r

1, r

2, …, r

N), og en vektet Kolmogorov-Smirnov-lignende (KS) som kjører sum berikelse poengsum (ES) av veien S med N

p gener ble beregnet ut fra rangert liste av gener [24].

Fordi beregningen av ES (S) ble basert på en maksimal statistikk, veier med store tall av gener hadde klart fordeler fremfor mindre veier. Å sammenligne statistikk mellom veier av forskjellig størrelse, ble en normalisert berikelse score (NES) beregnes som følger:

Til slutt, fordi vi ble testing av flere hypoteser på en gang, vurderte vi forventet falsk positiv ratio ved å beregne den falske funn rate (FDR).

for vår GSEA, 1000 fenotype permutasjoner ble brukt for å estimere hvert gen er statistisk signifikans.

Adaptive Rank avkortet Produkt (ARTP).

for all L genene i en reaksjonsvei, er det beste SNP P-verdi til hvert gen, sortert fra laveste til høyeste (P

1, P

2, …, P

L), og produktet av K minste P- verdier i en sti ble beregnet som følger:

normalt avkutting punkt K må bestemmes før du bruker RTP statistikken. Imidlertid ARTP metoden foreslått av Yu et al. [31], som kombinerer statistikk avledet fra det observerte datasettet, som gjør det mulig å anslå den justerte P-verdi uavhengig av størrelsen på veien. For vår ARTP analyse, ble de samme 1000 permutasjoner brukes til å vurdere betydningen av hver kandidat vei.

Pathway Overlapping Analyse

Å sammenligne likheter mellom banene, de fraksjoner av overlapping mellom banene ble beregnet, ved hjelp av følgende ligning:

Anta at A og B er trasé, vil:

Vi brukte denne ligning for å håndtere en situasjon hvor en bane er en undergruppe av den annen. Dermed indikerer 100% likhet som en sti er en undergruppe av den andre, med mindre de to banene er de samme.

Resultater

demografiske kjennetegn

De demografiske trekk ved studiepopulasjonen er vist i tabell 1. i univariatanalyser, kjønn og alder viste statistisk signifikans (P 0,05), mens røyking status ikke (p = 0,16). Men alle tre demografiske trekk (kjønn, alder og røykestatus) viste statistisk signifikante sammenhenger (P 0,001) i multivariate analyser. Derfor har vi inkludert alle tre som å justere covariables løpet av logistisk regresjon foreningen analyse. Adenokarsinom var den dominerende histologiske typen, som representerer mer enn 70% av våre NSCLC prøvene, en sammensetning i samsvar med den generelle koreanske NSCLC befolkning profil [4].

Genotyping og kartlegging

Etter bruk av SNP QC kriterier, inkludert MAF og HWE, ble 440,530 genotypet SNPs filtrert ned til 300,410 SNPs. Fra dem, fjernet vi SNPs bosatt i genet ørkener og de resterende 147,970 SNPs ble vellykket kartlagt til vår definisjon av gener (14,089 gener). Fordi vi kartlagt SNP’er som befinner seg innenfor 20 kbp oppstrøms og nedstrøms for en kodende region som et gen, noen SNP’er lokalisert mellom genene ble tellet to ganger.

Positiv kontroll-tester

Som vist i tabell 2, vår positive kontrolltestresultater viser en rekke nominelle P-verdier, 0,014 til 0,42, og en rekke FDRs, 0,055 til 0,408, for additivet og dominerende modeller i GSEA metoden. For ARTP metode, P-verdier var sterkere og varierte 0,001 til 0,035 for additivet og dominerende modeller. Derfor, fra de positive kontrollprøver, brukte vi følgende filtrering kriterier for den første veien oppdagelsen steg med GSEA metode: P-values≤0.025 og FDRs≤25% i additiv eller dominant genetisk modell ble valgt for nærmere analyse. For ARTP metoden, ble P-values≤0.01 anses bemerkelsesverdig.

Pathway Analysis

Blant 880 veier som vi undersøkt ved hjelp av GSEA metode, 11 passerte de positive kontroll filtrering kriterier (tabell 3) . De 11 kandidat trasé ble undersøkt videre ved hjelp av ARTP metode og deres P-verdier were≤0.01 i additiv eller dominerende modellen, igjen bekrefter at disse banene hadde statistisk signifikant sammenheng med NSCLC, mot våre positive kontroller. Men for

Aktivering av Pre-replicative Complex

, fant vi at svært signifikant P-verdi på additiv modell i GSEA metode skilte seg fra en ubetydelig P-verdi i den additive modellen i ARTP metode , så vi utelatt fra den etterfølgende analyse. Undersøkelse av kandidat baner i dybde etter resultatene av likhetstester, slik som vist i fig S1, fant vi flere veier som lignet hverandre. For eksempel

G1 /S Transition

veien var en undergruppe av

Cell Cycle

vei, og når en inkluderende forhold ble funnet, vi eliminert supersett, som i dette tilfellet var

Cell Cycle

veien. Tilsvarende

NRAGE Signaler Død gjennom JNK

veien var en undergruppe av

Cell Død Signa via NRAGE, NRIF, og NFF

sti, som var undergrupper av den

P75 NTR reseptormediert signale

veien. Derfor fjernet vi to supersett av

NRAGE Signaler Død gjennom JNK

veien. De resterende sju kandidat trasé ble kategorisert i fire typer cellulære prosesser: membrantransport (

ABC Vogner

), intracellulær signalering (

VEGF signalveien

,

Inositol fosfat Metabolism

,

phosphatidylinositol signalanlegget

), cellesyklus (

G1 /S Check Point

,

G1 /S Transition

), og programmert celledød (

NRAGE Signaler død gjennom JNK

). Spesielt,

G1 /S Check Point

veien hadde den minste antall gener (25 gener), og samtidig opprettholde statistisk signifikans i både GSEA og ARTP metoder (dominerende modell). Bruke GSEA statistikk som primære og ARTP statistikk som sekundære målinger,

ABC Vogner

genet sett viste best NSCLC risiko foreningen blant de sju finalekandidater med GSEA nominell P-verdi 0,001, FDR = 0,122, og ARTP P-verdi = 0,001 (begge dominerende modellen). Den nest beste var den

VEGF signalveien

med en GSEA nominell P-verdi. 0,001, FDR = 0,107, og ARTP P-verdi = 0,008 (begge dominerende modellen)

for kjente baner i hver cellulære prosessen kategori, ble SNP foreninger innenfor gensettene videre undersøkt (tabell 4, S1, S2 og S3). Bortsett fra

ABC transportører

, som var bare en samling av trans protein pumper, nettverksdiagrammer av bemerkelsesverdige trasé ble trukket som vist i figur S2, S3 og S4. De ekstra resultater for veien analyse i hver undergruppe i henhold til de histologiske typer lungekreft er beskrevet i vedlegg S2.

Sammenligning med andre Lung Cancer Study

I en forskjellig uttrykt gen studere med normal lungevevet, utført av Falvella et al. [46], ble et gen-uttrykk signatur bestående av 85 gener foreslått å skille lunge adenokarsinom pasienter fra andre kreftpasienter. Vi vedtatt 67 gener som var tilgjengelige i NCBI menneskelige genom build 36 og anvendt samme sti analyse prosedyre. Ved hjelp av våre genotyping data, ble SNP foreninger vellykket kartlagt til 54 gener. Med genet som sett som omfatter disse 54 gener viste GSEA metode nominelle P-verdier av 0,001 for både additive og dominerende modeller og FDR verdier på 2,6% og 11,7% for tilsetningsstoff og dominerende modeller, respektivt. Tilsvarende ARTP metode ga p-verdier på 9,99 x 10

-4 og 3,00 x 10

-3 for additivet og dominerende modeller for dette genet settet, respektivt. Dette resultatet igjen bekreftet at vår vei basert analyse var lovlig og i samsvar med annet lungekreft studie med mRNA-baserte gen-uttrykk analyse. Resultatene fra foreningen analyse av SNPs i 54 gener ble vist i tabell S4.

Diskusjoner

Nylige fremskritt innen high-throughput SNP genotyping teknologi har generert enorme mengder genotyping data og har ført til verdifull resultater om vanlige genetiske varianter assosiert med ulike sykdommer gjennom GWASs. Imidlertid har rapporter fokusert hovedsakelig på en liten del av foreninger som kvalifiserer for genome-wide signifikansnivå og de fleste foreninger, med moderate statistiske krefter, er vanskelig å tolke. Ved hjelp før biologisk kunnskap, har sti-baserte foreningen tilnærminger nylig åpnet en ny måte å undersøke assosiasjoner mellom GWAS resultater og komplekse molekylære nettverk. Pathway basert analyse inkorporerer foreningen data for funksjonelt relaterte gener og oversetter dem til sykdom mottakelighet informasjon.

I denne studien brukte vi en blanding av kontrast pathway analyser med koreanske lungekreft GWAS data, bestående av 869 NSCLC tilfeller og 1,533 kontroller. Vi har tidligere rapportert signifikante assosiasjoner mellom polymorfismer på kromosomer 3q28, 3q29, og 5p15 og koreansk lungekreft mottakelighet [11], [44]. Vi først brukt en GSEA basert metode med genom-wide SNP array-data til foreløpig skjermen for kandidat pathways assosiert med lungekreft mottakelighet. Blant 11 kandidater veier, valgte vi 7 som også ble bekreftet av ARTP metoden. Fire cellulære signalveier,

VEGF signalveien

,

G1 /S Check Point

,

NRAGE Signaler Død gjennom JNK

, og

ABC transportører, etter var høyanriket med signaler forbundet med risikoen for lungekreft. I motsetning GWASs, P-verdier for SNPs assosiert med gener var generelt moderat betydelig og bare et fåtall av dem ville kvalifisere på den såkalte genom-wide signifikansnivå. Dette indikerte at pathway statistikk streket effekten av subtile, men systematiske, mønstre innenfor et gen satt i stedet for noen få topp foreninger innen et gen sett.

Gene medlemmer av ATP-bindende kassett (ABC) transporter familie har viktige funksjoner i transport av forskjellige substrater, slik som ioner, sukker, lipider og proteiner, under fysiologiske betingelser. I mange år har forskere oppdaget at

ABC Vogner

spille viktige roller i kreft kjemoterapi og er ansvarlig for multiresistens (MDR), i form av en ATP-drevet narkotika pumpe [47]. Det antas at overekspresjon av

ABC Vogner

reduserer intracellulære legemiddelnivå via økt utstrømming av kjemoterapeutika, noe som resulterer i narkotika ufølsomhet, noe som kan føre til kreft kjemoterapi svikt [48]. På den annen side,

ABC Vogner

kan også fungere som effektive kreftfremkallende eksportører, holde cellene fri for skadelige kjemikalier og kreftfremkallende. Forlengede svekkelser eller endringer i genuttrykk av disse transprotein pumpene kan øke potensiell kreftrisiko. Tobakk-spesifikke nitrosamin 4- (methylnitrosamino) -1- (3-pyridyl) -1-butanon (NNK) er en av de mest potente kreftfremkallende av sigarettrøyk som har blitt vist å forårsake lungekreft hos gnagere [49], [50 ]. Når disse giftstoffene er inhalert,

ABC tilhengere

kodet av ABCB1 og ABCC1 effektivt eliminere disse kreftfremkallende fra lungene. Forskere har oppdaget at vanlige polymorfismer av ABCB1 og ABCC1 kan påvirke stoffskiftet og disponering av veletablerte kreftfremkallende, NNK, og potensielt øke risikoen for lungekreft [51] den. Som vist i tabell 4, viste ABCA4, ABCC1, og ABCC signifikant sammenheng med lungekreft følsomhet (P-verdier 0,0005). I vår påfølgende subgruppeanalyse, noensinne-røykere viste en mer signifikant sammenheng enn aldri-røykere, som vist i tabell S5. Dermed er det mulig å modulere lungekreft individ i henhold til genetisk polymorfisme i disse genene gjennom ulike cellulære funksjoner.

VEGF signalveien

også rangert høyt i vår vei analyse. Medlemmer av denne reaksjonsveien kan påvirke en angiogenese-avhengige biologiske reaksjonsvei, som er en kritisk komponent i onkogenesen. Sammenhenger mellom genetisk polymorfisme i VEGF /VEGFR og risikoen for å utvikle kreft har blitt omtalt i de ulike krefttyper, inkludert lungekreft [52]. Blant 63 genet medlemmer, phosphatidylinositol 3-kinase (PIK3R5), fosfolipase C (PLCG2), og SHC adapter protein viste sterke assosiasjoner med lungekreft følsomhet i vår GWAS (tabell S1, Figur S2).

Selv om en gangsti basert tilnærming er en attraktiv rettssak i en post-GWAS era, ser vi noen begrensninger i vårt design. I vår studie, som følge av SNP QC, sammenslutninger av mer enn 300.000 SNPs forble og ble analysert, men bare om lag halvparten av dem ble kartlagt med hell, til 14,089 gener. Mange SNPs innenfor ikke-kodende regioner ble rett og slett neglisjert. Dessverre, med dagens GWAS genotyping plattform, er antallet markører som dekker gener begrenset. Dessuten, selv de 880 trasé vi analysert var helt klart en ufullstendig sett med veier, fordi mange menneskelige gener ikke har blitt tildelt trasé fordi deres funksjon (e) er ukjent. Endelig vår GWAS satt inneholder genom-wide SNP data fra mer enn 2400 koreanere stammer fra en enkelt populasjon. Målet med studien var å finne stier assosiert med lungekreft mottakelighet innen koreansk befolkning, og vi kunne ikke finne en sammenlignbar koreansk lungekreft GWAS datasett for å validere våre funn. Etter hvert som flere data blir tilgjengelige, bør våre resultater sammenlignes med andre østasiatiske befolkninger vurderer etniske forskjeller.

I konklusjonen, viste vi at lungekreft følsomhet kan knyttes til biologiske mekanismer ved hjelp GWAS data, og flere subtile foreningen signaler kan tolkes på en systematisk måte. Våre resultater tyder på at genetisk variasjon i gener som er involvert i fire signalveier kan bidra til enkelte lungekreft følsomhet. Videre våre funn tyder på at pathway baserte tilnærminger er viktige analytiske metoder i en post-GWAS æra som kunne brukes til å løse funksjonelle relevansen av genetisk disposisjon.

Hjelpemiddel Informasjon

Figur S1.

Likheter mellom kandidat veier. (Enhet:%).

Doi: 10,1371 /journal.pone.0065396.s001 plakater (TIF)

Figur S2.

Pathway Diagram av «VEGF Signa»

doi:. 10,1371 /journal.pone.0065396.s002 plakater (TIF)

Figur S3.

Pathway Diagram av «G1 /S Check Point»

doi:. 10,1371 /journal.pone.0065396.s003 plakater (TIF)

Figur S4.

Pathway Diagram av «NRAGE Signaler Død gjennom JNK»

doi:. 10,1371 /journal.pone.0065396.s004 plakater (TIF)

Tabell S1.

SNP foreninger av gener i «VEGF signalveien»

doi:. 10,1371 /journal.pone.0065396.s005 plakater (DOC)

Tabell S2.

SNP foreninger av gener i «G1 /S Check Point»

doi:. 10,1371 /journal.pone.0065396.s006 plakater (DOC)

tabell S3.

SNP foreninger av gener i «NRAGE Signaler døden ved JNK»

doi:. 10,1371 /journal.pone.0065396.s007 plakater (DOC)

Tabell S4.

SNP foreninger av 54 gener i «Røykere med Lung Cancer» Gene Expression studie av Falvella et al

doi:. 10,1371 /journal.pone.0065396.s008 plakater (DOC)

Tabell S5. Host Sammenligning av «ABC transportører» Pathway gener mellom Never-røyker og Ever-røyker

doi:. 10,1371 /journal.pone.0065396.s009 plakater (DOC)

Vedlegg S1.

Liste over 880 Pathways

doi:. 10,1371 /journal.pone.0065396.s010 plakater (XLSX)

Vedlegg S2.

Pathway Analyse av 2156 Adenocarcinoma Kun Group og 1806 plateepitelkreft Bare Gruppe

doi:. 10,1371 /journal.pone.0065396.s011 plakater (XLSX)

Takk

Vi ønsker å takke Center for Disease Control i National Institute of Health Korea, som ber gitt de genom SNP data for kontroller. Vi vil også gjerne takke Dongwan Hong og Seungyoon Nam ved National Cancer Center for nyttige diskusjoner og kritikk.

Legg att eit svar