Abstract
Vi testet for kimcellelinje variantene viser assosiasjon til tykktarmskreft metastase ved hjelp av et genom-wide forening studie som sammenlignet Ashkenazi jødiske personer med stadium IV metastatisk tykktarm kreft kontra de med stadium I eller II ikke-metastatisk tykktarm kreft. I en to-trinns studiedesign, viste vi signifikant sammenheng for å utvikle metastatisk sykdom for rs60745952, at i askenasiske oppdagelse og validerings kohortene, henholdsvis, viste en odds ratio (OR) = 2,3 (P = 2.73E-06) og OR = 1,89 (P = 8.05E-04) (over validering terskelen til 0,0044). Signifikant assosiasjon til metastatisk tykktarmskreft ble ytterligere bekreftet av en meta-analyse av rs60745952 i disse datasettene pluss en ekstra Ashkenazi validering kohort (OR = 1,92; 95% KI: 1,28 til 2,87), og ved en permutasjon test som viste en betydelig lengre haplotype rundt rs60745952 i stadium IV prøvene. rs60745952, som ligger i en intergeniske region på kromosom 4q31.1, og ikke tidligere assosiert med kreft, er dermed en germline genetisk markør for mottakelighet for å utvikle tykktarmskreft metastaser blant askenasiske jøder
Citation. Markowitz SD, Nock NL, Schmit SL, Stadler ZK, Joseph V, Zhang L, et al. (2016) En kimcellelinje Variant på kromosom 4q31.1 Associates med mottakelighet for å utvikle tykktarmskreft metastasering. PLoS ONE 11 (1): e0146435. doi: 10,1371 /journal.pone.0146435
Redaktør: Ajay Goel, Baylor University Medical Center, UNITED STATES
mottatt: 04.02.2015; Godkjent: 03.04.2015; Publisert: 11 januar 2016
Copyright: © 2016 Markowitz et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet:. All relevant data er tilgjengelige fra NCBI (sjonsnummer: PRJNA306392).
Finansiering: Dette arbeidet ble støttet av National Institutes of Health gir R01 CA144040 (SDM), P50 CA150964 (SDM), P30 CA043703, U19 CA148107 (SBG ), P30 CA014089 (SBG), K07 CA129162 (NLN), T32 ES013678 (SLS), R01 CA160356 (PS og SDM), og R01CA136726 (LL); og, av Leonard og Joan Horvitz Foundation (SDM), Richard Horvitz og Erica Hartman-Horvitz Foundation (SDM), Anton B. Burg Foundation på USC Norris, Sharon Levine Corzine forskningsfond og, Robert og Kate Niehaus Clinical genetikk Initiative på MSKCC. Dette arbeidet ble støttet delvis av National Cancer Institute, National Institutes of Health i henhold til RFA # CA-09-002. Innholdet i dette manuskriptet ikke nødvendigvis gjenspeiler synspunktene eller retningslinjer fra National Cancer Institute eller noen av de samarbeidende sentre i corect konsortiet, heller ikke omtale av handelsnavn, kommersielle produkter, eller organisasjoner innebærer godkjennelse av den amerikanske regjeringen eller corect konsortium
konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP er den tredje vanligste kreftformen og den nest største årsaken til kreft døden i USA, med 136,830 nye tilfeller diagnostisert og 50,310 dødsfall årlig [1]. På verdensbasis er tykktarmskreft den tredje vanligste diagnosen kreft hos menn, og andre kvinner, med 746,000 saker og 614,000 tilfeller, henholdsvis [2].
I nesten alle tilfeller, tykktarmskreft død er forårsaket av utviklingen av kreftmetastaser til fjerne organer, for det meste som vanligvis lever [3]. I tidligere studier har vi vist at alle de somatiske mutasjoner stede i tykktarm kreft levermetastaser var allerede til stede i de matchet forutgående tykktarm kreft primære svulster, det vil si nye genmutasjoner er ikke nødvendig å sette i gang tykktarmskreft metastaser [4].
i denne studien undersøkte vi en alternativ genetisk modell for utvikling av tykktarmskreft metastaser, en som tester om genetiske variasjoner i menneske kimlinje kan gi en individuell mottakelighet for metastatisk spredning av kreft i tykktarmen. For å teste denne modellen, foretok vi en Genome Wide Association Study (GWAS) vedrørende evaluering av germline enkeltnukleotidpolymorfi (SNPs) i askenasiske jødisk avstamning pasienter med Stage IV metastatisk tykktarmskreft sammenlignet med de med stadium I eller stadium II tykktarm kreft som gjorde ikke metastaserer. Vi valgte den jødiske befolkningen Ashkenazi for denne studien fordi grunnleggeren alleler, som er svært påvises ved GWAS, er allerede godt precedented for flere andre sykdommer i denne populasjonen [5,6]. Ved hjelp av data fra våre funn kohort, har vi utviklet en foreløpig maktanalyse som gjorde oss i stand til å forhånds angi et begrenset antall SNPs som eksamen i en valideringskullet skulle sørge for replikering med rimelig strøm på 5% signifikansnivå. Den øverste SNPs identifisert i oppdagelsen datasettet ble deretter undersøkt i en annen populasjon av pasienter med kolorektal kreft av Ashkenazi jødisk herkomst (validering datasett # 1). Basert på resultatene av oppdagelse og validerings datasett, ble toppen SNP av interesse vurderes nærmere i en tredje tykktarmskreft pasientpopulasjon av Ashkenazi jødisk herkomst (validering datasett # 2), og en kombinert analyse (meta-analyse) i denne top SNP ble gjennomført ved hjelp av resultatene fra de tre askenasiske jøder datasett. Som et ytterligere ekstra test, ble lengden av haplotype rundt denne SNP funnet å være betydelig lengre mellom metastatisk sammenlignet med de ikke-metastatiske coloncancere.
Resultatene
Detaljerte beskrivelser av oppdagelsen og validerings kohorter er gitt i metodene nedenfor. I gjennomsnitt hadde pasientene i oppdagelsen studiepopulasjonen var 71 år gammel, som var lik gjennomsnittsalder på 72 og 65 i validerings datasett # 1 og # 2, henholdsvis (Tabell 1). Oppdagelsen befolkningen består 52% menn og 48% kvinner og kjønnsfordeling i valideringsdatasettene var like. Fordelinger av stadium IV og stadium I og II tilfeller var også lik på tvers av de tre datasett (tabell 1).
Som vist i tabell 2 og figur 1, observerte den mest signifikant sammenheng når man sammenligner stadium IV å iscenesette i /II tykktarmskreftpasienter i oppdagelsen GWAS var for rs2024846 på kromosom 6 (OR = 2,62; 95% KI: 1,76 til 3,92; p = 1.2×10
-6). Den nest mest signifikant sammenheng observert var med to SNP’er (rs72737810, rs60745952) på kromosom 4q31.1 (OR = 2,83; 95% CI: 1,81 til 4,44; p = 2.73×10
-6), som er atskilt av og 5kb er i sterk koblingsulikevekt (se figur 2). Disse to SNPs ligger i en intergeniske region fjernt fra nærmeste genet,
NR3C2
ved 380kb (fig 2). Selv om statistisk signifikans for foreningen for disse topp SNPs ikke overstiger standard genom-wide betydning nivåer, en visuell undersøkelse av QQ plot av de observerte p-verdier versus forventet fordeling tyder på at de beste SNPs var verdt å vurdere videre (S1-fil) , motivere oss til å fortsette med en replikering studie designet for å undersøke topp 20 SNPs (tabell 2) som ble forhåndsvalgt av makt for replikering som beskrevet i metodene nedenfor.
den vertikale aksen angir (-log
10 transformert) observert P-verdi og den horisontale akse angir den kromosomale posisjon for hver SNP. Arrow betegner posisjonen rs60745952 og rs72737810, som ikke er individuelt merkbar ved denne skalaen av presentasjonen.
Den horisontale aksen viser SNPs langs kromosom regionen og venstre vertikale aksen viser (-log
10 transformert) observerte P-verdi. SNPs nær den viktigste SNP (rs60745952) er fargekodet for å skildre deres LD med denne SNP (avledet som parvise R2 verdier fra HapMap CEU data). rs60745952, som er vist i purpur sirkel, er i sterk LD med rs72737820, som er illustrert ved den rød sirkel. Estimerte rekombinasjon priser fra HapMap er plottet på høyre vertikale aksen i cyan å gjenspeile det lokale LD struktur.
Tabell 2 viser resultatene observert i valideringsdatasettet # 1 for de 20 SNPs forhåndsvalgte for testing for tilknytning til stadium IV versus fase i eller II tykktarmskreft. Replication ble observert for de to SNPs på kromosom 4q31.1, rs72737810 og rs60745952. I valideringsdatasettet # 1, disse to SNPs viste assosiasjon med utvikling av metastatisk sykdom ved p = 9.12×10
-4 (OR = 1,89; 95% KI: 1,27 til 2,82) og p = 8.05×10
-4 (OR = 1,89; 95% CI: 1,27 til 2,80), henholdsvis (tabell 2). Styrken i foreningen for disse to korrelerte SNPs både skredet P 0,0044, som var vår pre-spesifiserte betydning terskel for replikering (som beskrevet i metoder). Gitt den sterke LD mellom disse SNPs, vi vilkårlig valgt rs60745952 å vurdere i den andre valideringsdatasettet. I mindre, mindre sterkt drevet valideringssettet # 2, sammenhengen mellom rs60745952 og utvikling av metastatisk sykdom var ikke statistisk signifikant, men effekten anslaget var i den samme retning med en økt risiko for den underordnede allel (OR = 1,31; 95% CI. 0,81 til 2,12) (figur 3, Panel A)
som oppdagelsen datasett og begge validerings datasett alle viste en økt risiko for metastatisk sykdom i tykktarmen eller tykktarmen og endetarmskreft pasienter som bærer mindre allel av rs60745952, ble utført en meta-analyse for å få det beste estimatet av den samlede effekten størrelse. Som vist i figur 3 (panel B), oppsummeringen virkning anslaget for den kombinerte analysen (meta-analyse) under en fast effekter modell var statistisk signifikant (OR = 1,93; 95% CI: 1,50 til 2,49; p = 5,20 x 10
-7). Siden vi har observert noen tegn til heterogenitet i testen av homogenitet (Q-statistikken = 5,01, df = 2, p = 0,08, fig 3, panel A), også evaluert vi den tilfeldige effekter modellen og funnet at Sammendrag effektestimatene var lik (OR = 1,92; 95% KI: 1,28, 2,87; p = 0,001); men som forventet, konfidensintervallet var strammere for den faste effekter modell.
Vi videre begrunnet at hvis sammenslutning av rs6074592 til risiko for å utvikle metastatisk sykdom ble drevet av koblingsulikevekt med en grunnlegger metastase mottakelighet allelet, og hvis dette grunnleggeren allelet hadde oppstått mer nylig enn Ashkenazi befolkningen som helhet, ville dette allelet være segregerende på en haplotype blokk med økt størrelse stede i metastase versus ikke-metastase forbundet genom. For å teste for denne muligheten, undersøkte vi LD strukturen i regionen nær rs60745952 SNP hos personer med stadium IV versus stadium I eller II tykktarm kreft. Fig 4 viser plott av D «mellom rs60745952 (blå linje) og alle andre SNPs i regionen. Den clustering av SNPs med D «= 1 til rs60745952 definerer en haplotype som er helt klart lengre i personer med stadium IV sammenlignet med stadium I /II tykktarm kreft i både funnet og validering # 1 datasett (røde sirkler i figur 4 viser SNPs felles for både funn og validering # 1 datasett). Mer spesifikt, observerte vi at antall SNP med D «= 1 i trinn IV (58, permutasjon varians = 11,71), var betydelig større enn det som ble observert i fase I /II (41, permutasjon avvik = 7,60) i oppdagelsen datasettet ( p = 2,73 × 10-5) (tabell 3; S4 File). Resultater i valideringen # 1 datasett var lik, bare litt mindre signifikant (p = 5,00 × 10-5).
vertikal akse er LD som D «for rs60745952 SNP (blå linje) og andre SNPs opp og nedstrøms for denne plasseringen tilgjengelig på genotyping arrays. Røde prikker indikerer SNPs som stod på de genotyping arrays i både Discovery datasett og validering Dataset # 1.
I tillegg har vi undersøkt mulighetene sammenhengen mellom rs6074592 og Stage IV versus Stage I /II tykktarmskreft i en kaukasiske befolkningen av tykktarmskreftpasienter fra Kentucky og fant at foreningen var ikke statistisk signifikant (OR = 0,89; 95% KI: 0,55 til 1,46; p = 0,65), noe som antyder sammenhengen mellom rs6074592 og metastatisk tykktarmskreft er spesifikk for pasienter med Ashkenazi jødisk herkomst.
Diskusjoner
Så vidt vi vet, er dette den første studien som rapporterer genetiske sammenslutninger av menneskelig germline varianter med risiko for å utvikle tykktarmskreft metastaser, spesielt i denne studien observerer at blant askenasiske jøder personer med tykktarmskreft, ble transporten av den mindreårige allel for rs60745952 signifikant assosiert med utvikling stadium IV sykdom, med fjerne organmetastaser, versus lokalisert stadium i eller II sykdom, med en OR på nesten 2. mindre allel for rs60745952 gjennomføres med 31% av den generelle Ashkenazi befolkningen, og med opp til ca 50% av askenasiske personer med stadium IV tykktarmskreft, og dermed er en stor bidragsyter til utvikling av tykktarmskreft metastaser i denne populasjonen. Sannsynligheten for at det er i denne populasjonen grunnlegger metastase mottakelighet variant i sterk koblingsulikevekt (LD) med rs60745952 er uavhengig slås ved å observere at i askenasiske personer med stadium IV tykktarmskreft, ligger rs60745952 i en LD blokk som er betydelig lengre enn det som er observert hos individer med ikke-metastaserende trinn i eller II sykdom. Vi mener videre at foreningen av rs60745952 med metastatisk sykdom er sannsynlig spesifikk for den jødiske befolkningen Ashkenazi, som denne foreningen ikke ble observert når evaluert i den generelle hvite befolkningen av tykktarmskreftpasienter fra Kentucky. I lys av den svært forskjellige evolusjonære historien til den jødiske befolkningen Ashkenazi, forskjellene observert er ikke overraskende.
Tidligere studier fra vår gruppe [4] viste at alle de somatiske mutasjoner påvises i tykktarm kreft metastaser var allerede til stede i sine forutgående primærtykktarmskreftsvulster. Dermed tykktarmskreft metastaser ikke krever kjøp av nye «metastaser driver» mutasjoner. I denne studien presenterer vi bevis for at en genetisk element av metastase progresjon kan være kodet i vertsgenomet. Mens spekulative, mulige verts kodet faktorer som er relevante for metastatisk prosessen vil inneholde elementer av immun overvåking, elementer av vaskulær permeabilitet og /eller angiogenese, og tenkes elementer innen signalkaskader som kan avgjøre cellulære responser til aktiverte onkogener eller inaktivering av tumorsuppressorgener. I likhet med funnene i mange GWAS studier, ligger rs60745952 i en intergeniske region, og vi har ikke direkte bevis for funksjonelle forskjeller i forbindelse med transport av denne SNP. Fremtidige undersøkelser av dette spørsmålet må bli utført i biologiske prøver hentet spesielt fra Ashkenazi befolkningen.
Funnene som presenteres her, ville trolig ikke ha kommet frem i lyset med unntak av vår ansette en makt guidet design for replikering som mulig oss å bevare tilstrekkelig kraft til å demonstrere betydningen av foreningen selv i en beskjeden størrelse replikering kohort. Denne tilnærmingen vil trolig være av verdi for andre forskere som forsøker å genetisk berike for en forening signal ved å studere valgt, men mindre bestander, enn de som vanligvis har vært ansatt i GWASs. Testing for forskjeller i LD struktur konsistente med grunnlegger sykdoms varianter kan også være av verdi for GWASs i disse mindre, men svært utvalgte bestander.
Materialer og metoder
deltagerne
oversikt.
Colon kreftpasienter fra fire ulike datasett ble benyttet i denne evalueringen. Alle pasientene ble konstatert etter forskning protokoller godkjent av Institutional Review styrene i tilsvarende institusjoner (Carmel Medical Center (Haifa), University of Southern California, Memorial Sloan-Kettering Cancer Center og universitetssykehusene sak Medical Center), som beskrevet nærmere nedenfor. Alle pasienter forutsatt informert skriftlig samtykke. Alle samtykke prosedyrene ble godkjent av de tilsvarende nevnte Institutional Review Boards.
Discovery datasett.
Deltakere ble trukket fra Molecular Epidemiology av tykktarmskreft studie (MECC), som er en populasjonsbasert case -kontroll studie av hendelsen tykktarm og endetarm kreft tilfeller som har blitt beskrevet tidligere [7]. Kort fortalt pasienter fra det nordlige Israel har blitt rekruttert inn i MECC siden 1998. Som en del av MECC studien ble grunnleggende demografiske og kliniske opplysninger samt blodprøver innhentet. Saker som er valgt for genotyping hadde histologisk bekreftet, mikro stabil tykktarmskreft. Nærmere bestemt studiepopulasjonen benyttes i oppdagelsen datasettet for denne evaluering besto av 89 personer med stadium IV tykktarmskreft med fjerne organmetastaser, alt som involverer leveren, og 234 personer med stadium I eller stadium II coloncancere som ble organ trange og uten metastatisk spredt. Disse personene ble ytterligere bekreftet da gjenværende metastase-free under klinisk oppfølging av minst 3 års varighet. Kontroller i MECC oppdagelsen datasett studiepopulasjonen bestod av personer uten tidligere historie med tykktarms eller endetarmskreft og ble individuelt tilpasset tilfeller basert på alder, kjønn og primær klinikk nettstedet. 139 kontroller ble genotypet og anvendt for å kvantifisere mindre allel frekvensen for de beste SNP’er. Alle pasientene hadde selvrapportert Ashkenazi jødisk herkomst.
Validering Dataset # 1.
Den første valideringsdatasettet ble avledet fra en annen uavhengig utvalg av MECC deltagerne som ble valgt med mindre restriktive kriterier enn på den oppdagelse datasett. Spesielt validering datasett # 1 består ytterligere personer med enten kolon eller endetarmskreft, stadium I og II tilfeller for hvem postoperativ oppfølging ikke var tilgjengelig, og personer med kreft hadde ikke blitt testet for mikro ustabilitet. I tillegg har denne prøven inkluderte personer med selvrapportert sefardiske samt Ashkenazi jødisk herkomst. Validerings datasett i denne evalueringen inngår 89 stadium IV tykktarmskrefttilfeller og 373 stadium I og stadium II kolorektal krefttilfeller. Kontroller i valideringsdatasettet # 1 studiepopulasjonen bestod av flere pasienter uten tidligere historie med tykktarms eller endetarmskreft og ble individuelt tilpasset tilfeller basert på alder, kjønn, jødisk etnisitet og primær klinikk nettstedet.
Validering Datasett # 2.
Pasienter i andre valideringsdatasettet ble behandlet ved Memorial Sloan-Kettering Cancer Center (MSKCC) og hadde histologisk bekreftet kolorektal kreft. Pasientene ble konstatert under to MSKCC kliniske protokoller mellom 2000 og 2010. Dette studiepopulasjonen var også mindre restriktiv enn oppdagelsen datasett i at valideringsdatasettet # 2 inkluderte personer med enten kolon eller endetarmskreft og personer med kreft hadde ikke blitt testet for mikro ustabilitet. Dette validering datasettet besto av 86 personer med stadium IV tykktarmskreft med fjernorganmetastaser, alt som involverer leveren, og 256 personer med stadium I eller stadium II tykktarm eller endetarm kreft som var organ begrenset og uten metastatisk spredning. Personer med disse tidlige stadium kreften ble ytterligere bekreftet da gjenværende metastase gratis under klinisk oppfølging av minst 3 års varighet. Alle pasientene hadde selvrapportert Ashkenazi jødisk herkomst.
Kentucky kaukasisk datasett.
Detaljene i Kentucky studiepopulasjonen har blitt beskrevet andre steder [8]. Kort fortalt datasettet som brukes i denne evalueringen besto av 77 pasienter med Stage IV tykktarmskreft og 398 pasienter med stadium I /II tykktarmskreft. Alle pasientene i dette utvalget var kaukasisk.
DNA, genotyping og kvalitetskontroll
Discovery datasett.
DNA fra fullblods lymfocytter ble ekstrahert ved hjelp av QIAamp DNA Blood Mini Kit (Qiagen, Hilden, Tyskland) og ble lagret ved -20 ° C inntil bruk for genotyping. Alle DNA-prøver gikk hele genomet forsterkning bruker Illustra Genomiphi V2 DNA Amplification Kit (GE Healthcare, Waukesha, Wisconsin, katalog nr 25660032). Prøvene ble lagret ved -20 ° C.
Prøvene ble genotypet på Illumina Omni 2,5-8 plattform. Data ble renset ved hjelp av kvalitetskontroll prosedyrer anbefalt av dukke Genomics Working Group [9]. QC prosedyrer inkluderer evaluering av prøven og markør takst, kjønns uoverensstemmelser (plink [10]; «-Sjekk-sex»), duplikater, Hardy-Weinberg likevekt, prøve slektskap (plink [10]; «-genome»), og befolkning lagdeling. Totalt 1,491,783 SNPs ble inkludert i analysen etter eksklusive SNPs som hadde mindre allelfrekvensene 0,01, manglende data i mer enn 2% av prøvene, eller Illumina GenTrain scorer mindre enn 0,6. I alt fem trinns IV pasienter, og 7 trinn I og II pasienter, ble fjernet fra analysene for å ha ringeprisene mindre enn 98%, for ikke kjønns sjekk eller for å være en utilsiktet duplikat (se S1 File for ytterligere detaljer). For å kontrollere for befolkningen lagdeling, ble de to første hovedkomponenter (PC) avledet fra flerdimensjonale dekomponering analyse ved hjelp av «cmdscale» funksjon i R.
Validering Dataset # 1.
tykktarmstrans ( corect) Studier gjennomført genotyping for validering datasett # 1. Genotyping ble utført ved hjelp av en spesial Affymetrix genom-wide plattform (Axiom® corect sett) med ca 1,3 millioner SNPs og indels; men ble bare data fra SNPs identifisert som Top SNPs i oppdagelsen datasett hentet av corect for denne analysen (se Statistiske analyser). Data ble renset ved hjelp av kvalitetskontroll prosedyrer lignende til oppdagelsen datasettet (se S2 fil for detaljer) [9].
Validering Dataset # 2.
DNA ble isolert fra enten fullblods lymfocytter eller fra formalinfiksert parafin innebygd (FFPE) normal colonic vev ved hjelp av Qiagen QIAamp DNA-ekstraksjon kit eller QIAamp DNA Blood Mini Kit (Qiagen, Hilden, Tyskland) og ble lagret ved -20 ° C til bruk for genotyping. Alle DNA-prøvene gjennomgikk helt genom-amplifikasjon ved bruk av Repli-g-DNA Amplification Kit (Qiagen, CA). For en undergruppe av prøvene, både FFPE og blod avledet DNA var tilgjengelig, og ble brukt til å teste samstemmighet av genotyper for kvalitetssikring. Genotyping for rs60745952 ble utført ved hjelp Sequenom iPLEX analyser og analysert ved hjelp av MassARRAY [11]. Genotypene ble kalt hjelp Typer 4.0.2 programvare.
Kentucky kaukasisk datasett.
DNA ble isolert fra alle fag og ABI TaqMan kjemi ble ansatt for å genotype rs60745952. Dette krevde tilpasset design av prober og primere av ABI. PCR [40 Cycles] ble utført på en ABI GeneAmp PCR System 9700 Dual Leder Instrument og endepunkt leser ble utført ved hjelp av ABI 7900 Sequence Detection System.
Statistiske analyser
Logistisk regresjon ble utført for å vurdere potensialet sammenheng mellom hver SNP og stadium IV versus etapper i og II tykktarm kreft under en log-additiv genetisk modell. Selv om de første analysene brukes plink [10], den endelige analysen for rs60745952 i de tre studie datasett som brukes SAS v9.2 (SAS Institute Inc., Cary, NC) for passende inkludering av kovariater forutsatt bare uavhengighet av individer, ikke alleler [12 ] som implementert i plink [10]. Alle regresjonsanalyser ble korrigert for alder og kjønn og, i tilfelle av oppdagelsen og valideringssettet # 1, som var GWAS, de første 2 hovedkomponenter. Videre i disse to datasettene undersøkt vi om rs60745952 ble gjennomført på en lengre haplotype i stadium IV pasienter enn i stadium I /II pasienter. Etter å identifisere den aktuelle kromosomale region i oppdagelsen datasettet ved hjelp av LD mønsteret generert på Haploview [13] (S3 fil), beregnet vi D «mellom hver SNP i blokken og rs60745952 og telles antall SNP hvor D» = 1. Vi deretter utført permutasjon testing for å teste om antall SNPs med D «= 1 var signifikant større i stadium IV sammenlignet med stadium i /II pasienter (S4 File).
design for Replication Studies
Statistisk modellering antydet at en replikering kohort av tykktarm kreft tilfeller av tilsvarende størrelse til oppdagelsen kohorten vil gi ca 80% strøm for å teste opp til ni av våre mest betydelige kandidat SNPs (øverst SNPs) ved en Bonferroni korrigert signifikansnivå på 0,04 /9 (= 0,0044), pluss ytterligere 8 SNP’er på en Bonferroni korrigert signifikansnivå på 0,01 /8; således den generelle type 1 feilen ble kontrollert til å være 0,05 (En lignende konstruksjon ble benyttet til å teste stadium III versus stadium I /II tykktarmskreftpasienter, men bare sammenligningen med stadium IV pasienter er rapportert her). Strøm for replikasjon ble beregnet for hvert enkelt SNP, basert på 50% og lavere sikkerhetsgrense for den tilsvarende odds-ratio [14] og utbredelsen av SNP (se S5 fil). Tre av de øverste 9 SNP ble ledsaget av en ledsager SNP som viste fullstendig koblingsulikevekt i vår oppdagelse kohort (D «= 1,0), og disse tre ledsager SNP ble tilsatt til vår sett av topp SNP som skal testes for replikasjon, med ingen statistisk justering, for en total av 20 SNP forhånds angitt for analyse i valideringen kohort. Før oppstart av valideringsstudien, ble denne analysen design og identiteten til de 20 forhåndsdefinerte SNPs deponert hos NCI program offiser føre tilsyn med studien til posten dokumentasjon av studiedesign. Andre SNPs som var til stede på valideringsdatasettet # 1 genotyping utvalg ble ikke vurdert i denne studien evalueringen.
Kombinert Data Analysis (Meta-Analysis)
Foreningen resultater for rs60745952 SNP i tre studie datasett med Ashkenazi jødisk herkomst (Discovery datasett, Validering Dataset # 1, Validering Dataset # 2) ble kombinert ved hjelp av en meta-analyse med den inverse utvalgsstørrelsen vektet tilnærming implementert i METAL [15]. Vi evaluerte homogenitet mellom foreningen resultatene ved hjelp av Q-test og beregnet sammendraget effekt anslaget ved hjelp av en tilfeldig effekt-modell [15]. Vi beregnet sammendraget effekt anslaget ved hjelp av både faste og tilfeldige effektmodeller, siden p-verdien for testen av homogenitet var marginalt signifikant (Tabell 3; p 0,10), noe som tyder på noen heterogenitet kan være til stede og avviket mellom studier bør være innlemmet i analysene for å få konfidensintervall.
Hjelpemiddel Informasjon
S1 fil. Genotyping QA /QC Detaljer for Discovery Datasett
doi:. 10,1371 /journal.pone.0146435.s001 product: (PDF)
S2 fil. Genotyping QA /QC Detaljer for validering Datasett # 1
doi:. 10,1371 /journal.pone.0146435.s002 product: (PDF)
S3 fil. LD Tomter
doi:. 10,1371 /journal.pone.0146435.s003 product: (PDF)
S4 fil. LD Evaluering gjennom Permutasjon i Discovery og validering # 1 Datasett
doi:. 10,1371 /journal.pone.0146435.s004 product: (PDF)
S5 fil. Velge SNPs for validering
doi:. 10,1371 /journal.pone.0146435.s005 product: (PDF)
Takk
Innholdet i dette manuskriptet ikke nødvendigvis gjenspeiler synspunktene eller politikken til National Cancer Institute eller noen av de samarbeidende sentre i corect konsortiet, og heller ikke omtale av varenavn, kommersielle produkter, eller organisasjoner innebærer godkjennelse av den amerikanske regjeringen eller corect konsortium.