Abstract
Så langt seks mottakelighet loci for nyrecellekreft (RCC) har blitt oppdaget av genom-wide forening studier (GWAS). For å identifisere ytterligere RCC felles risiko loci, utførte vi en meta-analyse av publiserte GWAS (totalt 2.215 tilfeller og 8,566 kontroller i Vest-europeisk bakgrunn) med imputering bruker 1000 genomer Prosjekt og UK10K Prosjektdata som referansepaneler og fulgt opp mest signifikant sammenheng signaler [22 enkeltnukleotidpolymorfi (SNPs) og 3 indels i åtte genomiske regioner] i 383 saker og 2,189 kontroller fra Kreft Genome Atlas (TCGA). En kombinert analyse identifisert en lovende mottakelighet locus kartlegging for å 1q24.1 preget av de beregnede SNP rs3845536 (
P
kombinert = 2.30×10
-8). Spesielt signal kart å intron 4 av
ALDH9A1
genet (aldehyd dehydrogenase 9 familie, medlem A1). Vi evaluerte ytterligere dette potensialet signal i 2,461 saker og 5,081 kontroller fra International Agency for Research on Cancer (IARC) GWAS av RCC saker og kontroller fra flere europeiske regioner. I motsetning til tidligere funn ingen sammenheng ble vist i IARC serie (
P
= 0,94;
P
kombinert = 2.73×10
-5). Mens variasjon på 1q24.1 representerer en potensiell risiko locus for RCC, er fremtidige replikering analyser er nødvendig for å underbygge vår observasjon
Citation. Henrion MYR, Purdue MP, Scelo G, Broderick P, Frampton M, Ritchie A, et al. (2015) vanlig variant på 1q24.1 (
ALDH9A1
) er en potensiell risikofaktor for nyre kreft. PLoS ONE 10 (3): e0122589. doi: 10,1371 /journal.pone.0122589
Academic Redaktør: Paolo Peterlongo, IFOM, Fondazione Istituto FIRC di Oncologia Molecolare, ITALIA
mottatt: 26 november 2014; Godkjent: 11 februar 2015; Publisert: 31 mars 2015
Dette er en åpen tilgang artikkel, fri for all opphavsrett, og kan bli fritt reproduseres, distribueres, overføres, endres, bygd på, eller brukes av alle for ethvert lovlig formål. Arbeidet er gjort tilgjengelig under Creative Commons CC0 public domain engasjement
Data Tilgjengelighet: Komplett meta-analyse av data (inkludert SNP-IDer, odds ratio og P-verdier for de britiske og NCI studier) er tilgjengelig i Støtte informasjon seksjon for denne artikkelen på PLoS ONE webside (S1 datasett)
Finansiering:. sorce koordineres av Medical Research Council (MRC) Clinical Trials Unit (CTU) ved UCL og finansieres i hovedsak av MRC CTU på UCL og Cancer Research UK med en pedagogisk stipend fra Bayer. Ekstra midler ble gitt av Cancer Research UK (C1298 /A8362 støttes av Bobby Moore Fund). MYRH ble støttet av leukemi lymfom Research. JL er finansiert av RMH /ICR Biomedical Research Centre for Cancer. National Health Service (NHS) midler til Royal Marsden biomedisinsk forskning Senter og Cambridge University Health Partners angivelse. Midler til SØK teamet ble levert av Cancer Research UK (C490 /A10124). NCI nyre GWAS ble finansiert av egenutført Research Program av National Cancer Institute, National Institutes of Health (NIH). De bevilgende myndighet, bortsett fra MRC CTU, hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:. Zhaoming Wang er ansatt Leidos Biomedical Research Inc., en USAs regjering entreprenør. Timothy Eisen er etterforskningsleder for hekserier og har fått forskningsstøtte skjema Bayer, GlaxoSmithKline, Pfizer og Astrazeneca har deltatt og blitt kompensert for rådgivende styrer for GlaxoSmithKline, Aveo og Astellas og er for tiden i permisjon fra University of Cambridge for å jobbe som Chief Lege Scientist i Astrazeneca. Sorce, men koordineres av Medical Research Council (MRC) Clinical Trials Unit (CTU) ved UCL og finansieres i hovedsak av MRC CTU ved UCL og Cancer Research UK, har vært finansiert delvis av en pedagogisk stipend fra en kommersiell kilde, Bayer. Dette endrer ikke forfatternes tilslutning til PLoS ONE politikk på deling av data og materialer.
Innledning
Wide nyre kreft står for rundt 2% av alle malignitet sykdommen påvirker 270.000 personer og forårsaker 116000 kreftrelaterte dødsfall hvert år [1]. Hos voksne 90% av nyrekreft er nyrecellekarsinomer (RCC) [2].
I tillegg til de anerkjente modifiserbare risikofaktorer for RCC-røyking og fedme-relaterte egenskaper, samt den inverse forholdet mellom risiko og alkoholforbruk, er det sterke bevis for en arvelig genetisk predisposisjon [3]. Rare germline mutasjoner i
VHL plakater (von Hippel-Lindau syndrom),
MET plakater (arvelig papillær nyrekreft),
BHD plakater (Birt-Hogg-Dube syndrom) og
FH plakater (arvelig leiomyomatosis og RCC-syndrom) dramatisk øke risikoen for RCC [4], men bidrar lite til den totale to-fold familiær risiko [5]. Bevis for polygenic mottakelighet for RCC har nylig blitt stadfestet av genom-wide assosiasjonsstudier (GWAS) som har identifisert risiko SNPs (enkeltnukleotidpolymorfi) på 2p21, 2q22.3, 8q24.21, 11q13.3, 12p11.33 og 12q24. 31 [2,6-9].
For å identifisere ytterligere RCC risiko SNPs, tilregnet vi over 10 millioner SNPs i to publiserte GWAS datasett ved hjelp av data fra 1000 genomer prosjektet [10] og UK10K prosjekter som referanse ( se Materialer Metoder for detaljer). Dette tillot oss å gjenopprette utypede genotyper, og dermed maksimere mulighetene for å identifisere nye risiko varianter for RCC. Vi gjennomførte et genom-wide meta-analyse av de to beregnede studier
Resultater
For meta-analysen vi har gjort bruk av data fra to tidligere utgitt GWAS av RCC. (I) . UK-GWAS, 1,045 RCC tilfeller genotypet på Illumina Omni Express BeadChips med 2,699 personer fra Wellcome Trust sak Kontroll Consortium 2 (WTCCC2) 1958 fødselskohort og 2501 UK Blood service som hadde blitt genotypet genotypet på Hap1.2M-Duo arrays tjener som kontroller [2]; (Ii) The National Cancer Institute (NCI) GWAS (NCI-GWAS), som består av fire europeiske case-control serie, totalt 1,311 tilfeller og 3,424 kontroller, genotypet på HumanHap HapMap 500, 610 eller 660W BeadChips [7].
Post kvalitetskontroll disse GWAS gitt data på totalt 2.215 tilfeller og 8,566 kontroller. For å maksimere identifisering av nye risiko varianter, tilregnet vi over 10 millioner SNPs bruker 1000 genomer Prosjekt og UK10K data som referanse. Quantile-kvantilregresjoner (QQ) tomter for all SNPs post-imputering viste ikke materielle over-spredning (
λ
= 1,02 og 1,01 for henholdsvis UK-GWAS og NCI-GWAS;. S1 figur).
Vi samlet data fra disse to GWAS og brukt en invers-varians vektet faste-effekter metaanalyse modell for å beregne odds ratio (OR), konfidensintervall (KI) og
P
-verdier for hver SNP . Resultater fra denne meta-analysen, merket med kjent risiko loci, er vist på fig. 1. Vi ekskludert SNPs at (i) direkte tilordnet tidligere utgitt risiko loci (2p21, 2q22.3, 8q24.21, 11q13.3, 12p11.33 og 12q24.31, S1 Table), (ii) var i koblingsulikevekt (LD, på en terskel på
r
2 0,8) med SNPs fra disse loci eller (iii) hadde
P
0,01 i enten Storbritannia eller NCI datasett . Etter bruk disse filtrene, vurderte vi 22 SNPs og 3 indels i åtte regioner i LD som viste bevis for tilknytning til RCC risiko på
P
1,0 × 10
-6 (S2 tabell). For å validere disse potensielle foreninger, gjennomførte vi replikasjon i saker og kontroller hentet fra kombinere Kreft Genome Atlas (TCGA) Nyre Nedsatt Clear cell carcinoma (KIRC) og kreft genetiske markører av følsomhet (CGEMS) datasett (383 tilfeller og 2,189 kontroller, S3 Table ).
den horisontale linjen representerer betydningen terskelnivå (
P
= 1.0×10
-6) som kreves for varianter tas frem til replikering scenen. RCC risiko loci rapportert i tidligere studier er merket
I en analyse som kombinerer disse tre datasett, rs3845536, kartlegging til kromosom 1q24.1. (165,650,787 bps, NCBI bygge 37), oppnådde genome-wide betydning (
P
= 2.30 × 10
-8;
P
het = 0,24,
jeg
2 = 29%, tabell 1) for assosiasjon med RCC risiko. Denne foreningen ble drevet av NCI (
P
= 9.40×10
-7) og Storbritannia (
P
= 4.61×10
-3) studier og var ikke nominelt betydelig i den TCGA studien (
P
= 0,16). Men i det siste, mindre, studere effekten er av samme størrelse og i samme retning som i Storbritannia og NCI studier, og dermed øke foreningen signal i metaanalysen.
rs3845536 lokaliserer til intron 4 av
ALDH9A1
genet (aldehyd dehydrogenase, familie 9, underfamilien en, medlem 1; MIM 602733 fig. 2), innenfor en 64kb blokk av LD. Vi bekreftet den høye kvaliteten til godtgjørelses ved direkte genotyping rs3845536 i en tilfeldig undergruppe av UK-GWAS (516 tilfeller, r
2 = 0,99 og 402 kontroller, r
2 = 0,98, Materialer og metoder). RCC risiko knyttet til rs3845536 genotype er kompatibel med en log-additiv modell, OR for risiko allel homozygote blir 1,51 (95% KI: 1,29 til 1,77).
Figuren viser -log
10
P
verdier (y-aksen) versus kromosom stillinger (x-aksen; NCBI bygge 37). Genotypet SNPs vises som trekanter, med beregnede SNPs som sirkler. rs3845536 er blitt markert ved bruk av et større symbol. Fargeintensiteten er proporsjonal med LD med rs3845536: fra hvitt (
r
2 = 0) til rød (
r
2 = 1,0). Den lyseblå linjen viser rekombinasjon priser (estimert fra 1000 genomer Fase 1 CEU data). Andre gener og transkripsjoner er også vist.
Vi fant ikke bevis for interaksjoner mellom 1q24.1 og noen av de tidligere utgitt risiko loci-spesifikt vi evaluert interaksjonseffekter på RCC risiko for rs3845536 med SNPs på 2p21 (rs7579899 og rs4953346), 2q22.3 (rs12105918), 8q24.1 (rs6470588 og rs6470589), 11q13.3 (rs7105934), 12p11.23 (rs718314) og 12q24.31 (rs4765623). Forutsetningen om uavhengig RCC risiko loci ble støttet av mangel på signifikante interaksjonsvilkår mellom risikoen loci (
i
e
P
.. 0,05; S4 Table ).
ved hjelp av offentlig tilgjengelige mRNA uttrykk data, evaluert vi potensialet for
cis
-regulation av
ALDH9A1
eller andre nærliggende genet ved rs3845536 variasjon. Det var ingen statistisk signifikant sammenheng mellom genotype av rs3845536 eller en SNP i LD med rs3845536 (at r
2 0,8) og uttrykk for
ALDH9A1 Hotell og de nærliggende transkripsjoner
MGST3 Hotell og
TMCO1
(uttrykk data for karakterutskrifter LOC440700 og BC071770, også i regionen, var ikke tilgjengelig). Videre gjorde en Haploreg og RegulomeDb søk ikke gir bevis for rs3845536 eller en korrelert SNP å finne innenfor en transkripsjon regulatorisk region (data ikke vist). Vi har også gjort bruk av TCGA klar celledata for å undersøke hyppigheten av mutasjon av
ALDH9A1
,
MGST3
,
LOC440700 Hotell og
TMCO1
i nyrekreft [11]. Ingen av disse genene har mutasjonsfrekvenser i RCC . 1% (ingen data var tilgjengelige for transkripsjon BC071770)
For ytterligere å undersøke denne tilknytningen vi har gjort bruk av data fra International Agency for Research on Cancer (IARC) GWAS av RCC som var basert på åtte uavhengige case-control serie fra forskjellige europeiske land med 41,4% av tilfellene fra Vest- og Nord-Europa, og 58,6% fra Sentral- og Øst-Europa. I IARC-serien var det ingen bevis for en sammenheng mellom rs3845536 og risiko for RCC (
P
= 0,94, tabell 1). Derfor samlet, foreningen styrken ble kraftig redusert ved samtidig betydelig heterogenitet med inkludering av IARC datasettet
(P
= 2,73 x 10
-5,
P
het = 9,1 x 10
-4, jeg
2 = 82%;. tabell 1)
Diskusjoner
Vi rapporterer en nylig identifisert vanlige varianten på kromosom 1q24.1 kommentere en potensiell RCC mottakelighet locus kandidat. Hvis det bekreftes ved ytterligere studier er det en høy sannsynlighet for at den funksjonelle grunnlaget for 1q24.1 risiko locus er mediert gjennom
ALDH9A1 a priori
siden regionen krets er liten og rs3845536 er intronic til
ALDH9A1
. Selv om vi ikke observere en sammenheng mellom rs3845536 genotype og
ALDH9A1
uttrykk, en subtil forholdet mellom de to, slik som en kumulativ, langsiktig samhandling, er fortsatt en mulighet.
ALDH genet super er dokumentert [12] for å inkludere en rekke forskjellige isozymer som er involvert i metabolismen av aldehyder som er generert fra kjemisk forskjellige endogene og eksogene forløpere. Aldehyd-mediert effektene varierer fra homeostatiske og terapeutiske til cytotoksiske og gentoksiske og flere ALDHs har vært innblandet i humane sykdoms fenotyper eller pathophysiologies [12].
ALDH9A1
koder γ-trimethylaminobutyraldehyde dehydrogenase som deltar i metabolismen av γ-aminobutyraldehyde og aminoaldehydes avledet fra polyamines [12]. Høye nivåer av
ALDH9A1
uttrykk blir sett i nyrene [13] med betydelig berikelse av dehydrogenases inkludert
ALDH9A1
i RCC [14]. TNF-signalisering er godt etablert for å spille en rolle i utvikling RCC [15], og det er bemerkelsesverdig at
ALDH9A1
påvirker ekspresjonen av TNF-a-indusert protein 3 [16]. Selv om spekulativ disse dataene er konsistent med hypotesen om xenobiotisk metabolisme assosiert med apoptose og tumorigenesis spille en rolle i RCC onkogenese. Mens våre funn legger bevis på at
er ALDH9A1
innblandet i RCC utvikling, videre studier er nødvendig for å bestemme de variantene som er funksjonelt relevant.
For å avhøre om rs3845536 har en mitogen effekt på risikoen for andre krefttyper, vi undersøkt sammenhengen med kolorektal [17] og lunge kreft [18], akutt lymfatisk leukemi [19], multippelt myelom [20], gliom [21] og meningeom [22] ved hjelp av data fra tidligere rapportert GWAS. Imidlertid gjorde våre data ikke støtter denne hypotesen, og vi ikke observere, for noen av disse kreftformene, en signifikant effekt av rs3845536 genotype (eller en korrelert SNP på r
2≥0.8) på tumor risiko.
I sammendraget, rapporterer vi en potensiell RCC risiko mottakelighet locus kandidat ved rs3845536. Dette funnet impliserer genetisk variasjon i
ALDH9A1
i utviklingen av RCC. I likhet med andre GWAS hits, er rs3845536 en vanlig variant og overfører moderat risiko for RCC. Men overbevisende våre funn er fra analyse av Storbritannia, NCI og TCGA data på grunn av manglende validere foreningen i IARC serien observasjonen har å bli sett med en viss forsiktighet på dette tidspunktet og videre replikering er påkrevd. Vi merker oss at på grunn av både den beskjedne størrelsen på våre funn datasett og det faktum at publiserte RCC mottakelighet loci på 2p21, 2q22.3, 8q24.21, 11q13.3, 12p11.33 og 12q24.31 konto for mindre enn 5% av de familiære risikotilleggsrisiko varianter er sannsynlig å være identifiserbar gjennom utvidet GWAS analyser.
Materialer og metoder
Etikk uttalelse
Innsamling av blodprøver og klinisk-patologisk informasjon fra alle fagene ble gjennomført med skriftlig informert samtykke med etiske styregodkjenninger fra Royal Marsden NHS Hospitals Trust (CCR 1552/1922) og Storbritannia Multi forskningsetikk Board (07 /MRE01 /10). Detaljer om etikk godkjenning for NCI, TCGA og IARC studier er beskrevet tidligere [7].
Fag og datasett
GWAS datasett har tidligere blitt rapportert [2]. (I) UK-GWAS var basert på 1,045 RCC tilfeller (inkludert 590 tydelige cellekreft (CCCS), 42 papillær karsinom (PC), 33 chromophobe karsinom (CCS) og 19 blandede eller andre histologiske subtyper) genotypet ved hjelp av menneskelig OmniExpress-12 BeadChips , med 856 saker fra MRC sorce rettssaken og 189 tilfeller samlet gjennom The Institute of Cancer Research (ICR) og konge Marsden NHS Sykehus HF og 5200 kontroller genotypet ved hjelp Hap1.2M-Duo Custom array med 2,699 personer fra Wellcome Trust sak Kontroll Consortium 2 (WTCCC2) 1958 fødselskohort og 2501 fra Storbritannia Blood service. (Ii) NCI-GWAS var basert på 1,453 RCC saker og 3.599 kontroller av europeisk bakgrunn genotypet ved hjelp av Illumina HumanHap HapMap 500, 610 eller 660W BeadChips. Data var offentlig tilgjengelig på 1,311 tilfeller (inkludert 534 CCCS, 93 PCer, 86 andre histologiske undertyper) og 3,424 kontroller [7].
Som vi tidligere har beskrevet [2], vi brukt en rekke forhåndsdefinerte kvalitet kontrollberegninger til dataene. Spesielt vi benyttet følgende kriterier for å utelukke personer: ordnede vellykket genotypet SNPs 97%, uharmoniske sex, uteliggere i et plott av heterozygositet versus missingness, duplisering eller slektskap til den estimerte identitet ved nedstigning (IBD) 0.185 eller bevis på ikke-europeisk herkomst ved PCA-basert analyse ved hjelp HapMap referanseprøver (S2 fig.). SNP eksklusjonskriterier inkludert: takst 95%; forskjellige mangler genotypen priser mellom saker og kontroller på
P
10
-5; MAF 0,01; avgang fra Hardy-Weinberg likevekt i kontroller på
P
10
-5. En oversikt over alle prøve unntakene er gitt i S3 fig. Tilstrekkeligheten av case-control matching ble vurdert ved inspeksjon av Q-Q plott av teststatistikken og ved hjelp av inflasjon faktor λ
GC.
Replication serie
For replikering, vi brukes, som beskrevet tidligere [2], data fra TCGA og IARC. Kort fortalt ble TCGA RCC klare celle tilfeller (KIRC studie, tiltredelse antall phs000178.v7.p6) genotypede med Affymetrix Genome-Wide Menneskelig SNP Array 6.0. For kontrollene vi har gjort bruk av data på friske individer fra CGEMS bryst og prostata kreft studien, genotypet ved hjelp av henholdsvis Illumina HumanHap550 og fase 1A HumanHap300 + Phase 1BHumanHap240 Beadchips. Begge sakene og kontroller ble formelt undersøkt for en overlapping med NCI GWAS prøvene. Enhver TCGA eller CGEMS prøven viser seg å være en kopi av eller relatert til en prøve fra NCI GWAS ble fjernet fra replikering datasett. Etter ytterligere kontroll for slektskap og europeisk herkomst 383 tilfeller og 2,189 kontroller utgjorde TCGA /CGEMS replikering serien. The International Agency for Research on Cancer (IARC) GWAS besto av 2,461 RCC tilfeller (inkludert 1,340 CCCS, 95 PCer, 88 andre histologiske undertyper) og 5,081 kontroller av europeisk bakgrunn fra åtte europeiske studier) og har tidligere blitt beskrevet [7]. Genotyping av saker og kontroller ble utført ved hjelp av enten Illumina HumanHap300, 550 eller 610 Quad Beadchips. Data fra de tre arrays ble tilregnet gjenopprette rs3845536 genotype.
Statistiske og bioinformatiske analyser
R (v3.02) og SNPTEST (v2.4.1) programvare ble benyttet for analyse. Sammenhengen mellom individuelle SNPs og RCC risiko ble evaluert av Cochran-Armitage trend test. Ubetinget logistisk regresjon ble brukt til å beregne ORS og tilhørende 95% CIS. Den britisk-GWAS ikke krever noen kovariatene for å justere for, NCI-GWAS nødvendig justering for studiesenter og TCGA-GWAS nødvendig justering for første hovedkomponent. Innfasing av GWAS SNP genotyper ble utført ved hjelp SHAPEIT v2.644. Utypede SNPs ble tilregnet hjelp IMPUTEv2 (v2.3.0) med data fra 1000 genomer prosjektet (fase 1 integrert variant sett, v3.20101123, utgitt på IMPUTEv2 nettstedet 9. desember 2013) og UK10K (ALSPAC, EGAS00001000090 /EGAD00001000195, og TwinsUK , EGAS00001000108 /EGAD00001000194, studier only) brukes som referansepaneler. Analyse av kalkulatoriske data ble utført med SNPTEST v2.4.1 å ta høyde for usikkerhet i SNP prediksjon. Association meta-analyser kun tatt markører med info score 0.4, kalkulatoriske ringe priser /SNP 0,9 (UK NCI studier) og MAFs 0,005. Meta-analyser ble utført med R-pakken meta v2.4-1, ved hjelp av genotypen sannsynligheter fra IMPUTEv2 for utypede SNPs. Heterogenitet ble vurdert Cochran
Q
statistikk og andelen av den totale variasjonen skyldes heterogenitet ble vurdert ved hjelp av
Jeg
2 statistikken.
HapMap rekombinasjon hastighet ( CM /Mb) ble anvendt for å definere LD blokker. Den rekombinasjon som er definert ved hjelp av Oxford rekombinasjon hotspots og på grunnlag av fordelingen av cis definert av Gabriel og medarbeidere [23].
troskap av godtgjørelses, som vurderes av samsvar mellom kalkulatorisk og direkte genotypede SNPs, ble undersøkt i en tilfeldig undergruppe av prøver fra Storbritannia-GWAS. For å kvantifisere kvaliteten til godtgjørelses vi beregnet Pearsons korrelasjonskoeffisient r
2 mellom direkte genotypet verdier (telle antall referanse alleler, tar diskrete verdier i {0, 1, 2}) og kalkulatoriske genotyper (ta reelle verdier i intervallet [0,2])
den familiære relative risikoen for RCC tilskrives en bestemt variant ble beregnet ved hjelp av formelen fra [24]. hvor den samlede søsken relativ risiko
λ
0 for RCC er 2.45 [5].
fig. 2 har blitt produsert ved hjelp visPIG [25].
Analyse av TCGA data
sammenslutninger av SNP genotype med genekspresjon i RCC ble undersøkt ved hjelp av TCGA data generert ved hjelp av Agilent 244K Custom G4502A arrays. Frekvensen av mutasjoner ble innhentet ved hjelp av CBioPortal for Cancer Genomics webserver.
Hjelpemiddel Informasjon
Støtte informasjon er tilgjengelig på
PLoS ONE
online.
webadresser
R kjerneteam (2013). R: Et språk og miljø for statistisk databehandling. R Foundation for Statistiske Computing, Wien, Østerrike. URL https://www.R-project.org/
Illumina. https://www.illumina.com
dbSNP: http: //www.ncbi.nlm.nih gov /prosjekter /SNP
HapMap: https://www.hapmap.org
1000Genomes: https://www.1000genomes.org
visPIG: http: //vispig.icr.ac.uk
tilregner: https://mathgen.stats.ox.ac.uk/impute/impute
SNPTEST: http: //www.stats. ox.ac.uk/~marchini/software/gwas/snptest
cBioPortal for Cancer Genomics: https://www.cbioportal.org
Wellcome Trust sak Kontroll Consortium: www.wtccc. org.uk
Mendels arvelover i mennesket: https://www.ncbi.nlm.nih.gov/omim
The Cancer Genome Atlas-prosjektet: https://cancergenome.nih.gov
Genevar (genekspresjon variasjon): https://www.sanger.ac.uk/resources
sorce: https://www.ctu.mrc.ac.uk
Kreft genetiske markører av følsomhet (
CGEMS
): cgems.cancer.gov
Hjelpemiddel informasjon
S1 datasett. UK . NCI forening testresultater med metaanalyseresultater
Tabulatordelt ASCII tekstfil med en header rad
doi:. 10,1371 /journal.pone.0122589.s001 plakater (TXT)
S1 Fig. Q-Q plott av Cochran-Armitage trend test statistikk for foreningen basert på meta-analyse av UK-GWAS og NCI-GWAS pre-imputering (a-b); . Post-imputering (eh) og sjeldne SNPs etter imputering (il)
identitet linjen er angitt som en blå stiplet linje
doi:. 10,1371 /journal.pone.0122589.s002 plakater (TIF)
S2 fig. første to hovedkomponenter av det britiske og NCI datasett, som brukes for å fjerne prøver basert på avstamning under kvalitetskontroll.
sak og kontrollprøver er angitt som grå og svart kors, med HapMap referansepopulasjoner vist som fargede plater.
doi: 10,1371 /journal.pone.0122589.s003 plakater (TIF)
S3 fig. . GWAS data kvalitetskontroll
Detaljer er gitt av prøver, SNPs og kvalitetskontroll (QC) som brukes i hver GWAS
doi:. 10,1371 /journal.pone.0122589.s004 plakater (TIF)
S1 Bord. Bevis for foreningen på tidligere rapportert RCC mottakelighet loci
På hvert locus verdier er gitt for tidligere rapportert SNPs og ledelsen SNP i denne studien
doi:.. 10,1371 /journal.pone.0122589.s005 product: ( PDF)
S2 Table. UK NCI meta-analyse for alle varianter tatt gjennom til replikering scenen
doi:. 10,1371 /journal.pone.0122589.s006 product: (PDF)
S3 Table. Storbritannia, NCI . TCGA meta-analyse for alle varianter tatt gjennom til replikering scenen
vises i fet skrift er variantene oppnå
P
fast 5×10
-8
doi:. 10,1371 /journal.pone.0122589.s007 product: (PDF)
S4 Table. Betydningen av interaksjons gjelder rs3845536 med tidligere publiserte risiko SNPs for RCC
doi:. 10,1371 /journal.pone.0122589.s008 product: (PDF)
Takk
Vi takker deltagerne og deres familier og studie etterforskere og koordinatorer for arbeid i rekruttering. Denne studien benyttet seg av genotyping data fra 1958 Birth Cohort og National Blood service prøver, ber gjort tilgjengelig av Wellcome Trust sak Kontroll Consortium 2. En fullstendig liste over etterforskerne som har bidratt til generering av data er tilgjengelig på http: //www.wtccc.org.uk/. Resultatene er publisert her er helt eller delvis basert på data generert av The Cancer Genome Atlas pilotprosjekt etablert av NCI og NHGRI. Informasjon om TCGA og etterforskerne og institusjoner som utgjør TCGA forskningsnettet kan bli funnet på https://cancergenome.nih.gov/. Denne studien gjør bruk av data generert av UK10K Consortium, som stammer fra prøver fra ALSPAC og TwinsUK studier. En fullstendig liste over etterforskerne som har bidratt til generering av data er tilgjengelig fra www.UK10K.org. Finansiering for UK10K ble gitt av Wellcome Trust henhold award WT091310. Til slutt, vi erkjenner at arbeidet med følgende amerikanske individer Lee E. Moore (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester), Kevin B. Jacobs (Division of Cancer Epidemiology og genetikk, NCI , National Institutes of Health, avdeling helse og menneskelige tjenester, Cancer Genomics Research Laboratory, Leidos Biomedical Research Inc.); Jorge R. Toro (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester); Joanne S. Colt (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester); Faith G. Davis (Divisjon for epidemiologi /biostatistikk, School of Public Health, University of Illinois i Chicago); Kendra L. Schwartz (Karmanos Cancer Institute og Department of Family Medicine, Wayne State University); Christine D. Berg (Division of Cancer Prevention, NCI, National Institutes of Health, Department of Health and Human Services); Robert L. Grubb III (Divisjon for urologisk kirurgi, Washington University School of Medicine); Michelle A. Hildebrandt (Department of Epidemiology, Division of Cancer Prevention and Population Sciences, University of Texas MD Anderson Cancer Center), Xia Pu (Department of Epidemiology, Division of Cancer Prevention and Population Sciences, University of Texas MD Anderson Cancer Center ); Amy Hutchinson (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester, Cancer Genomics Research Laboratory, Leidos Biomedical Research Inc.); Joseph F. Fraumeni Jr (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling Helse og omsorgsminister) og Meredith Yeager (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester; Cancer Genomics Research Laboratory, Leidos Biomedical Research Inc.)
forfatterne ønsker å takke deltakere og forskere fra følgende IARC studier:. EPIC, HUNT2, NCI /IARC Sentral-Europa studie, ashram, CeRePP, den Leeds kohort, søke studien og case-control studie Moskva. Ytterligere detaljer om disse studiene kan bli funnet i supplerende materiale av Purdue et al, Nature Genetics, 2011.