PLoS ONE: Vanlige Variasjon på 1q24.1 (ALDH9A1) er en potensiell risikofaktor for Nedsatt Cancer

Abstract

Så langt seks mottakelighet loci for nyrecellekreft (RCC) har blitt oppdaget av genom-wide forening studier (GWAS). For å identifisere ytterligere RCC felles risiko loci, utførte vi en meta-analyse av publiserte GWAS (totalt 2.215 tilfeller og 8,566 kontroller i Vest-europeisk bakgrunn) med imputering bruker 1000 genomer Prosjekt og UK10K Prosjektdata som referansepaneler og fulgt opp mest signifikant sammenheng signaler [22 enkeltnukleotidpolymorfi (SNPs) og 3 indels i åtte genomiske regioner] i 383 saker og 2,189 kontroller fra Kreft Genome Atlas (TCGA). En kombinert analyse identifisert en lovende mottakelighet locus kartlegging for å 1q24.1 preget av de beregnede SNP rs3845536 (

P

kombinert = 2.30×10

-8). Spesielt signal kart å intron 4 av

ALDH9A1

genet (aldehyd dehydrogenase 9 familie, medlem A1). Vi evaluerte ytterligere dette potensialet signal i 2,461 saker og 5,081 kontroller fra International Agency for Research on Cancer (IARC) GWAS av RCC saker og kontroller fra flere europeiske regioner. I motsetning til tidligere funn ingen sammenheng ble vist i IARC serie (

P

= 0,94;

P

kombinert = 2.73×10

-5). Mens variasjon på 1q24.1 representerer en potensiell risiko locus for RCC, er fremtidige replikering analyser er nødvendig for å underbygge vår observasjon

Citation. Henrion MYR, Purdue MP, Scelo G, Broderick P, Frampton M, Ritchie A, et al. (2015) vanlig variant på 1q24.1 (

ALDH9A1

) er en potensiell risikofaktor for nyre kreft. PLoS ONE 10 (3): e0122589. doi: 10,1371 /journal.pone.0122589

Academic Redaktør: Paolo Peterlongo, IFOM, Fondazione Istituto FIRC di Oncologia Molecolare, ITALIA

mottatt: 26 november 2014; Godkjent: 11 februar 2015; Publisert: 31 mars 2015

Dette er en åpen tilgang artikkel, fri for all opphavsrett, og kan bli fritt reproduseres, distribueres, overføres, endres, bygd på, eller brukes av alle for ethvert lovlig formål. Arbeidet er gjort tilgjengelig under Creative Commons CC0 public domain engasjement

Data Tilgjengelighet: Komplett meta-analyse av data (inkludert SNP-IDer, odds ratio og P-verdier for de britiske og NCI studier) er tilgjengelig i Støtte informasjon seksjon for denne artikkelen på PLoS ONE webside (S1 datasett)

Finansiering:. sorce koordineres av Medical Research Council (MRC) Clinical Trials Unit (CTU) ved UCL og finansieres i hovedsak av MRC CTU på UCL og Cancer Research UK med en pedagogisk stipend fra Bayer. Ekstra midler ble gitt av Cancer Research UK (C1298 /A8362 støttes av Bobby Moore Fund). MYRH ble støttet av leukemi lymfom Research. JL er finansiert av RMH /ICR Biomedical Research Centre for Cancer. National Health Service (NHS) midler til Royal Marsden biomedisinsk forskning Senter og Cambridge University Health Partners angivelse. Midler til SØK teamet ble levert av Cancer Research UK (C490 /A10124). NCI nyre GWAS ble finansiert av egenutført Research Program av National Cancer Institute, National Institutes of Health (NIH). De bevilgende myndighet, bortsett fra MRC CTU, hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. Zhaoming Wang er ansatt Leidos Biomedical Research Inc., en USAs regjering entreprenør. Timothy Eisen er etterforskningsleder for hekserier og har fått forskningsstøtte skjema Bayer, GlaxoSmithKline, Pfizer og Astrazeneca har deltatt og blitt kompensert for rådgivende styrer for GlaxoSmithKline, Aveo og Astellas og er for tiden i permisjon fra University of Cambridge for å jobbe som Chief Lege Scientist i Astrazeneca. Sorce, men koordineres av Medical Research Council (MRC) Clinical Trials Unit (CTU) ved UCL og finansieres i hovedsak av MRC CTU ved UCL og Cancer Research UK, har vært finansiert delvis av en pedagogisk stipend fra en kommersiell kilde, Bayer. Dette endrer ikke forfatternes tilslutning til PLoS ONE politikk på deling av data og materialer.

Innledning

Wide nyre kreft står for rundt 2% av alle malignitet sykdommen påvirker 270.000 personer og forårsaker 116000 kreftrelaterte dødsfall hvert år [1]. Hos voksne 90% av nyrekreft er nyrecellekarsinomer (RCC) [2].

I tillegg til de anerkjente modifiserbare risikofaktorer for RCC-røyking og fedme-relaterte egenskaper, samt den inverse forholdet mellom risiko og alkoholforbruk, er det sterke bevis for en arvelig genetisk predisposisjon [3]. Rare germline mutasjoner i

VHL plakater (von Hippel-Lindau syndrom),

MET plakater (arvelig papillær nyrekreft),

BHD plakater (Birt-Hogg-Dube syndrom) og

FH plakater (arvelig leiomyomatosis og RCC-syndrom) dramatisk øke risikoen for RCC [4], men bidrar lite til den totale to-fold familiær risiko [5]. Bevis for polygenic mottakelighet for RCC har nylig blitt stadfestet av genom-wide assosiasjonsstudier (GWAS) som har identifisert risiko SNPs (enkeltnukleotidpolymorfi) på 2p21, 2q22.3, 8q24.21, 11q13.3, 12p11.33 og 12q24. 31 [2,6-9].

For å identifisere ytterligere RCC risiko SNPs, tilregnet vi over 10 millioner SNPs i to publiserte GWAS datasett ved hjelp av data fra 1000 genomer prosjektet [10] og UK10K prosjekter som referanse ( se Materialer Metoder for detaljer). Dette tillot oss å gjenopprette utypede genotyper, og dermed maksimere mulighetene for å identifisere nye risiko varianter for RCC. Vi gjennomførte et genom-wide meta-analyse av de to beregnede studier

Resultater

For meta-analysen vi har gjort bruk av data fra to tidligere utgitt GWAS av RCC. (I) . UK-GWAS, 1,045 RCC tilfeller genotypet på Illumina Omni Express BeadChips med 2,699 personer fra Wellcome Trust sak Kontroll Consortium 2 (WTCCC2) 1958 fødselskohort og 2501 UK Blood service som hadde blitt genotypet genotypet på Hap1.2M-Duo arrays tjener som kontroller [2]; (Ii) The National Cancer Institute (NCI) GWAS (NCI-GWAS), som består av fire europeiske case-control serie, totalt 1,311 tilfeller og 3,424 kontroller, genotypet på HumanHap HapMap 500, 610 eller 660W BeadChips [7].

Post kvalitetskontroll disse GWAS gitt data på totalt 2.215 tilfeller og 8,566 kontroller. For å maksimere identifisering av nye risiko varianter, tilregnet vi over 10 millioner SNPs bruker 1000 genomer Prosjekt og UK10K data som referanse. Quantile-kvantilregresjoner (QQ) tomter for all SNPs post-imputering viste ikke materielle over-spredning (

λ

= 1,02 og 1,01 for henholdsvis UK-GWAS og NCI-GWAS;. S1 figur).

Vi samlet data fra disse to GWAS og brukt en invers-varians vektet faste-effekter metaanalyse modell for å beregne odds ratio (OR), konfidensintervall (KI) og

P

-verdier for hver SNP . Resultater fra denne meta-analysen, merket med kjent risiko loci, er vist på fig. 1. Vi ekskludert SNPs at (i) direkte tilordnet tidligere utgitt risiko loci (2p21, 2q22.3, 8q24.21, 11q13.3, 12p11.33 og 12q24.31, S1 Table), (ii) var i koblingsulikevekt (LD, på en terskel på

r

2 0,8) med SNPs fra disse loci eller (iii) hadde

P

0,01 i enten Storbritannia eller NCI datasett . Etter bruk disse filtrene, vurderte vi 22 SNPs og 3 indels i åtte regioner i LD som viste bevis for tilknytning til RCC risiko på

P

1,0 × 10

-6 (S2 tabell). For å validere disse potensielle foreninger, gjennomførte vi replikasjon i saker og kontroller hentet fra kombinere Kreft Genome Atlas (TCGA) Nyre Nedsatt Clear cell carcinoma (KIRC) og kreft genetiske markører av følsomhet (CGEMS) datasett (383 tilfeller og 2,189 kontroller, S3 Table ).

den horisontale linjen representerer betydningen terskelnivå (

P

= 1.0×10

-6) som kreves for varianter tas frem til replikering scenen. RCC risiko loci rapportert i tidligere studier er merket

I en analyse som kombinerer disse tre datasett, rs3845536, kartlegging til kromosom 1q24.1. (165,650,787 bps, NCBI bygge 37), oppnådde genome-wide betydning (

P

= 2.30 × 10

-8;

P

het = 0,24,

jeg

2 = 29%, tabell 1) for assosiasjon med RCC risiko. Denne foreningen ble drevet av NCI (

P

= 9.40×10

-7) og Storbritannia (

P

= 4.61×10

-3) studier og var ikke nominelt betydelig i den TCGA studien (

P

= 0,16). Men i det siste, mindre, studere effekten er av samme størrelse og i samme retning som i Storbritannia og NCI studier, og dermed øke foreningen signal i metaanalysen.

rs3845536 lokaliserer til intron 4 av

ALDH9A1

genet (aldehyd dehydrogenase, familie 9, underfamilien en, medlem 1; MIM 602733 fig. 2), innenfor en 64kb blokk av LD. Vi bekreftet den høye kvaliteten til godtgjørelses ved direkte genotyping rs3845536 i en tilfeldig undergruppe av UK-GWAS (516 tilfeller, r

2 = 0,99 og 402 kontroller, r

2 = 0,98, Materialer og metoder). RCC risiko knyttet til rs3845536 genotype er kompatibel med en log-additiv modell, OR for risiko allel homozygote blir 1,51 (95% KI: 1,29 til 1,77).

Figuren viser -log

10

P

verdier (y-aksen) versus kromosom stillinger (x-aksen; NCBI bygge 37). Genotypet SNPs vises som trekanter, med beregnede SNPs som sirkler. rs3845536 er blitt markert ved bruk av et større symbol. Fargeintensiteten er proporsjonal med LD med rs3845536: fra hvitt (

r

2 = 0) til rød (

r

2 = 1,0). Den lyseblå linjen viser rekombinasjon priser (estimert fra 1000 genomer Fase 1 CEU data). Andre gener og transkripsjoner er også vist.

Vi fant ikke bevis for interaksjoner mellom 1q24.1 og noen av de tidligere utgitt risiko loci-spesifikt vi evaluert interaksjonseffekter på RCC risiko for rs3845536 med SNPs på 2p21 (rs7579899 og rs4953346), 2q22.3 (rs12105918), 8q24.1 (rs6470588 og rs6470589), 11q13.3 (rs7105934), 12p11.23 (rs718314) og 12q24.31 (rs4765623). Forutsetningen om uavhengig RCC risiko loci ble støttet av mangel på signifikante interaksjonsvilkår mellom risikoen loci (

i

e

P

.. 0,05; S4 Table ).

ved hjelp av offentlig tilgjengelige mRNA uttrykk data, evaluert vi potensialet for

cis

-regulation av

ALDH9A1

eller andre nærliggende genet ved rs3845536 variasjon. Det var ingen statistisk signifikant sammenheng mellom genotype av rs3845536 eller en SNP i LD med rs3845536 (at r

2 0,8) og uttrykk for

ALDH9A1 Hotell og de nærliggende transkripsjoner

MGST3 Hotell og

TMCO1

(uttrykk data for karakterutskrifter LOC440700 og BC071770, også i regionen, var ikke tilgjengelig). Videre gjorde en Haploreg og RegulomeDb søk ikke gir bevis for rs3845536 eller en korrelert SNP å finne innenfor en transkripsjon regulatorisk region (data ikke vist). Vi har også gjort bruk av TCGA klar celledata for å undersøke hyppigheten av mutasjon av

ALDH9A1

,

MGST3

,

LOC440700 Hotell og

TMCO1

i nyrekreft [11]. Ingen av disse genene har mutasjonsfrekvenser i RCC . 1% (ingen data var tilgjengelige for transkripsjon BC071770)

For ytterligere å undersøke denne tilknytningen vi har gjort bruk av data fra International Agency for Research on Cancer (IARC) GWAS av RCC som var basert på åtte uavhengige case-control serie fra forskjellige europeiske land med 41,4% av tilfellene fra Vest- og Nord-Europa, og 58,6% fra Sentral- og Øst-Europa. I IARC-serien var det ingen bevis for en sammenheng mellom rs3845536 og risiko for RCC (

P

= 0,94, tabell 1). Derfor samlet, foreningen styrken ble kraftig redusert ved samtidig betydelig heterogenitet med inkludering av IARC datasettet

(P

= 2,73 x 10

-5,

P

het = 9,1 x 10

-4, jeg

2 = 82%;. tabell 1)

Diskusjoner

Vi rapporterer en nylig identifisert vanlige varianten på kromosom 1q24.1 kommentere en potensiell RCC mottakelighet locus kandidat. Hvis det bekreftes ved ytterligere studier er det en høy sannsynlighet for at den funksjonelle grunnlaget for 1q24.1 risiko locus er mediert gjennom

ALDH9A1 a priori

siden regionen krets er liten og rs3845536 er intronic til

ALDH9A1

. Selv om vi ikke observere en sammenheng mellom rs3845536 genotype og

ALDH9A1

uttrykk, en subtil forholdet mellom de to, slik som en kumulativ, langsiktig samhandling, er fortsatt en mulighet.

ALDH genet super er dokumentert [12] for å inkludere en rekke forskjellige isozymer som er involvert i metabolismen av aldehyder som er generert fra kjemisk forskjellige endogene og eksogene forløpere. Aldehyd-mediert effektene varierer fra homeostatiske og terapeutiske til cytotoksiske og gentoksiske og flere ALDHs har vært innblandet i humane sykdoms fenotyper eller pathophysiologies [12].

ALDH9A1

koder γ-trimethylaminobutyraldehyde dehydrogenase som deltar i metabolismen av γ-aminobutyraldehyde og aminoaldehydes avledet fra polyamines [12]. Høye nivåer av

ALDH9A1

uttrykk blir sett i nyrene [13] med betydelig berikelse av dehydrogenases inkludert

ALDH9A1

i RCC [14]. TNF-signalisering er godt etablert for å spille en rolle i utvikling RCC [15], og det er bemerkelsesverdig at

ALDH9A1

påvirker ekspresjonen av TNF-a-indusert protein 3 [16]. Selv om spekulativ disse dataene er konsistent med hypotesen om xenobiotisk metabolisme assosiert med apoptose og tumorigenesis spille en rolle i RCC onkogenese. Mens våre funn legger bevis på at

er ALDH9A1

innblandet i RCC utvikling, videre studier er nødvendig for å bestemme de variantene som er funksjonelt relevant.

For å avhøre om rs3845536 har en mitogen effekt på risikoen for andre krefttyper, vi undersøkt sammenhengen med kolorektal [17] og lunge kreft [18], akutt lymfatisk leukemi [19], multippelt myelom [20], gliom [21] og meningeom [22] ved hjelp av data fra tidligere rapportert GWAS. Imidlertid gjorde våre data ikke støtter denne hypotesen, og vi ikke observere, for noen av disse kreftformene, en signifikant effekt av rs3845536 genotype (eller en korrelert SNP på r

2≥0.8) på tumor risiko.

I sammendraget, rapporterer vi en potensiell RCC risiko mottakelighet locus kandidat ved rs3845536. Dette funnet impliserer genetisk variasjon i

ALDH9A1

i utviklingen av RCC. I likhet med andre GWAS hits, er rs3845536 en vanlig variant og overfører moderat risiko for RCC. Men overbevisende våre funn er fra analyse av Storbritannia, NCI og TCGA data på grunn av manglende validere foreningen i IARC serien observasjonen har å bli sett med en viss forsiktighet på dette tidspunktet og videre replikering er påkrevd. Vi merker oss at på grunn av både den beskjedne størrelsen på våre funn datasett og det faktum at publiserte RCC mottakelighet loci på 2p21, 2q22.3, 8q24.21, 11q13.3, 12p11.33 og 12q24.31 konto for mindre enn 5% av de familiære risikotilleggsrisiko varianter er sannsynlig å være identifiserbar gjennom utvidet GWAS analyser.

Materialer og metoder

Etikk uttalelse

Innsamling av blodprøver og klinisk-patologisk informasjon fra alle fagene ble gjennomført med skriftlig informert samtykke med etiske styregodkjenninger fra Royal Marsden NHS Hospitals Trust (CCR 1552/1922) og Storbritannia Multi forskningsetikk Board (07 /MRE01 /10). Detaljer om etikk godkjenning for NCI, TCGA og IARC studier er beskrevet tidligere [7].

Fag og datasett

GWAS datasett har tidligere blitt rapportert [2]. (I) UK-GWAS var basert på 1,045 RCC tilfeller (inkludert 590 tydelige cellekreft (CCCS), 42 papillær karsinom (PC), 33 chromophobe karsinom (CCS) og 19 blandede eller andre histologiske subtyper) genotypet ved hjelp av menneskelig OmniExpress-12 BeadChips , med 856 saker fra MRC sorce rettssaken og 189 tilfeller samlet gjennom The Institute of Cancer Research (ICR) og konge Marsden NHS Sykehus HF og 5200 kontroller genotypet ved hjelp Hap1.2M-Duo Custom array med 2,699 personer fra Wellcome Trust sak Kontroll Consortium 2 (WTCCC2) 1958 fødselskohort og 2501 fra Storbritannia Blood service. (Ii) NCI-GWAS var basert på 1,453 RCC saker og 3.599 kontroller av europeisk bakgrunn genotypet ved hjelp av Illumina HumanHap HapMap 500, 610 eller 660W BeadChips. Data var offentlig tilgjengelig på 1,311 tilfeller (inkludert 534 CCCS, 93 PCer, 86 andre histologiske undertyper) og 3,424 kontroller [7].

Som vi tidligere har beskrevet [2], vi brukt en rekke forhåndsdefinerte kvalitet kontrollberegninger til dataene. Spesielt vi benyttet følgende kriterier for å utelukke personer: ordnede vellykket genotypet SNPs 97%, uharmoniske sex, uteliggere i et plott av heterozygositet versus missingness, duplisering eller slektskap til den estimerte identitet ved nedstigning (IBD) 0.185 eller bevis på ikke-europeisk herkomst ved PCA-basert analyse ved hjelp HapMap referanseprøver (S2 fig.). SNP eksklusjonskriterier inkludert: takst 95%; forskjellige mangler genotypen priser mellom saker og kontroller på

P

10

-5; MAF 0,01; avgang fra Hardy-Weinberg likevekt i kontroller på

P

10

-5. En oversikt over alle prøve unntakene er gitt i S3 fig. Tilstrekkeligheten av case-control matching ble vurdert ved inspeksjon av Q-Q plott av teststatistikken og ved hjelp av inflasjon faktor λ

GC.

Replication serie

For replikering, vi brukes, som beskrevet tidligere [2], data fra TCGA og IARC. Kort fortalt ble TCGA RCC klare celle tilfeller (KIRC studie, tiltredelse antall phs000178.v7.p6) genotypede med Affymetrix Genome-Wide Menneskelig SNP Array 6.0. For kontrollene vi har gjort bruk av data på friske individer fra CGEMS bryst og prostata kreft studien, genotypet ved hjelp av henholdsvis Illumina HumanHap550 og fase 1A HumanHap300 + Phase 1BHumanHap240 Beadchips. Begge sakene og kontroller ble formelt undersøkt for en overlapping med NCI GWAS prøvene. Enhver TCGA eller CGEMS prøven viser seg å være en kopi av eller relatert til en prøve fra NCI GWAS ble fjernet fra replikering datasett. Etter ytterligere kontroll for slektskap og europeisk herkomst 383 tilfeller og 2,189 kontroller utgjorde TCGA /CGEMS replikering serien. The International Agency for Research on Cancer (IARC) GWAS besto av 2,461 RCC tilfeller (inkludert 1,340 CCCS, 95 PCer, 88 andre histologiske undertyper) og 5,081 kontroller av europeisk bakgrunn fra åtte europeiske studier) og har tidligere blitt beskrevet [7]. Genotyping av saker og kontroller ble utført ved hjelp av enten Illumina HumanHap300, 550 eller 610 Quad Beadchips. Data fra de tre arrays ble tilregnet gjenopprette rs3845536 genotype.

Statistiske og bioinformatiske analyser

R (v3.02) og SNPTEST (v2.4.1) programvare ble benyttet for analyse. Sammenhengen mellom individuelle SNPs og RCC risiko ble evaluert av Cochran-Armitage trend test. Ubetinget logistisk regresjon ble brukt til å beregne ORS og tilhørende 95% CIS. Den britisk-GWAS ikke krever noen kovariatene for å justere for, NCI-GWAS nødvendig justering for studiesenter og TCGA-GWAS nødvendig justering for første hovedkomponent. Innfasing av GWAS SNP genotyper ble utført ved hjelp SHAPEIT v2.644. Utypede SNPs ble tilregnet hjelp IMPUTEv2 (v2.3.0) med data fra 1000 genomer prosjektet (fase 1 integrert variant sett, v3.20101123, utgitt på IMPUTEv2 nettstedet 9. desember 2013) og UK10K (ALSPAC, EGAS00001000090 /EGAD00001000195, og TwinsUK , EGAS00001000108 /EGAD00001000194, studier only) brukes som referansepaneler. Analyse av kalkulatoriske data ble utført med SNPTEST v2.4.1 å ta høyde for usikkerhet i SNP prediksjon. Association meta-analyser kun tatt markører med info score 0.4, kalkulatoriske ringe priser /SNP 0,9 (UK NCI studier) og MAFs 0,005. Meta-analyser ble utført med R-pakken meta v2.4-1, ved hjelp av genotypen sannsynligheter fra IMPUTEv2 for utypede SNPs. Heterogenitet ble vurdert Cochran

Q

statistikk og andelen av den totale variasjonen skyldes heterogenitet ble vurdert ved hjelp av

Jeg

2 statistikken.

HapMap rekombinasjon hastighet ( CM /Mb) ble anvendt for å definere LD blokker. Den rekombinasjon som er definert ved hjelp av Oxford rekombinasjon hotspots og på grunnlag av fordelingen av cis definert av Gabriel og medarbeidere [23].

troskap av godtgjørelses, som vurderes av samsvar mellom kalkulatorisk og direkte genotypede SNPs, ble undersøkt i en tilfeldig undergruppe av prøver fra Storbritannia-GWAS. For å kvantifisere kvaliteten til godtgjørelses vi beregnet Pearsons korrelasjonskoeffisient r

2 mellom direkte genotypet verdier (telle antall referanse alleler, tar diskrete verdier i {0, 1, 2}) og kalkulatoriske genotyper (ta reelle verdier i intervallet [0,2])

den familiære relative risikoen for RCC tilskrives en bestemt variant ble beregnet ved hjelp av formelen fra [24]. hvor den samlede søsken relativ risiko

λ

0 for RCC er 2.45 [5].

fig. 2 har blitt produsert ved hjelp visPIG [25].

Analyse av TCGA data

sammenslutninger av SNP genotype med genekspresjon i RCC ble undersøkt ved hjelp av TCGA data generert ved hjelp av Agilent 244K Custom G4502A arrays. Frekvensen av mutasjoner ble innhentet ved hjelp av CBioPortal for Cancer Genomics webserver.

Hjelpemiddel Informasjon

Støtte informasjon er tilgjengelig på

PLoS ONE

online.

webadresser

R kjerneteam (2013). R: Et språk og miljø for statistisk databehandling. R Foundation for Statistiske Computing, Wien, Østerrike. URL https://www.R-project.org/

Illumina. https://www.illumina.com

dbSNP: http: //www.ncbi.nlm.nih gov /prosjekter /SNP

HapMap: https://www.hapmap.org

1000Genomes: https://www.1000genomes.org

visPIG: http: //vispig.icr.ac.uk

tilregner: https://mathgen.stats.ox.ac.uk/impute/impute

SNPTEST: http: //www.stats. ox.ac.uk/~marchini/software/gwas/snptest

cBioPortal for Cancer Genomics: https://www.cbioportal.org

Wellcome Trust sak Kontroll Consortium: www.wtccc. org.uk

Mendels arvelover i mennesket: https://www.ncbi.nlm.nih.gov/omim

The Cancer Genome Atlas-prosjektet: https://cancergenome.nih.gov

Genevar (genekspresjon variasjon): https://www.sanger.ac.uk/resources

sorce: https://www.ctu.mrc.ac.uk

Kreft genetiske markører av følsomhet (

CGEMS

): cgems.cancer.gov

Hjelpemiddel informasjon

S1 datasett. UK . NCI forening testresultater med metaanalyseresultater

Tabulatordelt ASCII tekstfil med en header rad

doi:. 10,1371 /journal.pone.0122589.s001 plakater (TXT)

S1 Fig. Q-Q plott av Cochran-Armitage trend test statistikk for foreningen basert på meta-analyse av UK-GWAS og NCI-GWAS pre-imputering (a-b); . Post-imputering (eh) og sjeldne SNPs etter imputering (il)

identitet linjen er angitt som en blå stiplet linje

doi:. 10,1371 /journal.pone.0122589.s002 plakater (TIF)

S2 fig. første to hovedkomponenter av det britiske og NCI datasett, som brukes for å fjerne prøver basert på avstamning under kvalitetskontroll.

sak og kontrollprøver er angitt som grå og svart kors, med HapMap referansepopulasjoner vist som fargede plater.

doi: 10,1371 /journal.pone.0122589.s003 plakater (TIF)

S3 fig. . GWAS data kvalitetskontroll

Detaljer er gitt av prøver, SNPs og kvalitetskontroll (QC) som brukes i hver GWAS

doi:. 10,1371 /journal.pone.0122589.s004 plakater (TIF)

S1 Bord. Bevis for foreningen på tidligere rapportert RCC mottakelighet loci

På hvert locus verdier er gitt for tidligere rapportert SNPs og ledelsen SNP i denne studien

doi:.. 10,1371 /journal.pone.0122589.s005 product: ( PDF)

S2 Table. UK NCI meta-analyse for alle varianter tatt gjennom til replikering scenen

doi:. 10,1371 /journal.pone.0122589.s006 product: (PDF)

S3 Table. Storbritannia, NCI . TCGA meta-analyse for alle varianter tatt gjennom til replikering scenen

vises i fet skrift er variantene oppnå

P

fast 5×10

-8

doi:. 10,1371 /journal.pone.0122589.s007 product: (PDF)

S4 Table. Betydningen av interaksjons gjelder rs3845536 med tidligere publiserte risiko SNPs for RCC

doi:. 10,1371 /journal.pone.0122589.s008 product: (PDF)

Takk

Vi takker deltagerne og deres familier og studie etterforskere og koordinatorer for arbeid i rekruttering. Denne studien benyttet seg av genotyping data fra 1958 Birth Cohort og National Blood service prøver, ber gjort tilgjengelig av Wellcome Trust sak Kontroll Consortium 2. En fullstendig liste over etterforskerne som har bidratt til generering av data er tilgjengelig på http: //www.wtccc.org.uk/. Resultatene er publisert her er helt eller delvis basert på data generert av The Cancer Genome Atlas pilotprosjekt etablert av NCI og NHGRI. Informasjon om TCGA og etterforskerne og institusjoner som utgjør TCGA forskningsnettet kan bli funnet på https://cancergenome.nih.gov/. Denne studien gjør bruk av data generert av UK10K Consortium, som stammer fra prøver fra ALSPAC og TwinsUK studier. En fullstendig liste over etterforskerne som har bidratt til generering av data er tilgjengelig fra www.UK10K.org. Finansiering for UK10K ble gitt av Wellcome Trust henhold award WT091310. Til slutt, vi erkjenner at arbeidet med følgende amerikanske individer Lee E. Moore (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester), Kevin B. Jacobs (Division of Cancer Epidemiology og genetikk, NCI , National Institutes of Health, avdeling helse og menneskelige tjenester, Cancer Genomics Research Laboratory, Leidos Biomedical Research Inc.); Jorge R. Toro (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester); Joanne S. Colt (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester); Faith G. Davis (Divisjon for epidemiologi /biostatistikk, School of Public Health, University of Illinois i Chicago); Kendra L. Schwartz (Karmanos Cancer Institute og Department of Family Medicine, Wayne State University); Christine D. Berg (Division of Cancer Prevention, NCI, National Institutes of Health, Department of Health and Human Services); Robert L. Grubb III (Divisjon for urologisk kirurgi, Washington University School of Medicine); Michelle A. Hildebrandt (Department of Epidemiology, Division of Cancer Prevention and Population Sciences, University of Texas MD Anderson Cancer Center), Xia Pu (Department of Epidemiology, Division of Cancer Prevention and Population Sciences, University of Texas MD Anderson Cancer Center ); Amy Hutchinson (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester, Cancer Genomics Research Laboratory, Leidos Biomedical Research Inc.); Joseph F. Fraumeni Jr (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling Helse og omsorgsminister) og Meredith Yeager (Division of Cancer Epidemiology og genetikk, NCI, National Institutes of Health, avdeling helse og menneskelige tjenester; Cancer Genomics Research Laboratory, Leidos Biomedical Research Inc.)

forfatterne ønsker å takke deltakere og forskere fra følgende IARC studier:. EPIC, HUNT2, NCI /IARC Sentral-Europa studie, ashram, CeRePP, den Leeds kohort, søke studien og case-control studie Moskva. Ytterligere detaljer om disse studiene kan bli funnet i supplerende materiale av Purdue et al, Nature Genetics, 2011.

Legg att eit svar