Abstract
Tidligere kandidat genet kobling tilnærming på brorens par berørt med prostatakreft identifisert et locus av prostatakreft følsomhet på D3S1234 innenfor den skjøre histidin triaden genet (
FHIT
), en tumor suppressor som induserer apoptose. Påfølgende foreningen tester på 16 SNPs spenner over ca 381 kb rundt D3S1234 i amerikanere av europeisk avstamming avdekket betydelige bevis for foreningen for en enkelt SNP innen intron 5 av
FHIT
. I denne studien, re-sekvensering og genotyping innen 28.5 kb region rundt denne SNP videre avgrenset foreningen med prostatakreft risiko for en 15 kb region. Flere SNPs i sekvenser henhold evolusjonær begrensning innenfor intron 5 av
FHIT
definert flere relaterte haplotyper med en økt risiko for prostatakreft i europeiske amerikanere. ble påvist sterke assosiasjoner for en risiko haplotype definert av SNPs 138 543, 142 413 og 152 494 i alle tilfeller (Pearsons χ
2 = 12,34, df 1,
P
= 0,00045) og for homozygot risiko haplotype definert av SNPs 144 716, 142 413 og 148 444 i saker som delte 2 alleler identisk ved nedstigning med sine berørte brødre (Pearsons χ
2 = 11,50, df 1,
P
= 0,00070). I tillegg til høyt konserverte sekvenser som omfatter SNPs 148 444 og 152 413, befolkningsstudier avdekket sterke signaturer av naturlig seleksjon for en 1 kb vindu dekker SNP 144 716 i to befolkningsgrupper, den europeiske Amerikansk (π = 0,0072, Tajima er D = 3,31, 14 SNPs) og den japanske (π = 0,0049, Fay Wu H = 8,05, 14 SNP’er), så vel som i sjimpanser (Fay Wu H = 8,62, 12 SNP’er). Disse resultatene støtter sterkt engasjement av
FHIT
intronic region i en økt risiko for prostatakreft
Citation. Ding Y, Larson G, Rivas G, Lundberg C, Geller L, Ouyang C , et al. (2008) Sterk underskrift Natural Selection innenfor en
FHIT
Intron innblandet i Prostate Cancer Risk. PLoS ONE 3 (10): e3533. doi: 10,1371 /journal.pone.0003533
Redaktør: Matthew W. Hahn, Indiana University, USA
mottatt: 11 september 2008; Godkjent: 02.10.2008; Publisert: 27 oktober 2008
Copyright: © 2008 Ding et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. YD, GL, GR, CL, CO, TGK ble støttet av NIH AG15720, DOE PC020680, og Beckman Research Institute of the City of Hope. LG, JW, JA, JS, MBD, ABB, JMK, PJO, RS, JAS, DJ ble støttet av NIH AG15720. MN ble støttet av NIH HG-002790
Konkurrerende interesser. De bevilgende myndighet hadde ingen rolle i dataanalyse, skriving, eller publiseringsbeslutninger
Innledning
Den genetiske kompleksitet. prostatakreft har blitt godt demonstrert av uavhengige, store, genom-wide association studier som identifiserte flere risiko loci hele det menneskelige genom [1], [2], [3], [4], [5], [6 ]. Disse loci øker hver bare moderat en persons risiko for sykdommen med opp til 60%, og kan samlet utgjøre over 50% av den genetiske risikoen for prostatakreft observert i den humane populasjonen. Andre risiko loci gjenstår å bli oppdaget gjennom meta-analyse av eksisterende data og videre studier.
Vi har nylig brukt kobling analyse av kandidatgener og påfølgende foreningen tester for å implisere en 30 kb region innen intron 5 av
FHIT
i prostata kreftrisiko [7].
FHIT
genet, som koder for et 16,8 kD triphosphatase, består av 10 korte eksoner som spenner over ca 1,5 Mb. Den ligger på det mest hyppig observert skjøre området i det menneskelige genom,
FRA3B plakater (3p14.2); og det er en av de tidligste og mest hyppig slettede regioner i flere krefttyper [8], [9]. Selv om sletting av
FHIT
genet i prostata kreft vev har ikke blitt mye rapportert, tap av heterozygositet (LOH) er rapportert hos 2 av 15 svulster ved bruk av mikro markører lokalisert i introner av
FHIT product: [10]. Tap av
FHIT
ble også påvist i en
in vitro
modell av et prostatacancer tumorcellelinje som er etablert ved hjelp av HPV-18 for å udødeliggjøre en normal voksen human prostata epitel cellelinje, fulgt ved malign transformasjon ved eksponering av en kjemisk karsinogen [11], [12]. Immunhistokjemisk analyse i primær kreftvev bekreftet fravær eller sterkt redusert ekspresjon av FHIT proteinnivåer i tumorceller, i motsetning til høye nivåer av ekspresjon i den tilstøtende normal prostata epitel [12], [13].
Selv om FHIT protein uttrykk er tapt eller redusert i mange typer kreft hos mennesker [9], er ikke klart det mekanistiske grunnlaget for involvering av intron 5 i genetisk risiko for prostatakreft. En bakterie-line endring i
FHIT Hotell som er forbundet med kreftrisiko har ikke blitt rapportert, muligens på grunn av begrensninger i tidligere studier som fokuserte bare på eksoner, uoversatt regioner av mRNA, og arrangører. Karakteristiske landemerkene i en skjør region, for eksempel aphidicholin-indusert hybrid pauser, HPV16 integrasjons nettsteder, pSV2NEO integrasjon områder, og slutt sletting punkter i kreftcellelinjer, har blitt identifisert innen introner av
FHIT product: [14]; Men disse landemerkene ikke overlapper med regionen innen intron 5 at vi innblandet i prostata kreftrisiko. FHIT spiller en viktig rolle i å indusere apoptose av celler som reagerer på DNA-skader forårsaket av eksponering overfor en rekke miljømessige midler, slik som stråling, virus, og giftige kjemikalier som er tilstede i tobakksrøk og tinn miner [15], [16], [17 ]; men de genetiske elementer som styrer slike prosesser ikke er blitt identifisert.
De evolusjonære krefter mutasjon, naturlig seleksjon, genetisk drift, og rekombinasjon har formet mønster av variasjonen i det menneskelige genom. Naturlig seleksjon, som virker på funksjonelt viktige genetiske variasjoner som resulterer i forandring av form, slik som tilpasning til lokale miljøet og sykdom mottakelighet, kan forlate spesifikke signaturer på berørte loci [18], og analyse av genetisk variasjon i populasjoner blir sentral for å forstå funksjon av gener [19], [20]. Screening for signaturer av naturlig utvalg kan bidra til å avdekke nye funksjonelle elementer. Derfor brukte vi denne tilnærmingen for å avgjøre om bevis for utvalget kunne påvises i løpet av de 30 kb
FHIT
intronic regionen. Vi gjennomførte en re-sekvense undersøkelse og analysert koblingsulikevekt (LD) og haplotype struktur i sekvenser fra intron 5 av
FHIT
i europeisk amerikansk, Yoruban, og japanske populasjoner, og flere ikke-menneskelige primater. Basert på disse dataene, vi raffinert regionen assosiert med prostatakreft risiko for en 15 Kb LD blokk og viste sterke signaturer av utvalget i flere befolkningsgrupper og eventuelt andre primater.
Resultater
Re-sekvense
Larson et al. [7] testet 16 SNP’er spenner over et 381 kb region innenfor intron 5 av
FHIT
for tilknytning til prostata kreftrisiko og oppdaget en signifikant sammenheng med en av SNP, rs760317. En mindre signifikant sammenheng med prostatakreft risiko ble funnet på en nært knyttet SNP, rs722070, som ligger 13 kb fra rs760317 på centromeric side; ingen sammenheng ble påvist med SNPs på telomeric side. For å kartlegge sammenhengen med prostatakreft risiko med høy oppløsning og se etter tegn på valget, gjennomførte vi en re-sekvense undersøkelsen bruker 13 tilfeldig utvalgte tilfeller og kontroller av europeisk-amerikansk avstamning. Den totale undersøkte sekvenslengde var 28,5 kb, med unntak av to un-amplifiserbare sekvens gap på 487 bp og 263 bp. Ett av hullene inneholdt en AT gjenta og en lang poly A-tarm-kanalen, og den andre inneholdt AT og AG gjentar. To fragmenter av denne regionen med lengder på 19 kb (fra 134 kb til 153 kb, genbanken Tiltredelse # AF152364) og 7 kb (fra 142 kb til 149 kb interne til 19 kb, genbanken Tiltredelse # AF152364) ble også sekvensert i 16 Yoruban og 16 japanske personer, henholdsvis.
Over hele regionen, identifiserte vi 216 SNPs og 9 indels, alt 1-24 bp, i 13 europeiske amerikanske individer (Tabell S1). Innenfor 19 kb region, sekvensert i både europeiske-amerikanere og Yorubans, fant vi 146 SNPs og 7 indels felles for begge populasjoner, 99 SNPs og en Indel unik for Yorubans, og 19 SNPs og en Indel unike for europeiske amerikanere. Innen 7 kb region sekvensert i alle tre befolkningsgrupper, vi har oppdaget 64 SNPs og 4 indels felles for de tre populasjonene; 28 SNPs og en Indel unik for Yorubans; 2 SNPs unike europeiske-amerikanere; En SNP unike for den japanske; og 9 SNPs og en Indel felles for to populasjoner. Indels og SNPs i lange baner av enkle repetisjoner ble ikke med i denne statistikken og påfølgende analyser på grunn av den lave nøyaktigheten av sekvensering i disse områdene.
koblingsulikevekt (LD)
Vi beregnet pair- klok r
2 basert på SNPs med en mindre allel frekvens større enn 0,05 (196 SNPs for de 13 europeiske-amerikanere prøver og 178 SNPs for de 16 Yorubans prøver) ved hjelp Haploview (fig. 1A og C) og rekombinasjon priser med hotspots bruker rhomap (fig. 1B). I samsvar med tidligere rapporter [21], [22], observerte vi mye mindre LD i den afrikanske prøven, selv om mønsteret av LD var ellers lik mellom populasjonene. Den mest merkbare forskjell mellom de to populasjonene var et 15 kb LD blokk i den europeiske amerikanske befolkningen som ble avbrutt ved mye høyere bakgrunn rekombinasjon hastighet og i det minste en rekombinasjon tilkoblingspunkter i Yoruban populasjonen (Fig. 1B). Vi valgte 48 SNPs fra re-sekvense undersøkelse og tre SNPs publisert i Larson et al. [7] som representerte grunn LD struktur og genotypet disse SNPs i alle tilfelle og kontrollprøver for å vurdere deres tilknytning til prostatakreft.
A. Grafisk fremstilling av parvis r
2 (0-1 representert med grå skala fra hvitt til svart) beregnet og visualisert ved hjelp Haploview for 13 europeiske amerikanere. B. rekombinasjon priser (Rho) beregnes ved hjelp rhomap for Yorubans (rød linje, med SNP posisjoner representert ved åpne sirkler) og europeiske amerikanere (svart linje, med SNP stillinger merket med solide diamanter) basert på sekvense data. Den grå linjen med solide trekanter var basert på genotyping data på 51 SNPs fra 25 tilfeller og 25 kontroller (europeiske amerikanere). C. Grafisk fremstilling av r
2 bruker for 16 Yorubans. En solid svart strek representerte en 15 kb LD blokk i EU-amerikansk.
Association Tester
Vi utførte foreningen tester på enkelt SNPs og haplotyper av SNP kombinasjoner. Siden den opprinnelige sammenhengen data spådd en recessiv modell [7], hypotese vi at undergruppen av saker som delt 2 alleler identiske ved nedstigning (IBD) på dette locus med sine brødre (2 IBD tilfeller) vil være de største bidragsyterne til den observerte genetiske signal. Derfor sammenlignet vi SNP frekvenser i kontroller mot alle tilfeller og 2 IBD tilfeller (tabell S2). Signifikant sammenheng (cutoff
P
= 0,05, ikke korrigert for multippel testing) ble observert i flere SNPs og maksimert til 137 302 (rs9814915, Pearsons χ
2 = 5,16, frihetsgrader (df) 1,
P
= 0,0231) for alle tilfeller (enkelt åpne sirkler i fig. 2A) og 138543 (rs760317, Pearsons χ
2 = 7,42, df 1,
P
= 0,0064) for 2 IBD undergruppe (enkle sorte sirkler i fig. 2A).
A. Association tester av enkelt SNPs og haplotyper. Individuelle SNPs ble forankret på et kart UCSC Genome med Multiz justering og bevaring av virveldyr (v166, https://genome.ucsc.edu) for 30 kb regionen. Regionen var representert med en åpen bar i et innfelt i øvre venstre hjørne som viser enkle SNP tester rundt et bredere 381 kb region. En pil pekte på mikro markør, D3S1234, viser den sterkeste sammenhengen signal i den opprinnelige studien. En solid svart strek tilsvarer 15 kb LD blokk i EU-amerikansk. Tester på allelfrekvens for individuelle SNPs er merket med sirkler (åpent for alle tilfeller og svart for 2 IBD tilfeller). Tester for risiko haplotyes er representert ved sirkler forbundet med linjer. SNPs uthevet i rødt er i sterk LD (r
2 0,9) med hverandre. B. Nukleotid mangfold (π) beregnet for Yorubans (rød linje), europeiske amerikanere (svart linje) og japansk (blå linje). C. Tajima er D beregnet for Yorubans (rød linje), europeiske amerikanere (svart linje) og japansk (blå) ved hjelp av glidebryteren. D. Mangfold mellom menneske- og sjimpanse sekvenser (mørk grønn linje inkludert SNPs i mennesker og lys grønn linje unntatt SNPs hos mennesker).
Screening for haplotype forening for alle tre-SNP kombinasjoner avslørte at den sterkeste foreningen av prostatakreft risikoen var med en haplotype definert av SNPs 135 181, 142 413 og 152 494 i 2 IBD tilfeller (haplotype GGT ble beriket i 2 IBD tilfeller χ
2 = 9,73, df 1,
P
= 0,0018, Tabell S3) og SNPs 138 543, 142 413 og 152 494 i alle tilfeller (haplotype AGT ble beriket i alle tilfeller, χ
2 = 13,72, df 1,
P
= 0,00021, Tabell S3). Å tilsette noen annen enkelt SNP til kombinasjonen økte ikke tilknytning til prostata kreftrisiko, mens utelate en hvilken som helst SNP i kombinasjonene betydelig redusert signal (data ikke vist). I samsvar med en recessiv modell, vevsprøver som var homozygote for risiko haplotype ble betydelig anriket i tilfeller sammenlignet med kontroller.
interessant at både SNP kombinasjonene som er identifisert i alle tilfeller og 2 IBD tilfeller inkludert SNP’er 142 413 og 152 494, hvilken individuelt utstilt svært begrenset tilknytning til prostata kreftrisiko. SNP 152494 ble plassert i et sterkt konservert ikke-kodende sekvens, og SNP 142413 var lokalisert innenfor 100 bp fra en annen sterkt konservert ikke-kodende sekvens (fig. 2A). Verken SNP var i sterk LD med andre SNP genotypet i saker og kontroller. Men SNP 135 181 var i sterk LD med SNP 138543 (r
2 = 0,86) og flere andre genotypet SNPs, 135240, 137261, 139813, 144716, 147904 (r
2 spenner 0,87 til 0,97, markert SNPs i fig. 2A). Derfor er disse andre SNPs også utstilt en overbevisende assosiasjon til prostata kreftrisiko i kombinasjon med SNPs 142413 og 152494 (SNP kombinasjoner representert ved åpne sirkler forbundet med en linje i Fig. 2A og Tabell S3). Ytterligere 21 SNP var kjent for å være sterkt knyttet til 135181 basert på sekvenseringsdata. Blant alle de SNPs knyttet til 135 181, bare 147 907 var lokalisert innenfor et høyt konservert sekvens (Fig. 2A). Derfor kan SNP 147 907 være en sannsynlig kandidat for kausalitet.
En SNP, 148444, som ligger innenfor en svært konservert sekvens, viste den høyeste LD (r
2 = 0,37) med SNP 152 494 blant alle genotypet SNPs . Skifte SNP 152 494 med 148 444 i de tre-SNP kombinasjoner også definert en haplotype som homozygote ble spesielt anriket i tilfeller (tabell S3). I samsvar med en recessiv modell, fant vi den sterkeste tilknytning homozygote av risikoen haplotype i 2 IBD tilfeller (SNP kombinasjoner representert av svarte sirkler forbundet med en linje i Fig. 2A)-selv sterkere enn de fleste kombinasjoner med SNP 152494.
SNPs understreker en signatur av Natural Selection hos mennesker er forbundet med prostata kreft Risk
for å diskriminere SNPs som kan bidra funksjonalitet mellom SNPs viser sterk sammenheng med prostatakreft risiko, vi brukte re-sekvensering av data fra European -American, Yoruban, og japanske befolkningen til å søke etter signaturer av naturlig utvalg, i tillegg til bevaring, innenfor 28,5 kb regionen. Flere viktige statistikk ble beregnet ved hjelp av glidebryteren. Vi har sammenlignet disse populasjonsparametre i
FHIT
intervallet til de som ble oppnådd i HapMap KODE Sekvense Project, der 10 regioner i 500 kb fra ulike kromosomer i fire menneskelige populasjoner ble sekvensert i sin helhet. Disse kode data gitt en rimelig kontroll for genom-wide distribusjon av befolkningsspesifikk statistikk. For å bekrefte statistikken observert i de 13 tilfeldig utvalgte tilfeller og kontroller, vi også sekvensert et 2 kb region som inneholder den maksimale Tajima sin D-verdi på 14 CEPH individer. Fordi kode data ikke gir genotyper på indels, vi også ekskludert indels fra vår
FHIT
region i befolkningen analyser og sammenligninger.
Vi har observert en påfallende økning av nucleotide mangfold som strakte flere LD blokker for de tre befolkningsgrupper (fig. 2B). Den maksimale π var 0,0072 (0,0065 for de 14 CEPH personer), 0,0077 og 0,0049 for europeisk-amerikansk, Yoruban, og japanske populasjoner, sammenlignet med et gjennomsnitt på 0,00071 (0,000071 til 0,0055), 0,00074 (0,00013 til 0,0046), og 0,00076 (0,00013 til 0,0050) i løpet av de 5 Mb Socket regioner. Derfor maksimal π observert innenfor 28,5 kb regionen i intron 5 av
FHIT
skredet maksimalt π observert fra de 10 kode regioner for både europeiske-amerikanere og Yorubans (p 0,0060 for begge populasjoner).
Vi oppdaget også en betydelig økning av Tajima er D i europeisk-amerikanske befolkningen (fig. 2C). 1 kb vinduet i maksimal Tajima er D (3,31,
P
= 0,003 forutsatt standard nøytral modell jeg;
P
= 0,006 antar nøytral modell II;
P
= 0,021 forutsatt nøytral modell III) samsvarer med vindu av maksimal π. I de 14 CEPH individer, det samme vinduet viste en Tajima er D av 3.11. Bare en liten KODE region, mindre enn 0,6% av alle Socket regioner, vises en høyere maksimal Tajima s D. En betydelig Fay Wu H-verdi (8,05 for 14 SNPs,
P
= 0,0067, forutsatt en standard nøytral modell I) ble påvist for det samme vinduet i den japanske befolkningen. En 14-SNP skyve vinduet analyse for alle kode regioner i den japanske befolkningen funnet 237 av 6265 vinduer med Fay Wu H-verdi større enn 8,05 (
P
= 0,038).
For å finne ut om større nucleotide mangfold skyldes en økning i den lokale mutasjonsraten, evaluert vi nukleotid forskjeller i 28,5 kb sekvensert region ved å sammenligne en menneskelig sekvens med en sjimpanse sekvens hentet fra UCSC genom nettleser. For hver 1 kb vinduet over 28,5 kb regionen, divergens mellom mennesket og sjimpansen sekvenser varierte 0,004 til 0,026 og i gjennomsnitt 0,0145 (Fig. 2D). For en kb region med maksimal π i europeisk-amerikanske befolkningen, observerte vi en divergens av 0,0150. Divergens verdier for de tilstøtende 5 og 10 kb var 0,0137 og 0,0149, henholdsvis. Denne statistikken var bare litt høyere enn gjennomsnittet for sjimpansen genomet (0,0123 [23]). Når SNPs som er observert i menneskelige populasjoner ble ekskludert, var avviket betydelig redusert (varierer 0,002 til 0,022 og gjennomsnitt 0,0112), spesielt innenfor den regionen som viste høy nucleotide mangfold hos mennesker (Fig. 2D). Disse observasjonene utelukket en høyere lokal mutasjonsraten som en viktig årsak til større mangfold i menneskelige befolkninger.
To SNPs, 144 716 og 144 552, innenfor en kb vinduet som viste maksimal signal av naturlig utvalg, var i sterk LD med 135 181 og viste et tilsvarende nivå av foreningen til prostata kreftrisiko i kombinasjon med SNPs 142413 og enten 152 494 eller 148 444 (tabell S3). vises regionen fra 142 kb til 149 kb betydelig høyere nucleotide mangfold blant europeiske-amerikanere enn Yorubans, i motsetning til omkringliggende regioner og det store flertallet av det menneskelige genom, der Yoruban mangfold er generelt lik eller høyere enn europeiske-amerikanske mangfold ( fig. 2B). Denne regionen omfattet også tre SNP kombinasjoner: 142413, 144716 eller 147904, og 148444, hver bosatt i en sekvens i henhold til naturlig utvalg og fellesskap opptegning den antatte risikoen haplotype. Denne overlappingen av utvalget og signifikant sammenheng signaler innblandet co-evolusjon og interaktive funksjoner blant sekvens moduler i sitt engasjement i prostata kreftrisiko.
Signaturer av markering i ikke-menneskelige primater
Sekvensering av data i det samme en kb vindu i vanlige vestlige sjimpanser og bonobos også avdekket potensial naturlig utvalg. Selv om sjimpanse sekvens besatt en helt annen samling av SNP sammenlignet med den humane sekvensen, er haplotype fordelinger oppviste et mønster som ligner på den i den japanske populasjon: hovedsakelig en haplotype med ekstremt høye frekvenser av den utledede allelet for flere SNP’er (Tajima s D = – 1.81, Fu og Li D = -3,02, π = 0,0015). En betydelig høy Fay Wu H (8.62 til 12 SNPs,
P
= 0,0001 forutsatt standard nøytral modell) foreslo en haiker effekt under en nylig positiv utvelgelse. For bonobo sekvens, to sjeldne SNPs, hver observert kun en gang i de 6 personer, og ingen fast nucleotide endring var til stede i en kb vinduet (Tajima er D = -1,45, fuli D = -1,72, π = 0,00034) sammenlignet med sjimpansen sekvens
Tre underarter er anerkjent blant vanlige sjimpanser basert på deres geografiske fordeling.
Pan troglodytes Verus (PTV)
i Vest-Afrika,
Pan troglodytes troglodytes (PTT)
i sentral-Afrika, og
Pan troglodytes schweinfurthii (PTS)
i Øst-Afrika. Tidligere studier antydet ulike demografiske historier for de tre underarter, noe som resulterer i en litt positiv gjennomsnittlige verdien av Tajima sin D for vestlige sjimpanser (
PTV
) og en betydelig negativ gjennomsnittlige verdien av Tajima sin D for sentrale sjimpanser (
Ptt
). Å etablere et genom-wide distribusjon av befolkningsstatistikk for vanlige sjimpanser, vi hentet og analyseres på nytt sekvensdata fra to tidligere studier: 50 intergeniske regioner (Genebank acc # AY276396 til AY277244.) Sekvensert i 17 vanlige sjimpanser (6
PTV
, 5
Ptt
, 2
Pts
, og fire ukjent) [24] og 10 ikke-kodende regioner sekvensert i 14 sentrale sjimpanser [25] fra NCBI databasen (tabell 1) . Statistikken observert i en kb målområdet (Tajima er D = -1,81, Fu Li D = -3,02) plassert den blant de laveste av genom-wide distribusjoner. Sekvense data for et større antall Primate individer som er analysert separat for hvert underarter vil være nødvendig for å evaluere effekten av naturlig seleksjon med høyere selvtillit. Likevel, disse foreløpige data er konsistente med underskrifter fra utvalget i en primat andre enn mennesker arter.
Diskusjoner
Tidligere linkage og assosiasjonsstudier identifisert en ca 30 kb regionen assosiert med prostatakreft fare. I denne rapporten detaljert analyse av lokale LD struktur og ytterligere foreningen tester raffinert maksimal signal til innenfor en 15 kb region, muligens involverer en haplotype definert av tre eller flere SNPs innen sekvenser under sterkt evolusjonær begrensning.
Bevis på både foreningen og utvalg støttet viktige og interaktive funksjoner for sekvenser innenfor 15 kb intronic regionen
FHIT
. Risiko haplotyper definert av store alleler av flere SNPs i kombinasjoner var ikke i fullstendig LD med en enkelt SNP oppdaget i 28,5 kb region og utstilt mye sterkere assosiasjoner med prostatakreft enn noen enkelt SNP testet. Blant de 9 SNPs som avgrenset risiko haplotyper, fire (142413, 147904, 148444, og 152494) ble plassert innenfor eller i nærheten sekvenser som er høyt konservert blant pattedyrene; og en (144 716) ble plassert i en sekvens som viste betydelige og tydelige signaler om naturlig utvalg innen forskjellige mennesker og primater populasjoner. Lene av 5 SNPs (142413, 135181, 137261, 138543, og 144716) i risiko haplotyper var doms. Lene både SNPs 148 444 og 152 494 i risiko haplotyper ble avledet og nådde svært høy frekvens ( 0,8) i alle tre befolknings testet; Derfor er de så ut til å være under positiv seleksjon, spesielt i Yoruban populasjonen. For eksempel, SNP 148444 overlappet med en-kb vinduene i minimum Tajima er D (-1,804 for 10 SNPs) og forhøyet Fay og Wu H (9,31 for 17 SNPs) i Yoruban befolkningen.
Levin et al. [26] rapporterte nylig en invers assosiasjon av prostatakreft risiko for SNP, rs760317 (138 543), beskrevet i vår opprinnelige studien [7]. Forfatterne tilskrives foreningen av «snudd» allel (G istedenfor A) til (i) en høy mindre allel frekvensen av rs760317, (ii) en uidentifisert ekstra årsaks SNP av relativt lav koblingsulikevekt med rs760317, og (iii) no vurdering av samspillet mellom de to i sin analysemodell. I denne studien har vi identifisert ytterligere to SNPs, 142 413 og 152 494 eller 148 444, som samhandler med enten SNP 138 543 eller en SNP i svært høy LD med 138 543, for eksempel 144 716, som avgjorde risikoen for prostatakreft. Parvise LD målinger hos de tre samvirkende SNP’er var faktisk meget lav (R «> 2 0,3 for alle mulige par), i samsvar med den opprinnelig foreslått av Lin et al hypotese. [27] for å forklare en venda forening.
Påvisning av signaturer av naturlig utvalg har foreslått å kartlegge gener og regulatoriske elementer som er involvert i menneskelige sykdommer [18], [28]. I denne artikkelen har vi brukt bevis på naturlig utvalg å antyde funksjonaliteten til en intronic region innblandet i prostatakreft [7]. Siden vi oppdaget sterke signaler om både positive og balansere utvalg innen samme region for ulike menneskelige og ikke-menneskelige primater populasjoner, tilfeldigheter og demografiske historie alene kan ikke fullt ut forklare våre observasjoner. For å kontrollere for effekten av demografiske historie, bekreftet vi høy Tajima er D og π i de samme personer som har blitt sekvensert i KODE Sequencing prosjektet og gitt et genom-wide bakgrunn. Derfor presenterer naturlig utvalg en plausibel forklaring på ikke-tilfeldig fordeling av SNP genotyper eksisterende i dataene.
Populasjonsgenetikk i denne regionen antydet at ulike selektive krefter kan ha vært konstituert i ulike populasjoner av mennesker og primater. Det er derfor interessant at
FHIT
genet er kjent for sin respons til miljøfaktorer som røyking [15] og stråling [17], og formidler celle overlevelse eller apoptose [9]. Vi sammenlignet synonymt og nonsynonymous endringer i
FHIT
kodende region mellom mennesket og sjimpansen og funnet 4 synonymt og 2 nonsynonymous endringer innen 441 bp kodende region. Begge nonsynonymous endringer endret de kjemiske egenskapene til aminosyrer som er involvert, noe som tyder på at
FHIT
kan være en av de raskt utvikler seg gener utsatt for positiv utvelgelse.
Vanlige assosiasjonsstudier har i stor grad fokusert på kjente koding sekvenser, som står for bare ca 1,5% av det menneskelige genom. Imidlertid har nyere studier avdekket store bestander av tidligere ukjente RNA transkripsjoner, hvorav de fleste er ikke-koding, innen introner og intergeniske regioner [29], [30]. Mange av disse transkriptene er involvert i tumordannelse [31] inkludert prostata svulst differensiering [32]. Flere uavhengige studier har også bekreftet rollen til ikke- kodende områder i 8q24 i mottakelighet for prostatakreft [2], [33]. Innenfor regionen vi implcated i prostata kreftrisiko, til et genom-wide innsats forutsi bevaring av RNA sekundærstruktur ved hjelp av dataprogrammet, EvoFold [34], oppdaget en 61-bp bevart struktur rundt SNP 148444. Om slike elementer innen intron 5 locus formidle prostatakreft risiko gjennom endring av
FHIT
uttrykk /funksjon eller gjennom urelaterte intronic funksjonelle elementer gjenstår å bli undersøkt.
Materialer og metoder
Studier Emner
saken og kontrollprøver har blitt beskrevet tidligere [7]. Studien og bruk av vev har blitt godkjent av Institutional Review Board på hver deltakende stedet. Informert skriftlig samtykke ble innhentet fra alle deltakerne. Kort fortalt ble DNA fra 200 ubeslektede pasienter av europeisk avstamning berørt med prostatakreft og 143 kontroller av matchet etnisitet brukes i denne studien. Informert samtykke ble innhentet fra alle deltakerne. I tillegg ble DNA fra CEPH 14 (European amerikansk), 16 Yoruban (afrikansk), og 16 japanske individer oppnådd fra Coriell Cellearkiv. Prøver fra de 14 CEPH personer, åtte av de Yorubans, og åtte av de japanske hadde vært re-sekvensert i HapMap KODE resequencing Project.
Vi har fått primas DNA panel (PRP00003) fra Coriell Cell Oppbevaringssteder. Utvalget omfattet en person fra hver av følgende arter: vanlig sjimpanse, Bonobo, gorilla, Sumatra orangutang, pigtailed macaque, rhesusaper, svart-handed edderkopp ape, felles ullen ape, rød kropp mustached tamarin, og ring-tailed lemurer. Vi har også innhentet DNA fra en annen 12 urelaterte vanlige vestlige sjimpanser (NS03622, NS03623, NS03639, NS03641, NS03650M NS03656, NS03660, NA03450, NG06939, NS03489, NS03610, og NS03659, personlig kommunikasjon, W. Winckler, The Broad Institute, Cambridge, MA ) fra Coriell Cell Repository, samt DNA fra fem ekstra ubeslektede Bonobo individer (identifikatorer tilgjengelig på forespørsel).
SNP genotyping
Genomisk DNA ble ekstrahert som beskrevet tidligere [7]. SNP genotyper ble innhentet og kritiske SNPs ble bekreftet ved hjelp av en kombinasjon av ABI Snapshot ™ genotyping på en ABI377 DNA sequencer, Sequenom iPLEX SNP skrive på en MassARRAY system, og sekvensering på ABI3130xl og ABI 3730 plattformer.
Re-sekvensering
Genomisk DNA ble forsterket ved hjelp av overlappende PCR primere og re-sekvensert ved hjelp av PCR og interne primere. SNPs ble oppdaget ved hjelp PolyPhred 4.0 [35] og Consed [36]. For å minimere falsk negativ rate, brukte vi en lav -score innstilling på 50 å tagge alle mulige SNPs og inspisert hver SNP manuelt for å kontrollere riktigheten av sekvens oppdrag. Indels ble registrert gjennom en manuell inspeksjon.
Statistiske analyser
Vi brukte Haploview [37] for å utføre χ
2 tester av Hardy-Weinberg likevekt (HWE) for hver markør genotypet i saker og kontroller og fant ingen ekstrem avvik. Vi har også brukt Haploview å beregne og visualisere r
2 mellom hvert par av markører (mindre allel frekvens, MAF, ≥5%), og for å sammenligne allelfrekvenser saker og kontroller. Rekombinasjon prisene ble beregnet ved hjelp rhomap [38] med 10.000.000 løper og 1000000 brenne-ins. Screening for individuell haplotype sammenslutning av 3 SNP kombinasjoner ble oppnådd ved hjelp unphased [39].