Abstract
Flere nyere studier har undersøkt funksjon og utviklingen av et Drosophila homolog til den menneskelige brystkreft mottakelighet genet
BRCA2
, heter
dmbrca2
. Vi har tidligere identifisert hva som syntes å være en siste utvidelsen i RAD51-bindende BRC-repeat array i stamfar
Drosophila Yakuba
. I denne studien undersøker mønstre av variasjon og utviklingen av
dmbrca2
BRC-repeat utvalg innen
D. Yakuba
og dets nære slektninger. Vi utvikler en modell for hvordan ulik krysset over kan ha produsert utvidet form, men vi også observere korte gjentatte former, typisk for andre arter i
D. melanogaster
gruppe, segregerende innenfor
D. Yakuba
og
D. santomea
. Disse kortformer ser ikke ut til å være identisk-by-avstamning, noe som tyder på at historien til
dmbrca2
i
D. melanogaster
undergruppe har involvert gjenta enhets sammentrekninger fører til homoplasious former. Vi konkluderer med at den evolusjonære historien til
dmbrca2
i
D. Yakuba
og kanskje i andre Drosophila arter kan være mer komplisert enn det som kan utledes fra undersøkelse av de publiserte enkeltgenomsekvenser per art
Citation. Bennett SM, Mercer JM, Noor MAF (2010) skli Sliding Away: serie~~POS=TRUNC endringer og Homoplasy i Gjenta nummer i
Drosophila Yakuba
homolog of human Cancer Følsomhet Gene
BRCA2
. PLoS ONE 5 (6): e11006. doi: 10,1371 /journal.pone.0011006
Redaktør: William J. Murphy, Texas A M-universitetet USA
mottatt: 20 april 2010; Godkjent: 17 mai 2010; Publisert: 08.06.2010
Copyright: © 2010 Bennett et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Funding var levert av National Science Foundation utmerkelser 0509780 og 0715484, og National Institutes of Health utmerkelser GM076051 og GM086445. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Den menneskelige brystkreft mottakelighet genet
BRCA2
koder for et protein mye studert på grunn av sin betydning i DNA-reparasjon [1] – [3]. Mutasjoner i menneskelig kimcellelinje
BRCA2
føre til en levetid økt mottakelighet for brystkreft og eggstokkreft [4], [5], kanskje som følge av ineffektiv reparasjon av DNA-dobbelttrådbrudd (DSB sin) i løpet av homolog rekombinasjon [6] – [8]. I funksjonelle studier,
BRCA2
har vist seg å regulere RAD51 recombinase, en viktig nucleoprotein filament som festes til skadet, enkelttrådet DNA på stedet av DSB sin og er avgjørende for oppstart av reparasjonsprosessen [9]. BRCA2 binder seg til RAD51 av foreningen med sekvensmotiver, kalt «BRC gjentar» [10], [11], som hver består av ca 30 aminosyrer og finnes i en svært konservert område av
BRCA2
genet. Disse konserverte gjentar har vært nyttig for å identifisere
BRCA2
homologer tvers av mange eukaryote arter inkludert,
Arabidopsis thaliana
,
Caenorhabditis elegans
,
Drosophila melanogaster
, og
Trypanosoma brucei product: [12], [13]. Forskere fortsatt sliter med å finne ut hvor
BRCA2
koordinerer sin RAD51 og ssDNA-bindende aktiviteter for å lette overføringen av RAD51 protein på DNA (men se [14]), men Pellegrini og Venkitaraman [9] foreslått at «primitive organismer skjuler en enklere versjon av
BRCA2
protein vil gi nyttige modellsystemer. «
en putatively enklere
BRCA2
homolog ble identifisert i modellorganisme
Drosophila melanogaster
bruker sekvens fingeravtrykk som representerer viktige rester for
BRCA2-RAD51
interaksjoner i locus
CG30169
, senere kalt «
dmbrca2
» [15]. Funksjonelle studier av denne Drosophila genet har vist at den kommuniserer med
D. melanogaster Rad51 product: (
spnA
), og dens avbrudd påvirker utbredelsen av mitotisk og meiotisk DNA-reparasjon og homolog rekombinasjon [15] – [17], som fører Kløvstad
et. al.
[16] for å konkludere med at Drosophila
BRCA2
representerer en funksjonell homolog av genet som kan brukes til å karakterisere den humane motstykke. I motsetning til pattedyr
BRCA, 2
som har åtte BRC gjentar,
D. melanogaster
homolog ble funnet å inneholde tre gjentakelser [13]. En senere undersøkelse av dette genet over de publiserte Drosophila genomer viste stor variasjon i antall BRC repetisjoner, med
D. melanogaster
og dens undergruppe som har tre repetisjoner (figur 1), mens andre, mer fjernt beslektede arter som
D. pseudoobscura Hotell og
D. persimilis
bærer opptil elleve gjentar [18]. Denne variasjonen i antall BRC repetisjoner ble også demonstrert innen enkelte arter i tillegg; ti utvalgte stammer av
D. pseudoobscura
ble funnet å ha syv, ni eller elleve BRC repetisjoner, kanskje indikerer siste utviklingen innen dette genet [18].
Dette treet viser antall «BRC» gjentar fra den publiserte genomsekvens for hver arter i slekten Drosophila. Den blå boksen streker melanogaster gruppen, som har et mønster av tilsynelatende stabilitet i gjenta nummeret.
Selv om det er stor variasjon i repeat nummer over fylogeni av Drosophila, synes denne varianten for å være fraværende i melanogaster gruppe, der de artene som har publisert genomsekvenser alle inneholder 3 BRC gjentas. Unntaket fra dette mønsteret i melanogaster gruppen er
D. Yakuba
, som publiserte genomsekvens av
dmbrca2
bærer fem BRC gjentas. Observasjon av denne alternative gjenta skjemaet reiser flere spørsmål: er dette høyere gjenta nummer ekte eller en genom mis-montering artefakt [19]? Hvis det er ekte, er dette høyere gjenta tallform utbredt over hele
D. Yakuba
stammer, eller er en kortere skjema til stede i naturlige populasjoner? Kan vi utlede den historiske endringen i antall repetisjoner ved å analysere nukleotidsekvens? Og til slutt, hvis det er alternative former, kan vi oppdage bevis for tilhørende naturlig utvalg i spredningen av det store antallet gjenta skjemaet? I denne studien undersøker vi sekvensen og utviklingen av antall BRC gjentar i Drosophila homolog av
BRCA2
i
D. Yakuba
og dets søsterarter
D. santomea Hotell og plassere den i en evolusjonær sammenheng. Forstå mønstre observert hos disse artene kan tillate oss å bli bedre kjent med de genetiske prosessene som påvirker dette genet som er viktig for den grunnleggende prosessen med rekombinasjon og helse mer generelt.
Materialer og metoder
Drosophila
Aksjer
Drosophila Yakuba Hotell og
D. santomea
bestander anvendt i denne studien ble oppnådd fra Dr. Jerry Coyne [20]. Fluene ble bevart i absolutt etanol til DNA ble ekstrahert i vårt laboratorium.
DNA, PCR Amplification og sekvense
Genomisk DNA ble isolert fra voksne i
D. Yakuba
og
D. santomea
med en enkel flue squish protokollen [21]. Primere for PCR amplifisering ble utformet fra den publiserte
D. Yakuba
genomsekvens montering [22]. Primerne er utformet fra
dmbrca2
regionen ble brukt til PCR forsterke segmenter av genet i 25 mL reaksjonsvolumer. Størrelser av PCR-produktene ble bekreftet ved elektroforese på en 1% agarosegel. PCR-produkter ble renset ved hjelp ExoSAP-It (USB Corp) og sekvensert ved hjelp av ABI BigDye ved Duke University IGSP sekvense anlegget. Sekvensene ble deponert i GenBank /EMBL databaser under deponeringsnummer HM146151-HM146174.
Data Analyser
DNA-sekvenser ble justert beregnings hjelp BioEdit 7.0.9 [23], og deretter modifisert ved manuell justering . DNAsp [24] ble brukt til å estimere nucleotide mangfold (pi) og Tajima er D [25], for
dmbrca2
regionen. Vi oppnådde verdiene av Tajima sin D for lignende loci i
D. Yakuba
og
D. santomea
fra Llopart
et. al. product: [26] for sammenligning.
Vi undersøkte sekvensert regionene for hver stamme og sammenlignet dem med full samlet sekvens i denne regionen fra den publiserte
D. Yakuba
genom [22]. I den publiserte genomet regionen, vi kategorisert i fem distinkte BRC gjentar seg ved hjelp av diagnostiske aminosyrer og størrelsesforskjeller, nummerert numerisk 1 til 5 fra 5′-enden [18]. Vi oversatte DNA-sekvensen av eksoner av våre stammenes sekvenser og manuelt forhold hver enkelt gjenta til de nummererte genom gjentar hjelp av diagnose aminosyrer og størrelsesforskjeller.
fylogenetisk analyse ble utført med PAUP * 4.0b10 [27 ]. BRCA2 gjentatte motiver for
D. melanogaster product: (DME),
D. sechellia product: (DSE),
D. simulans
(DSi),
D. erecta product: (Der), og
D. Yakuba product: (dya) ble hentet fra FlyBase referanse genomer, og kombinert med
D. santomea product: (DSA) og ekstra
D. Yakuba
sekvenser samlet inn for dette arbeidet.
D. Yakuba
ble anvendt som en standard for nummerering av gjentatte motiver: 1-5 fra amino-ende til karboksyl-enden av peptidet.
D. persimilis
gjenta 2 (Dpe2) ble brukt som en utgruppe. Sekvenssammenstillinger ble gjort i Seaview versjon 4.0 [28] med ytterligere justeringer av øyet. Sekvensmotiver ble avgrenset av den 35 aminosyre lang Pfam skjult Markov modell (HMM) for BRCA2 gjentar [29]. På grunn av den korte sekvensen lengde og beskjedne nivåer av sekvensvariasjon, nabo-sammenføyning med korrigert p-avstander ble valgt for tre estimering.
Diskusjon
Før fylogenetisk analyse av publiserte
Resultater og
D. melanogaster
undergruppe genomsekvenser for gjentakelser avdekket to store clades: alle partalls gjentar og alle oddetalls gjentar [18].
D. Yakuba
gjenta 3 (Dya3) tilhørte den oddetalls clade men var uvanlig i ikke clustering med enten første eller tredje gjentar, men i stedet rester basal til begge (se figur 2). Visuell undersøkelse av aminosyre- og nukleotidsekvenser viste at 3′-enden av Dya3 boringen sterk sekvenslikhet med Dme1 og der1, mens 5′-enden besatt noen diagnostiske aminosyrer som lignet Dme3 og Der3 (figur 3). Denne observasjonen tyder på at en ulik-krysset over hendelsen (figur 4) kan ha oppstått mellom gjenta en og gjenta tre gir opphav til en gjentakelse utvidelse fra en anen av tre BRC gjentar til en avledet tilstand av 5 repetisjoner historisk i
D . Yakuba
avstamning. Selv om Dya2 og Dya4 gjentar klynge fylogenetisk, 17% aminosyresekvensidentitet divergens og 18 aminosyre gap i den publiserte genomsekvens av Dya4 forhold til Dya2, indikere at en slik hendelse, hvis det forekom i det hele tatt, ikke forekommer i meget siste tiden.
Sekvenser som inngår er hentet fra
Drosophila melanogaster plakater (DME),
D. Yakuba product: (dya),
D. sechellia product: (DSE),
D. erecta product: (Der), og
D. simulans
(DSi). Dya3c og Dya3n indikere 5 «og 3» regioner av gjentatt tre, henholdsvis.
Disse aminosyre oversettelser fra de publiserte genomsekvenser av
Drosophila melanogaster plakater (DMEL),
D. Yakuba product: (dya),
D. sechellia product: (DSE),
D. erecta
, og
D. simulans
(DSi) er justert og fargekodet for å markere likheter mellom dem. D. Yakuba gjenta 3 (Dya3) er delt inn i to halvdeler som ser ut til gruppen som følger, 3 «ende med 1ste gjentar og 5» enden med 3dje gjentas.
D. Yakuba
homolog av
dmbrca2
i den publiserte genomsekvensen inneholder 5 BRC gjentar [18]; men når vi visualisert de amplifiserte PCR produktene i denne repeterende regionen i 43
D. Yakuba
og 18
D. santomea
stammer, fant vi to meget forskjellige store band. Jo større produkt, observert hos 57 av de 61 stammene, korresponderte med den forventede størrelse for 5 BRC gjentas. Derfor er det fem-repeat skjema observert i den publiserte genomsekvens ikke løst innen naturlige populasjoner. Dette gjentar nummeret variasjon ble bekreftet ved sekvense 11 av de lange stammer og alle 4 av de korte former, som viser at lange skjemaer besatt de forventede 5 forskjellige BRC gjentar mens de korte stammer besatt bare 3.
Vi justerte spådd aminosyresekvenser, sammenlignet dem med individuelle publiserte genom repetisjoner (og spesielt aminosyrer som dukket opp «diagnostisk» med hensyn til Dya2 og Dya4), og oppdaget hva synes å være flere kortformer.
D. Yakuba
belastning Cascade 21 og
D. santomea
belastning LAGO 1482 har hver 3 totalt gjentar, som inkluderer en
st og 3
rd gjentar som ligner den fulle 1
st og 5
th gjentakelser av den publiserte
D . Yakuba
genomsekvens. Sin 2
nd gjenta, men begynner ved likner den 2
nd genom gjentatt basert på en diagnostisk aminosyren og nærvær av en 18 aminosyre region spesifikke for Dya2-but brytere halvveis inne i å ligne Dya4 basert på fire diagnostiske aminosyrer (se figur 5).
D. Yakuba
belastning Cascade 24 og
D. santomea
belastning STO 7 har også bare tre repetisjoner, men mye mer av deres andre gjenta ligner Dya4, inkludert 18 aminosyre trunkering (figur 5). Denne forskjellen tyder på at minst en avkutting hendelsen førte til utseendet på en ny form med tre BRC repeats- og disse kortformer kan være uavhengige slettinger fra en lang, fem gjenta form.
Disse aminosyre oversettelser fra Dya2, Dya4,
D. Yakuba
stammer Cascade24 og Cascade 21,
D. santomea
stammer STO7 og LAGO1482, Der og DME. Stjernene over justeringen viser områder som har forskjellene mellom de publiserte genomsekvenser Dya2 og Dya4, men er ikke løst blant de sekvenserte 5-gjenta stammer av
D. Yakuba
(noe som tyder på at de ikke er «diagnostisk»).
Denne observasjonen av homoplasious 3 gjenta allel skjemaer reiser spørsmålet om hvorvidt den tilsynelatende stabiliteten av denne formen i
D. melanogaster
gruppe skjuler skjulte utvidelser og sammentrekninger i gjenta nummer. For å teste denne hypotesen, vi nøye undersøkt den publiserte
dmbrca2
sekvens av
D. erecta plakater (som dessverre ikke har andre stammer tilgjengelig for direkte sekvensering).
D. erecta
2
nd BRC gjenta aminosyresekvens lignet deler av
D. Yakuba
2
nd og 4
th BRC gjentar i en måte som er forenlig med det å være avledet fra en sletting av en fem-repeat form (se figur 5). Nærmere bestemt bærer det de 18 aminosyrene som er til stede i Dya2 men ikke Dya4, men har tre aminosyrene av diagnostiske Dya4 ved sin 3 «ende. Derfor, i motsetning til den fylogenetiske hypotesen i figur 4,
D. erecta
3-repeat form kan ha kommet sekundært fra en anen 5-repeat form.
dmbrca2
sekvens av
D. melanogaster
viser også et potensielt lignende mønster (figur 5), men konklusjonene er vanskeligere på grunn av mye større sekvens divergens og mulige flere evolusjonære endringer i sekvens per aminosyre.
For å teste for underskrift av naturlige markering på rikelig 5-repeat form, beregnet vi Tajima sin D i
D. Yakuba product: (D = -,68518) og
D. santomea product: (D = -,27805). Vi var ikke i stand til å beregne Tajima-er for den korte formen på grunn av sin svært lav frekvens blant våre prøver (og at noen av de korte alleler er heller ikke identisk-by-avstamning). Men sammenlignet vi 5-repeat skjemaets Tajima sin D-verdier i publiserte Tajima sin D-verdier fra
D. Yakuba
og
D. santomea
for andre loci ligger tilsvarende i områder med redusert krysset over [26], på grunn av plasseringen av
dmbrca2
nær telomere av kromosom 2 og de kjente effektene av lave rekombinasjon frekvensen på nettstedet frekvensspektra [ ,,,0],30]. De observerte verdier for
dmbrca2
var godt innenfor rekkevidden av disse andre publiserte verdier (
D Yakuba product::.. Gjennomsnitt = -0,34, rekkevidde -1.03-1.05;
D santomea
: gjennomsnitt = -0,29, rekkevidde -1.27-1.03), derav slik at vi kan utelukke atypiske seleksjonstrykk på denne locus
Vi konkluderer med at den evolusjonære historien til
dmbrca2
i
D. Yakuba
, og kanskje i andre
Drosophila melanogaster
undergruppe arter, er mer komplisert enn kan antas fra undersøkelse av enkelt publiserte genomsekvenser per art, og vi advarer mot å karakterisere hele arter eller evolusjonære prosesser fra en slik begrensede data (for eksempel [13]). Vi presenterer en modell for en gammel ekspansjon i
dmbrca2
BRC gjenta nummer i
D. Yakuba product: (se figur 4) og foreslår at observert kortere alleler innen
D. Yakuba
,
D. santomea
, og kanskje
D. erecta Hotell og andre arter oppsto fra sammentrekninger av en anen lang form, produserer homoplasious alleler. Slike utvidelser og sammentrekninger ville være i samsvar med modeller av utviklingen av tandem repeterte sekvenser, slik som mikrosatellitter (f.eks [31]). Vår konklusjon er foreløpig, men siden vi ikke er i stand til å vurdere rollen som mulig intragenic genet konvertering mellom repetisjoner (dvs. konvergent evolusjon) kompliserer våre slutninger – disse prosessene er vanskelig å fullt skille (f.eks [32])
.
Selv om testing for den nøyaktige mekanismen av de foreslåtte historiske økning og reduksjon i BRC gjenta nummeret er utenfor omfanget av denne artikkelen, hevder vi at funnene fra befolkningen genetiske og fylogenetiske analyser av Drosophila arter [18], løse et interessant fenomen rundt en viktig funksjon i et gen relevant for menneskers helse. I det minste en BRC gjenta er tilstede i hver organisme hvor homologen er blitt oppdaget, og de synes å være absolutt nødvendig for formidling av interaksjonen med RAD51. Man kunne hypoteser om at naturlig utvalg kan favorisere en økning i antall repetisjoner, siden flere repetisjoner ville tillate tettere samspill mellom disse to proteiner viktig for DNA dobbel tråd pause reparasjon; imidlertid, kan valget for lengre lene bare strekker seg opp til et visst punkt, ettersom Gudmundsdottir og Ashworth [2] funnet at overuttrykker en enkelt BRC gjenta i pattedyrceller faktisk forstyrrer RAD51 filamentdannelsen og oppløser forhåndsmonterte filamenter for derved å skape en BRCA2-mangel fenotype. Det utholdenhet av flere kortere former for
dmbrca2
i populasjoner av
D. Yakuba
og
D. santomea
argumentere mot konsistent og sterk retningsvalg for lengre alleler. En spennende mulighet til å utforske er om variasjon i
dmbrca2
BRC gjenta nummer er ledsaget av tilsvarende endringer i
Rad51
sekvens. Den fortsatte etterforskning av mønstrene av BRC gjenta økning og reduksjon vil tillate ytterligere opplysning av en dårlig forstått mekanismen som regulerer kreft mottakelighet, et viktig spørsmål i medisin i dag.
Takk
Forfatterne takker L . Bukovnik (IGSP sekvense center) for teknisk assistanse, J. Coyne for Drosophila stammer, VL Roth og L. Stevison for hjelp med tall, og C. Smukowski, S. McDermott, R. Varney, og to anonyme anmeldere for nyttige kommentarer til manuskriptet.