PLoS ONE: Slip-Sliding Away: Serie Endringer og Homoplasy i Gjenta nummer i Drosophila Yakuba homolog of Human Cancer Følsomhet Gene BRCA2

Abstract

Flere nyere studier har undersøkt funksjon og utviklingen av et Drosophila homolog til den menneskelige brystkreft mottakelighet genet

BRCA2

, heter

dmbrca2

. Vi har tidligere identifisert hva som syntes å være en siste utvidelsen i RAD51-bindende BRC-repeat array i stamfar

Drosophila Yakuba

. I denne studien undersøker mønstre av variasjon og utviklingen av

dmbrca2

BRC-repeat utvalg innen

D. Yakuba

og dets nære slektninger. Vi utvikler en modell for hvordan ulik krysset over kan ha produsert utvidet form, men vi også observere korte gjentatte former, typisk for andre arter i

D. melanogaster

gruppe, segregerende innenfor

D. Yakuba

og

D. santomea

. Disse kortformer ser ikke ut til å være identisk-by-avstamning, noe som tyder på at historien til

dmbrca2

i

D. melanogaster

undergruppe har involvert gjenta enhets sammentrekninger fører til homoplasious former. Vi konkluderer med at den evolusjonære historien til

dmbrca2

i

D. Yakuba

og kanskje i andre Drosophila arter kan være mer komplisert enn det som kan utledes fra undersøkelse av de publiserte enkeltgenomsekvenser per art

Citation. Bennett SM, Mercer JM, Noor MAF (2010) skli Sliding Away: serie~~POS=TRUNC endringer og Homoplasy i Gjenta nummer i

Drosophila Yakuba

homolog of human Cancer Følsomhet Gene

BRCA2

. PLoS ONE 5 (6): e11006. doi: 10,1371 /journal.pone.0011006

Redaktør: William J. Murphy, Texas A M-universitetet USA

mottatt: 20 april 2010; Godkjent: 17 mai 2010; Publisert: 08.06.2010

Copyright: © 2010 Bennett et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Funding var levert av National Science Foundation utmerkelser 0509780 og 0715484, og National Institutes of Health utmerkelser GM076051 og GM086445. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Den menneskelige brystkreft mottakelighet genet

BRCA2

koder for et protein mye studert på grunn av sin betydning i DNA-reparasjon [1] – [3]. Mutasjoner i menneskelig kimcellelinje

BRCA2

føre til en levetid økt mottakelighet for brystkreft og eggstokkreft [4], [5], kanskje som følge av ineffektiv reparasjon av DNA-dobbelttrådbrudd (DSB sin) i løpet av homolog rekombinasjon [6] – [8]. I funksjonelle studier,

BRCA2

har vist seg å regulere RAD51 recombinase, en viktig nucleoprotein filament som festes til skadet, enkelttrådet DNA på stedet av DSB sin og er avgjørende for oppstart av reparasjonsprosessen [9]. BRCA2 binder seg til RAD51 av foreningen med sekvensmotiver, kalt «BRC gjentar» [10], [11], som hver består av ca 30 aminosyrer og finnes i en svært konservert område av

BRCA2

genet. Disse konserverte gjentar har vært nyttig for å identifisere

BRCA2

homologer tvers av mange eukaryote arter inkludert,

Arabidopsis thaliana

,

Caenorhabditis elegans

,

Drosophila melanogaster

, og

Trypanosoma brucei product: [12], [13]. Forskere fortsatt sliter med å finne ut hvor

BRCA2

koordinerer sin RAD51 og ssDNA-bindende aktiviteter for å lette overføringen av RAD51 protein på DNA (men se [14]), men Pellegrini og Venkitaraman [9] foreslått at «primitive organismer skjuler en enklere versjon av

BRCA2

protein vil gi nyttige modellsystemer. «

en putatively enklere

BRCA2

homolog ble identifisert i modellorganisme

Drosophila melanogaster

bruker sekvens fingeravtrykk som representerer viktige rester for

BRCA2-RAD51

interaksjoner i locus

CG30169

, senere kalt «

dmbrca2

» [15]. Funksjonelle studier av denne Drosophila genet har vist at den kommuniserer med

D. melanogaster Rad51 product: (

spnA

), og dens avbrudd påvirker utbredelsen av mitotisk og meiotisk DNA-reparasjon og homolog rekombinasjon [15] – [17], som fører Kløvstad

et. al.

[16] for å konkludere med at Drosophila

BRCA2

representerer en funksjonell homolog av genet som kan brukes til å karakterisere den humane motstykke. I motsetning til pattedyr

BRCA, 2

som har åtte BRC gjentar,

D. melanogaster

homolog ble funnet å inneholde tre gjentakelser [13]. En senere undersøkelse av dette genet over de publiserte Drosophila genomer viste stor variasjon i antall BRC repetisjoner, med

D. melanogaster

og dens undergruppe som har tre repetisjoner (figur 1), mens andre, mer fjernt beslektede arter som

D. pseudoobscura Hotell og

D. persimilis

bærer opptil elleve gjentar [18]. Denne variasjonen i antall BRC repetisjoner ble også demonstrert innen enkelte arter i tillegg; ti utvalgte stammer av

D. pseudoobscura

ble funnet å ha syv, ni eller elleve BRC repetisjoner, kanskje indikerer siste utviklingen innen dette genet [18].

Dette treet viser antall «BRC» gjentar fra den publiserte genomsekvens for hver arter i slekten Drosophila. Den blå boksen streker melanogaster gruppen, som har et mønster av tilsynelatende stabilitet i gjenta nummeret.

Selv om det er stor variasjon i repeat nummer over fylogeni av Drosophila, synes denne varianten for å være fraværende i melanogaster gruppe, der de artene som har publisert genomsekvenser alle inneholder 3 BRC gjentas. Unntaket fra dette mønsteret i melanogaster gruppen er

D. Yakuba

, som publiserte genomsekvens av

dmbrca2

bærer fem BRC gjentas. Observasjon av denne alternative gjenta skjemaet reiser flere spørsmål: er dette høyere gjenta nummer ekte eller en genom mis-montering artefakt [19]? Hvis det er ekte, er dette høyere gjenta tallform utbredt over hele

D. Yakuba

stammer, eller er en kortere skjema til stede i naturlige populasjoner? Kan vi utlede den historiske endringen i antall repetisjoner ved å analysere nukleotidsekvens? Og til slutt, hvis det er alternative former, kan vi oppdage bevis for tilhørende naturlig utvalg i spredningen av det store antallet gjenta skjemaet? I denne studien undersøker vi sekvensen og utviklingen av antall BRC gjentar i Drosophila homolog av

BRCA2

i

D. Yakuba

og dets søsterarter

D. santomea Hotell og plassere den i en evolusjonær sammenheng. Forstå mønstre observert hos disse artene kan tillate oss å bli bedre kjent med de genetiske prosessene som påvirker dette genet som er viktig for den grunnleggende prosessen med rekombinasjon og helse mer generelt.

Materialer og metoder

Drosophila

Aksjer

Drosophila Yakuba Hotell og

D. santomea

bestander anvendt i denne studien ble oppnådd fra Dr. Jerry Coyne [20]. Fluene ble bevart i absolutt etanol til DNA ble ekstrahert i vårt laboratorium.

DNA, PCR Amplification og sekvense

Genomisk DNA ble isolert fra voksne i

D. Yakuba

og

D. santomea

med en enkel flue squish protokollen [21]. Primere for PCR amplifisering ble utformet fra den publiserte

D. Yakuba

genomsekvens montering [22]. Primerne er utformet fra

dmbrca2

regionen ble brukt til PCR forsterke segmenter av genet i 25 mL reaksjonsvolumer. Størrelser av PCR-produktene ble bekreftet ved elektroforese på en 1% agarosegel. PCR-produkter ble renset ved hjelp ExoSAP-It (USB Corp) og sekvensert ved hjelp av ABI BigDye ved Duke University IGSP sekvense anlegget. Sekvensene ble deponert i GenBank /EMBL databaser under deponeringsnummer HM146151-HM146174.

Data Analyser

DNA-sekvenser ble justert beregnings hjelp BioEdit 7.0.9 [23], og deretter modifisert ved manuell justering . DNAsp [24] ble brukt til å estimere nucleotide mangfold (pi) og Tajima er D [25], for

dmbrca2

regionen. Vi oppnådde verdiene av Tajima sin D for lignende loci i

D. Yakuba

og

D. santomea

fra Llopart

et. al. product: [26] for sammenligning.

Vi undersøkte sekvensert regionene for hver stamme og sammenlignet dem med full samlet sekvens i denne regionen fra den publiserte

D. Yakuba

genom [22]. I den publiserte genomet regionen, vi kategorisert i fem distinkte BRC gjentar seg ved hjelp av diagnostiske aminosyrer og størrelsesforskjeller, nummerert numerisk 1 til 5 fra 5′-enden [18]. Vi oversatte DNA-sekvensen av eksoner av våre stammenes sekvenser og manuelt forhold hver enkelt gjenta til de nummererte genom gjentar hjelp av diagnose aminosyrer og størrelsesforskjeller.

fylogenetisk analyse ble utført med PAUP * 4.0b10 [27 ]. BRCA2 gjentatte motiver for

D. melanogaster product: (DME),

D. sechellia product: (DSE),

D. simulans

(DSi),

D. erecta product: (Der), og

D. Yakuba product: (dya) ble hentet fra FlyBase referanse genomer, og kombinert med

D. santomea product: (DSA) og ekstra

D. Yakuba

sekvenser samlet inn for dette arbeidet.

D. Yakuba

ble anvendt som en standard for nummerering av gjentatte motiver: 1-5 fra amino-ende til karboksyl-enden av peptidet.

D. persimilis

gjenta 2 (Dpe2) ble brukt som en utgruppe. Sekvenssammenstillinger ble gjort i Seaview versjon 4.0 [28] med ytterligere justeringer av øyet. Sekvensmotiver ble avgrenset av den 35 aminosyre lang Pfam skjult Markov modell (HMM) for BRCA2 gjentar [29]. På grunn av den korte sekvensen lengde og beskjedne nivåer av sekvensvariasjon, nabo-sammenføyning med korrigert p-avstander ble valgt for tre estimering.

Diskusjon

Før fylogenetisk analyse av publiserte

Resultater og

D. melanogaster

undergruppe genomsekvenser for gjentakelser avdekket to store clades: alle partalls gjentar og alle oddetalls gjentar [18].

D. Yakuba

gjenta 3 (Dya3) tilhørte den oddetalls clade men var uvanlig i ikke clustering med enten første eller tredje gjentar, men i stedet rester basal til begge (se figur 2). Visuell undersøkelse av aminosyre- og nukleotidsekvenser viste at 3′-enden av Dya3 boringen sterk sekvenslikhet med Dme1 og der1, mens 5′-enden besatt noen diagnostiske aminosyrer som lignet Dme3 og Der3 (figur 3). Denne observasjonen tyder på at en ulik-krysset over hendelsen (figur 4) kan ha oppstått mellom gjenta en og gjenta tre gir opphav til en gjentakelse utvidelse fra en anen av tre BRC gjentar til en avledet tilstand av 5 repetisjoner historisk i

D . Yakuba

avstamning. Selv om Dya2 og Dya4 gjentar klynge fylogenetisk, 17% aminosyresekvensidentitet divergens og 18 aminosyre gap i den publiserte genomsekvens av Dya4 forhold til Dya2, indikere at en slik hendelse, hvis det forekom i det hele tatt, ikke forekommer i meget siste tiden.

Sekvenser som inngår er hentet fra

Drosophila melanogaster plakater (DME),

D. Yakuba product: (dya),

D. sechellia product: (DSE),

D. erecta product: (Der), og

D. simulans

(DSi). Dya3c og Dya3n indikere 5 «og 3» regioner av gjentatt tre, henholdsvis.

Disse aminosyre oversettelser fra de publiserte genomsekvenser av

Drosophila melanogaster plakater (DMEL),

D. Yakuba product: (dya),

D. sechellia product: (DSE),

D. erecta

, og

D. simulans

(DSi) er justert og fargekodet for å markere likheter mellom dem. D. Yakuba gjenta 3 (Dya3) er delt inn i to halvdeler som ser ut til gruppen som følger, 3 «ende med 1ste gjentar og 5» enden med 3dje gjentas.

D. Yakuba

homolog av

dmbrca2

i den publiserte genomsekvensen inneholder 5 BRC gjentar [18]; men når vi visualisert de amplifiserte PCR produktene i denne repeterende regionen i 43

D. Yakuba

og 18

D. santomea

stammer, fant vi to meget forskjellige store band. Jo større produkt, observert hos 57 av de 61 stammene, korresponderte med den forventede størrelse for 5 BRC gjentas. Derfor er det fem-repeat skjema observert i den publiserte genomsekvens ikke løst innen naturlige populasjoner. Dette gjentar nummeret variasjon ble bekreftet ved sekvense 11 av de lange stammer og alle 4 av de korte former, som viser at lange skjemaer besatt de forventede 5 forskjellige BRC gjentar mens de korte stammer besatt bare 3.

Vi justerte spådd aminosyresekvenser, sammenlignet dem med individuelle publiserte genom repetisjoner (og spesielt aminosyrer som dukket opp «diagnostisk» med hensyn til Dya2 og Dya4), og oppdaget hva synes å være flere kortformer.

D. Yakuba

belastning Cascade 21 og

D. santomea

belastning LAGO 1482 har hver 3 totalt gjentar, som inkluderer en

st og 3

rd gjentar som ligner den fulle 1

st og 5

th gjentakelser av den publiserte

D . Yakuba

genomsekvens. Sin 2

nd gjenta, men begynner ved likner den 2

nd genom gjentatt basert på en diagnostisk aminosyren og nærvær av en 18 aminosyre region spesifikke for Dya2-but brytere halvveis inne i å ligne Dya4 basert på fire diagnostiske aminosyrer (se figur 5).

D. Yakuba

belastning Cascade 24 og

D. santomea

belastning STO 7 har også bare tre repetisjoner, men mye mer av deres andre gjenta ligner Dya4, inkludert 18 aminosyre trunkering (figur 5). Denne forskjellen tyder på at minst en avkutting hendelsen førte til utseendet på en ny form med tre BRC repeats- og disse kortformer kan være uavhengige slettinger fra en lang, fem gjenta form.

Disse aminosyre oversettelser fra Dya2, Dya4,

D. Yakuba

stammer Cascade24 og Cascade 21,

D. santomea

stammer STO7 og LAGO1482, Der og DME. Stjernene over justeringen viser områder som har forskjellene mellom de publiserte genomsekvenser Dya2 og Dya4, men er ikke løst blant de sekvenserte 5-gjenta stammer av

D. Yakuba

(noe som tyder på at de ikke er «diagnostisk»).

Denne observasjonen av homoplasious 3 gjenta allel skjemaer reiser spørsmålet om hvorvidt den tilsynelatende stabiliteten av denne formen i

D. melanogaster

gruppe skjuler skjulte utvidelser og sammentrekninger i gjenta nummer. For å teste denne hypotesen, vi nøye undersøkt den publiserte

dmbrca2

sekvens av

D. erecta plakater (som dessverre ikke har andre stammer tilgjengelig for direkte sekvensering).

D. erecta

2

nd BRC gjenta aminosyresekvens lignet deler av

D. Yakuba

2

nd og 4

th BRC gjentar i en måte som er forenlig med det å være avledet fra en sletting av en fem-repeat form (se figur 5). Nærmere bestemt bærer det de 18 aminosyrene som er til stede i Dya2 men ikke Dya4, men har tre aminosyrene av diagnostiske Dya4 ved sin 3 «ende. Derfor, i motsetning til den fylogenetiske hypotesen i figur 4,

D. erecta

3-repeat form kan ha kommet sekundært fra en anen 5-repeat form.

dmbrca2

sekvens av

D. melanogaster

viser også et potensielt lignende mønster (figur 5), men konklusjonene er vanskeligere på grunn av mye større sekvens divergens og mulige flere evolusjonære endringer i sekvens per aminosyre.

For å teste for underskrift av naturlige markering på rikelig 5-repeat form, beregnet vi Tajima sin D i

D. Yakuba product: (D = -,68518) og

D. santomea product: (D = -,27805). Vi var ikke i stand til å beregne Tajima-er for den korte formen på grunn av sin svært lav frekvens blant våre prøver (og at noen av de korte alleler er heller ikke identisk-by-avstamning). Men sammenlignet vi 5-repeat skjemaets Tajima sin D-verdier i publiserte Tajima sin D-verdier fra

D. Yakuba

og

D. santomea

for andre loci ligger tilsvarende i områder med redusert krysset over [26], på grunn av plasseringen av

dmbrca2

nær telomere av kromosom 2 og de kjente effektene av lave rekombinasjon frekvensen på nettstedet frekvensspektra [ ,,,0],30]. De observerte verdier for

dmbrca2

var godt innenfor rekkevidden av disse andre publiserte verdier (

D Yakuba product::.. Gjennomsnitt = -0,34, rekkevidde -1.03-1.05;

D santomea

: gjennomsnitt = -0,29, rekkevidde -1.27-1.03), derav slik at vi kan utelukke atypiske seleksjonstrykk på denne locus

Vi konkluderer med at den evolusjonære historien til

dmbrca2

i

D. Yakuba

, og kanskje i andre

Drosophila melanogaster

undergruppe arter, er mer komplisert enn kan antas fra undersøkelse av enkelt publiserte genomsekvenser per art, og vi advarer mot å karakterisere hele arter eller evolusjonære prosesser fra en slik begrensede data (for eksempel [13]). Vi presenterer en modell for en gammel ekspansjon i

dmbrca2

BRC gjenta nummer i

D. Yakuba product: (se figur 4) og foreslår at observert kortere alleler innen

D. Yakuba

,

D. santomea

, og kanskje

D. erecta Hotell og andre arter oppsto fra sammentrekninger av en anen lang form, produserer homoplasious alleler. Slike utvidelser og sammentrekninger ville være i samsvar med modeller av utviklingen av tandem repeterte sekvenser, slik som mikrosatellitter (f.eks [31]). Vår konklusjon er foreløpig, men siden vi ikke er i stand til å vurdere rollen som mulig intragenic genet konvertering mellom repetisjoner (dvs. konvergent evolusjon) kompliserer våre slutninger – disse prosessene er vanskelig å fullt skille (f.eks [32])

.

Selv om testing for den nøyaktige mekanismen av de foreslåtte historiske økning og reduksjon i BRC gjenta nummeret er utenfor omfanget av denne artikkelen, hevder vi at funnene fra befolkningen genetiske og fylogenetiske analyser av Drosophila arter [18], løse et interessant fenomen rundt en viktig funksjon i et gen relevant for menneskers helse. I det minste en BRC gjenta er tilstede i hver organisme hvor homologen er blitt oppdaget, og de synes å være absolutt nødvendig for formidling av interaksjonen med RAD51. Man kunne hypoteser om at naturlig utvalg kan favorisere en økning i antall repetisjoner, siden flere repetisjoner ville tillate tettere samspill mellom disse to proteiner viktig for DNA dobbel tråd pause reparasjon; imidlertid, kan valget for lengre lene bare strekker seg opp til et visst punkt, ettersom Gudmundsdottir og Ashworth [2] funnet at overuttrykker en enkelt BRC gjenta i pattedyrceller faktisk forstyrrer RAD51 filamentdannelsen og oppløser forhåndsmonterte filamenter for derved å skape en BRCA2-mangel fenotype. Det utholdenhet av flere kortere former for

dmbrca2

i populasjoner av

D. Yakuba

og

D. santomea

argumentere mot konsistent og sterk retningsvalg for lengre alleler. En spennende mulighet til å utforske er om variasjon i

dmbrca2

BRC gjenta nummer er ledsaget av tilsvarende endringer i

Rad51

sekvens. Den fortsatte etterforskning av mønstrene av BRC gjenta økning og reduksjon vil tillate ytterligere opplysning av en dårlig forstått mekanismen som regulerer kreft mottakelighet, et viktig spørsmål i medisin i dag.

Takk

Forfatterne takker L . Bukovnik (IGSP sekvense center) for teknisk assistanse, J. Coyne for Drosophila stammer, VL Roth og L. Stevison for hjelp med tall, og C. Smukowski, S. McDermott, R. Varney, og to anonyme anmeldere for nyttige kommentarer til manuskriptet.

Legg att eit svar