PLoS ONE: evolusjonære historien til Kreft immunitet Antigen MAGE Gene Family

Abstract

Den evolusjonære modusen for en multi-genet familien kan endres over tid, avhengig av funksjonell differensiering og lokal genomisk miljø av familiemedlemmer. I denne studien viser vi en slik endring i melanom antigen (

MAGE

) genet familie på pattedyrs X-kromosomet.

MAGE

genet familie består av ti underfamilier som kan kategoriseres i to typer. Type I genene er av relativt ny opprinnelse, og de koder epitoper for human leukocytt antigen (HLA) i kreftceller. Type II-gener er relativt gammel, og noen av deres produkter er kjent for å være involvert i apoptose eller celleproliferasjon. Den evolusjonære historien til

MAGE

genet familien kan deles inn i fire faser. I fase I, en løssalgs tilstand av en nedarvet genet og evolusjonært konserverte modus hadde varte til fremveksten av eutherian pattedyr. I fase II, åtte underfamilien forfedre, med unntak for

MAGE-C Hotell og

MAGE-D

underfamilier, ble dannet via retrotransposition uavhengig. Dette vil falle sammen med en innarbeiding utbrudd av

LINE

elementer på eutherian stråling. Men

MAGE-C

ble generert av genet duplisering av

MAGE-A

. Fase III er preget av omfattende genduplikasjon innenfor hver underfamilien og spesielt dannelsen av palindromes i

MAGE-A

underfamilien, som skjedde i en stamfar til østaper. Fase IV er kjennetegnet ved nedbrytning av en palindrom i de fleste østaper, med unntak av mennesker. Selv om palindrome avkortes ved hyppige slettinger i aper og dyreaper, er det beholdt hos mennesker. Her argumenterer vi for at denne menneskelige spesifikke oppbevaring stammer fra negativ seleksjon virker på

MAGE-A

gener som koder for epitoper av kreftceller, som bevarer sin evne til å binde seg til svært divergerende HLA molekyler. Disse funnene er tolket med hensyn til de biologiske faktorer forme siste menneskelige

MAGE-A

gener

Citation. Katsura Y, Satta Y (2011) evolusjonære historien til Kreft immunitet Antigen

MAGE

Gene Family. PLoS ONE seks (6): e20365. doi: 10,1371 /journal.pone.0020365

Redaktør: Nikolas Nikolaidis, California statsuniversitet Fullerton, USA

mottatt: 14 februar 2011; Godkjent: 18 april 2011; Publisert: 10 juni 2011

Copyright: © 2011 Katsura, Satta. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av en Grant-in Aid for Scientific Research på Prioriterte områder (17018032). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

den evolusjonære modus av et gen familie, nemlig prosessen med fødsel og død av gener og omfang av sekvens divergens, avhenger av den funksjonelle divergens av duplisert gener og på den lokale strukturen av genomet hvor familien bor [1], [2]. Her, lokal struktur av genomet refererer til tandem eller inverterte repetisjoner (IRS). Utviklingen av en genfamilien på IR kan være spesielt komplisert som følge av homogenisering ved hyppig gen omdannelse og strukturell ustabilitet, for eksempel på grunn av hyppige innsettinger og /eller delesjoner.

Warburton et al. (2004) fant en overvekt av store, IR med en høy grad av likhet mellom repetisjoner på X og Y-kromosomer (~ 30% av IR i det menneskelige genom er på X- og Y-kromosomer) [3]. Mange IR på X og Y inneholder gener uttrykt overveiende i testiklene [3]. Warburton og hans kolleger foreslo at disse IR spiller en viktig rolle i menneskets genom evolusjon. Imidlertid har den nøyaktige rolle av IR i evolusjonen forble uklart. Derfor, i denne studien, forsøker vi å undersøke tempo og modus for genet familie evolusjon i IR, med et spesifikt fokus på melanom antigen (

MAGE

) genet familie, der medlemmene er plassert på en stor ( ~ 100 kb) palindrom på menneske X-kromosomet.

MAGE

ble opprinnelig identifisert som «en melanom antigen» og senere

MAGE Hotell og dets homologer ble oppdaget å danne en multi-genfamilien i eutherian genomer [4] – [7].

MAGE

homologe sekvenser har blitt funnet i noen virveldyr (sebrafisk og kylling) [8], [9] og virvelløse dyr (bananflue) [10]. I det humane genom, er denne familien består av 10 underfamilier, og hver underfamilie består av en til 15 gener [7]. I tillegg til klassifisering av underfamilien,

MAGE

gener kan også deles inn i type I eller type II, basert på deres uttrykk mønstre og funksjon. Type I genene er sammensatt av tre underfamilier (

MAGE-A

, til –

C

) og type II gener av syv underfamilier (

MAGE-D

til –

F

, –

H

, –

L2

,

NDN

,

NDNL2

). Type I-genene blir uttrykt i meget prolifererende celler, slik som svulster, placenta og bakterie linjeceller [4]. Type II-gener, derimot, er allestedsnærværende uttrykt i somatiske celler, og noen type II-gener er kjent for å være involvert i apoptose eller celle proliferasjon [11].

Alle type I

MAGE-gener

ligger på X-kromosomet og kode tumorantigener som spiller en nøkkelrolle i kreft immunitet. Peptider i humane MAGE homologi domene (MHD), som er 160-170 aminosyrer lang, er epitoper av human leukocytt antigen (HLA) klasse I-molekyler [4]. Når den antigen (peptid i MHD) på en tumorcelle binder til en reseptor på en killer T-celle, T-celleangrep på tumorcelle [4], [12].

HLA

er svært polymorfe i det menneskelige genom og annerledes

HLA

alleler kan binde forskjellige epitoper [13], [14].

MAGE

gener kan kode for mange epitoper for derved å binde til, eller reagere med, hver HLA-molekyl. Dermed er det av interesse å spore opprinnelsen til sammenhengen mellom

HLA Hotell og

MAGE

samt å bestemme hvordan det genetiske mangfoldet i epitop-kodende region har utviklet seg og blitt opprettholdt.

Mange

MAGE

gener antas å være pattedyr spesifikke [7]. I tillegg har de fleste eutherian

MAGE

gener har en enkelt ekson å kode et protein og derfor er de sannsynligvis til å ha kommet fra retrotransposition av

MAGE-D product: [7], fordi bare

MAGE-D

underfamilie medlemmer har 14 eksoner hvor en ORF er kodet mellom andre til 12. eksoner [15]. Likevel forblir forholdet mellom type I og type II gener er ikke ferdig etterforsket, og modusen for spredning av disse genene uklart.

I denne studien undersøker vi den evolusjonære historien til

MAGE

genet familien. Først søkte vi etter de fordums sin retning

MAGE

gener i virveldyr og virvelløse genomer. For det andre, undersøkte vi hvordan og når forfedrene hvert tre type I og syv type II underfamilier ble generert med spesiell referanse til deres modus for forsterkning. For det tredje har vi fokus på

MAGE Anmeldelser –

A

familien (en av de type I underfamilier) og vise hvordan genomet ordningen har oppstått hos primater. Til slutt viser vi at noen menneskelig

MAGE Anmeldelser –

En

gener har gjennomgått negativ seleksjon mot homogenisering av genet konvertering for å beholde sine genetiske variasjoner blant aminosyresekvenser. Vi foreslår at dette valget er knyttet til vedlikehold av en rekke HLA-epitoper i kreftceller.

Materialer og metoder

Sekvenser brukes

Menneske (

Homo sapiens

) nukleotid sekvens data og tilsvarende genet informasjon ble hentet fra NCBI databasen (bygge 36,3; https://www.ncbi.nlm.nih.gov/). Syntenic eller homologe genomiske sekvenser fra andre primater og pattedyr, inkludert opossums (

Monodelphis domestica

) og platypuses (

Ornithorhynchus anatinus

), ble hentet fra NCBI og Ensembl databaser (http: //uswest .ensembl.org /index.html). For å finne bevart synteny mellom det menneskelige X-kromosom og kromosomer i andre dyr, analyser BLAST bruker menneskelige

MAGE

gener som spørringer ble utført. Å identifisere homologe sekvenser, bruker vi 70% som en cut-off verdi for BLAST søk.

Identifikasjon av genomisk strukturer

Identifikasjon av skattemyndighetene og tandem repetisjoner ble utført ved bruk av en matrise tilnærming [ ,,,0],16]. GenomeMatcher [17] ble deretter anvendt for å oppnå detaljert informasjon om nukleotid-sekvenslikhet mellom like enheter. Et diagram trukket av dette programmet viser graden av likhet mellom sekvenser med fargekoder, med rød representerer likheten større enn 95%, appelsin som representerer ca. 90% -95%, grønn som representerer ca. 85% -90%, og blå representerer lavere enn 85 %.

fylogenetisk og molekylær evolusjonær analyser

For å studere fylogenetiske relasjoner mellom

MAGE

familiemedlemmer, 158 kodende sekvenser (CDS) i den menneskelige, sjimpanse (

Pan troglodytes

), macaque (

Macaca mulatta

), mus (

mus musculus

), ku (

Bos taurus

), hund (

Canis lupus

), opossum, nebbdyr, kylling (

Gallus gallus

) og sebrafisk (

Danio rerio

) genom ble hentet fra NCBI databasen (tabell S1).

MAGE

homologer ble også søkt i Ensembl database av den vestlige afrikanske klorte frog (

Xenopus tropic

), lampreys (

Petromyzon marinus

), lancelets (

Branchiostoma floridae

), sekkedyr (

Ciona intestinalis

) og kråkeboller (

Strongylocentrotus purpuratus

). For hver av disse artene, vi søkte på

MAGE

homologer over hele genomer. I de søker etter homologer,

MAGE-D

underfamilie medlemmer ble brukt som en spørring, fordi

MAGE-D

er tenkt å være forfedrenes

MAGE

familien [7] . Når vi bruker andre menneskelige

MAGE

sekvenser som en spørring, fant vi at sekvenser oppdaget allerede var inkludert i resultatet oppnådd ved hjelp av

MAGE-D

.

I det menneskelige genom det var 37 kommenterte

MAGE

gener på X-kromosomet: 15

MAGE-A

s, 11

MAGE-B

s, tre

MAGE-C

s, fem

MAGE-D

s, to

MAGE-E

s og en

MAGE-H

. I tillegg er to

MAGE-F

s ligger på kromosom 3, og

necdin lignende to plakater (

NDNL2

eller

MAGE-G

)

MAGE-lignende to plakater (

MAGE-L2

) og

necdin product: (

NDN

) er på kromosom 15. i tillegg kommenterte gener, en homolog sekvens (

psMAGEA-like: psMAGEAL

, NC_000023: 2765558 ‥ 2770471) som tilsvarer den menneskelige

MAGE

pseudogen,

psMAGEA plakater (NC_000023: utfyllende 151952946 ‥ 151957859) ble identifisert. Gene forkortelser som brukes i denne studien følger standardene som brukes for menneskegener.

Sekvensene ble oppnådd ble justert ved hjelp Clustal W programvare [18] med manuelle korrigeringer. Sekvensene av menneskelig

MAGE-H

, –

A5

og mus –

A9

var kort. Disse ble forkastet fordi inkludering av disse sekvensene gjort en meningsfull sekvens innretting kort. Antall nukleotidforskjeller per område (

p

-Avstand) ble deretter beregnet ved anvendelse MEGA4 [19], og den fylogenien ble konstruert ved anvendelse av nabo-sammenføyning (NJ) [20] Fremgangsmåte tilgjengelig i denne programvaren. Phylogenies ble også konstruert med Randomized A (x) ccelerated Maximum Likelihood (RAxML) [21] og Bayesianske (Bayes) metoder. Et program for RAxML fremgangsmåte er tilveiebrakt ved https://phylobench.vital-it.ch/raxml-bb/og at det for Bayes metode er MrBayes 3 [22]. De justeringer som brukes her er tilgjengelig på forespørsel. DnaSP v5 [23] ble anvendt for vinduet analyse av nukleotid- divergens. RepeatMasker [24] ble benyttet for å undersøke sekvenser for ispedd gjentar i NCBI databasen. Et program, GENECONV [25] ble brukt til å påvise genet konvertering.

transkripsjon faktor bindingssteder

transkripsjon faktor bindingssteder (TFBs) ble undersøkt ved hjelp av TRANSFAC R4.3 databasen [26], tilgjengelig på TFBIND hjemmeside (http: //tfbind.ims.u-tokyo.acjp/) [27]. For å finne en kandidat TFB, ble sekvenser oppstrøms av målgener justert, og svært konserverte sekvenser ble valgt. Sekvensene ble sjekket for forekomst av TFBs kommentert i databasen.

Resultater

Hvor stammer virveldyr og pattedyr

MAGE

genet familie

For å identifisere

MAGE

homologer i lampreys, lancelets, kappedyr og kråkeboller, ble en BLAST søk utført for deres genom og EST sekvenser, ved hjelp av

MAGE-D

gener som spørringer. Selv om det var ingen påvisbare homologe gener i lampreys og kråkeboller, hypotetiske gener i begge kappedyr (XM_002119518) og lancelets (XM_002613563) viste 37% sekvenslikhet med den menneskelige

MAGE-D1

. Eksplosjonen søkeresultater indikerte at fremveksten av

MAGE

genet kunne ha skjedd før divergens av Protochordata fra Chrodata.

I Jawed virveldyr, sebrafisk genomet besitter en enkelt

MAGE

genet,

Necdin lignende to plakater (

DareNDNL2

) [8].

NDNL2

gener finnes også hos mennesker, mus og kyr, men eutherian

NDNL2s

behandles gener og har et enkelt ekson, mens

DareNDNL2

besitter ~11 eksoner. En fylogenetisk tre basert på aminosyresekvenser viser at eutherian

NDNL2

s er paraphyletic til

DareNDNL2 plakater (figur 1 og S1.):

DareNDNL2

er en «primær» ortolog av eutherian

MAGE

gener [28]. Dette fylogenetisk forhold (topologien av treet) er også støttet av RAxML og Bayes trær (data ikke vist).

CDS av 158

MAGE

gener ble brukt (se tabell S1). CDS forhold er 204 bp lang. Etter justering, ble alle åpninger ekskludert for tre konstruksjon. Subfamily klynger vises. Tallet på hver node er bootstrap verdi støtter node. Fisk

NDNL2 product: (

Dare NDNL2

) og pattedyr

NDNL2

er vist i blått. Artsnavnet forkortelser er som følger: Bota (

Bos taraus

), Capo (

Cavia porcellus

), Dare (

Danio rerio

), Gaga (

Gallus gallus

), Hosa (

Homo sapiens

), Mamu (

Macaca Mulatta

), Modo (

Monodelphis domestica

), Mumu (

Mus musculus

), Orna (

Ornithorhynchus anatinus

), og Patr (

Pan troglodytes

). Figur S1 er en forstørret versjon av dette tallet, og har leselig tekst.

Hver av frosk og kylling genomer besitter bare en

MAGE

genet. I begge tilfeller, når det gjelder forholdet til syntenic

DareNDNL2

, stillingen av genet på et kromosom kunne ikke bli bekreftet på grunn av den ufullstendige tildeling av gener på kromosomer i disse artene. Men gitt at fasene på hvert exon og intron grense i CDS av fisker, frosker og kyllinger var godt bevart (tabell 1), den eneste

MAGE

gener i frosken og kylling er sannsynlig å være en-til -on ortologer av

DareNDNL2

.

Selv om bare en enkelt

MAGE

ble funnet i fisk, frosker og høns, mennesker og mus har flere underfamilier av

MAGE

gener [7]. Dermed er det interessant å undersøke

MAGE

homologer i monotremes (nebbdyr) og pungdyr (opossum). En full-genom BLAST søk ved hjelp av menneskelig

MAGE-D1

som en spørring oppdaget en

MAGE

-lignende (

Magel

) sekvens i nebbdyr og to

Magel

s på pungrotte. Disse ble forsøksvis kalt henholdsvis

OrnaMAGEL Hotell og

ModoMAGEL1 Twitter /

L2

,. BLAST søker hjelp andre

MAGE

gener som

DareNDNL2

som en spørring resulterte i påvisning av de samme genene.

opossums

ModoMAGEL1 Hotell og

ModoMAGEL2

er lokalisert på kromosomer X og 8, respektivt.

ModoMAGEL2

er kodet av en enkelt ekson, mens

ModoMAGEL1

er kodet med 11 eksoner. Dermed

ModoMAGEL2

er sannsynlig å være en bearbeidet gen avledet fra

ModoMAGEL1

. Faktisk

ModoMAGEL1 Hotell og

ModoMAGEL2

danne en monofyletisk gruppe i treet (Fig. 1, fig. S1) og i trær konstruert av tre ulike metoder (NJ, RAxML og Bayes).

de platypuses

OrnaMAGEL

genet ligger på contig Ultra 403 og består av 10 eksoner. Selv om antallet eksoner er forskjellig fra den i

ModoMAGEL1

, fasene og størrelser av delte eksoner er godt bevart (tabell 1). Videre inneholder Ultra 403 også ubiquitin ligase genet

HUWE1 plakater (hect, UBA og WWE domene som inneholder en), som ligger ~600 kb oppstrøms fra

OrnaMAGEL

. En

in situ

hybridisering studien bekreftet at de nebbdyr,

HUWE1

ligger på kromosom 6 [29]; Dermed er det sannsynlig at dette contig er en del av kromosom 6. Platypus kromosom 6 er homolog med autosomal stamfar eutherian og pungdyr X-kromosomer [29]. Faktisk regionen rundt

OrnaMAGEL

på contig viste en syntenic forhold til den menneskelige Xp11 regionen. I det menneskelige genom, posisjonen som tilsvarer

OrnaMAGEL

er okkupert av

MAGE-D2 Hotell og –

D3 plakater (Fig. 2). Menneskelig

MAGE-D2 Hotell og –

D3

har 13 eksoner, og fasene og størrelser av felles eksoner er konservert med

OrnaMAGEL

, så vel som med

ModoMAGEL1 Hotell og annen

MAGE

gener i kylling, frosk og sebrafisk genomer (tabell 1).

Røde linjer indikerer

MAGE-D

eller

Magel

gener i menneske eller nebbdyr, henholdsvis. Svarte striper og gen navnene indikerer syntenic gener mellom mennesker og platypuses. Blå barer og genet navn indikerer gener som ikke viser synteny. Andre

MAGE-D

underfamilien medlemmer,

MAGE-D1 Hotell og

MAGE-D4

ligger på 51,6 m og 51,9 M på menneske X-kromosomet, henholdsvis.

Fylogeni av pattedyr

MAGE

genet familie

Et tre av menneskelig

MAGE

gener viser at tre type i

MAGE

underfamilier (

MAGE-A

, –

B Hotell og –

C

) danner en monophyletic klynge som er forskjellig fra de sju type II underfamilier (

MAGE- D

, –

E

, –

F

, –

H

, –

L2

,

NDN Hotell og

NDNL2

) (fig. 3). Bevisene er støttet av fem fylogenetisk informative erstatninger (D16Y, K23T, I62V, A113E og R156Q i en justering av MHD, fig. S3). I tillegg

MAGE-D

gener danner en monophyletic klynge. Selv om antallet av nukleotider anvendt i denne analysen er liten, er det klart at type I underfamilier avvek mer nylig enn type II-underfamilier (fig. 3 og S2 fig.).

Treet er basert på antall aminosyre forskjeller per område (

p

-distances). Gener men for

DareNDNL2

i treet er alle

MAGE

gener funnet i det menneskelige genom.

DareNDNL2

fra sebrafisk brukes til å finne roten av treet. Antallet nettsteder forhold er 92 aminosyrer uten mellomrom. Bootstrap verdi indikeres ved noden. Sekvenser er oppført i tabell S1.

MAGE-E

har duplisert MHD og duplisering har oppstått tidligere enn fremveksten av typen klammeren gener.

MAGEE1_1 product: (

MAGEE2_1

) og

MAGEE1_2 product: (

MAGEE2_2

) representerer MHD på N og C-terminalen siden av

MAGE-E1 product: (

MAGE-E2

), henholdsvis. Den eutherian

MAGE-D3

genet koder trophinin (TRO), som uttrykkes i morkaken og påvirker embryoimplantasjonen.

Med unntak av

MAGE-D

gener, pattedyr

MAGE

gener har en enkelt ekson for CDS. Dermed disse vil trolig bli behandlet gener som stammer fra transkripsjoner av

MAGE-D

eller andre

MAGE-D

behandlet gener [7], [30]. Men vi kan ikke utelukke muligheten for at en stamfar til hvert underfamilien resulterte fra duplisering av en bearbeidet gen.

For å undersøke hvordan stamfar til hvert gen familien oppsto, nukleotidsekvensene til en enkelt representanter fra hver underfamilien var sammenlignet med hverandre ved hjelp av matriseanalyse [16]. Hvis en hel kodende region inkludert flanke regionen har blitt duplisert, viser dotter analyse likheten utover CDS. På den annen side har en stamfar til hvert underfamilien blitt generert av retrotransposition, analysen viser likheten bare i CDS.

For det meste

MAGE

gener, dot-matrix analyse avdekket at innen og mellom type i og II betydelige likheter ble kun observert i CDS-regioner, noe som tyder på en retrotranspostion. En sammenligning mellom

MAGE-A

og

MAGE-C

, på den annen side, var et unntak. Sammenligningen viser likheten utover CDS, noe som tyder DNA-baserte genduplikasjon. Imidlertid kan det være mulig at andre underfamilier ble også dannet ved genduplikasjon. Den sekvenslikhet i flankerende regioner av dubletter ble muligens tapt i løpet av evolusjonen på grunn av den svakere funksjonelle begrensningen. Faktisk, omfanget av synonymt sekvens forskjeller mellom type II gens og de mellom type I og type II gener varierer fra 0,81 til 1,0, slik som ble observert noen signifikant likhet i en region utover CDS. Selv cladistic markører som

linjer

kan ha vært informativ for å skille retrotransposition fra genduplikasjon, ingen slike informative elementer ble funnet. Derfor, i fravær av støttende bevis, konkluderte vi med at

MAGE-C

ble duplisert fra

MAGE-A

og at andre underfamilier ble generert av retrotransposition. Totalt åtte innsetting av retrotransposed

MAGE

har skjedd i genomet til forfedrenes Eutheria og hver behandlet gen ble en stamfar til en underfamilie. Etter retrotransposition, vises en uavhengig genduplikasjon å ha funnet sted innenfor hver underfamilien.

Gene dobbeltarbeid og palindrom formasjon

Det er bemerkelsesverdig at clustering mønster av

MAGE-A

forskjellig fra den i

MAGE-B plakater (fig. 1, fig. S1). Hver av de 11 menneske

MAGE-B

gener danner en monophyletic klynge med ortologer i andre eutherians, mens 15

MAGE-A

gener danner arts- eller takson-spesifikke klynger (Fig. 1 , fig. S1 og S2). Videre tre

MAGE-C

genene synes å være primat-spesifikke. Innenfor de to type II

MAGE

underfamilier, fem

MAGE-D Hotell og to

MAGE Anmeldelser –

E

gener viser også en gruppering mønster (en- til-en ortologe forhold) lik som

MAGE-B plakater (fig. 1 og 3).

det er totalt 16

MAGE-A

genene er plassert på Xq28, i størrelsesorden 148 Mb til 153 Mb, og er gruppert i tre blokker A, B og C (fig. 4A). Blokker A og B inneholder fem (

MAGE Anmeldelser –

A11

, –

A9

, –

A9B

, –

A8 Hotell og

psMAGEA7

) og ti (

MAGE Anmeldelser –

A4

, –

A5

, –

A10

, –

A6

, –

A2B

, –

A2

, –

A12

, –

A3

,

psMAGEA Hotell og

psMAGEAL

) gener, respektivt, mens blokk C inneholder et enkelt gen (

MAGE-A1

) (fig. 4B og C). Hver av de tre blokkene i besittelse av en palindrom (fig. 4C). Men i bare blokk B fleste gener (seks av ti) er plassert på begge armene av palindrom (fig. 4C). Tre nesten identiske par av

MAGE Z –

A2 Twitter /

A2B

, –

A3 Twitter /

A6

,

psMAGEA /psMAGEAL

er plassert i symmetriske posisjoner på armene (fig. 4B og 4C), mens

MAGE-A12

ligger i sløyfen regionen. Vi utpekt et par like gener eller sekvenser x og y på symmetriske posisjoner på palindrom som x /y. Fylogenetisk forholdet mellom 16

MAGE-A

gener inkludert

psMAGEAL plakater (Fig. 4B, se Materialer og metoder) og med

MAGE-D

brukt som en outgroup avdekket at fem gener i blokk B er i en monofyletisk gruppe, mens et par av

psMAGEA Twitter /

psMAGEAL

gener er fjernt i slekt med andre

MAGE-A

gener.

(

A

) En diagonal linje trukket fra øvre venstre til nedre høyre indikerer identitet i regionen. Regionen er delt i tre underområder, A, B og C, som inneholder fem, ti og en

MAGE-A

gener, respektivt. (

B

) Treet ble bygget ved hjelp av antall nucleotide forskjeller (

p

-distances) blant CDS (1916 bp) av 16

MAGE-A

gener. Tallet på hver node representerer bootstrap sannsynlighet støtte som node. Bootstrap verdier større enn 50% vises. Operasjon taksonomiske enheter (Otu) i magenta, grønn og blå representerer gener i underregioner A, B og C, henholdsvis. (

C

) Tre spådd palindromes vist i underregioner A, B og C. I delområde B, er de fleste av gener som ligger på antatte palindromdager armene.

Menneske blokk B består av syv dupliserte enheter. Hver enhet er 10-20 kb lang og inneholder en

MAGE-A

og en chondrosarcoma forbundet gen (

CSAGE

) [31] (Fig. 5

A

). BLAST analyse av pattedyr genomer viser også fravær av

CSAGE

homologer i ikke-primat pattedyr. Den palindrome i blokk B ble ikke observert i ikke-primater genomer, for eksempel mus, hund og hest genomer.

(

A

) De diagonale linjer fra venstre øverst til høyre nederst indikerer identitet innenfor den menneskelige (venstre panel) eller macaque (høyre panel) sekvens. Hull i diagonal linje i macaque indikere sekvense hull. De fargede bokser i bunnen av hvert panel indikere syv dupliserte enheter. De samme fargede boksene innen en art tilsier at de er nærmere beslektet med hverandre enn til andre, mens de mellom artene indikerer mulige ortologer. (

B

) Palindromer spådde i underregion B av den menneskelige (venstre) eller macaque (høyre) sekvens. Numrene ved siden av linjene indikerer hver duplisert enhet. (

C

) En NJ treet basert på

p

-distances mellom dupliserte enheter (2880 bp) er vist. Den fargekode for Otu er den samme som i (

A

) og (

B

).

Blant primater, blokk B kan identifiseres hos aper (fig. 5

A

). Denne blokken inneholder også syv dupliserte enheter, men i form av den forventede palindrom varierer mellom de humane og macaque. I motsetning til den lange stammen og kort sløyfe observert i den humane, i macaque, er en kort stilk og en stor løkke struktur forutsagt (fig. 5

B

). Videre er orthology av enheter mellom aper og mennesker ferien gitt sine stillinger. For enkelhets skyld har vi utpekt de syv dupliserte enheter i blokk B som

h1

til

H7

hos mennesker og

m1

til

m

7 hos aper ( fig. 5

A

) og deretter undersøkt deres fylogenetiske relasjoner (fig. 5

C

). Enheter av

h1 Twitter /

h7

husing

psMAGEAL Hotell og

psMAGEA

gener er ortologe til

m1 Twitter /

m7

. Enheter av

h3 Twitter /

h5

med

MAGE-A2 /A2B

gener er ortologe til

m5

med

MAGE-A2

: men hos aper,

m5

ligger i loopen og det er ingen partner (en svært lik sekvens) på

m5

i blokken. Enheten for

h4

med

MAGE-A12

er ortologe til

m3

, men hos aper denne enheten ikke inneholder en

MAGE

genet (fig . 5

A

). Videre forholdet mellom

h2 Twitter /

h6

,

m

2,

m4 Hotell og

m

6 er litt forvirrende, til tross for at

MAEG-A3 /A6

er i

h2 Twitter /

h6 Hotell og tre mulige homologer (

MAGE-A3

, –

3L

, og –

A3L

) er i

m

2,

m4 Hotell og

m

6.

p

-Avstand mellom

h2 Hotell og

h6

var 0,7% (± 0,2), mens

p

-distances blant

m

2,

m4 Hotell og

m

6 er mye større (12,1%) enn tidligere. De parvise avstander heter mellom mennesker og aper varierte fra 8,3% (± 0,5) til 17,7% (± 0,7), som er for stor for en ortologe forhold. Den fylogeni heller ikke støtte en ortologe forholdet mellom hver av de tre enhetene i makaker (

m

2,

m4

, eller

m

6) og

h2 Twitter /

h6 plakater (fig. 5

C

).

for ytterligere å undersøke ortologe relasjoner til disse dupliserte enheter, cladistic markører som

SINE

s og

LINE

s ble søkt hjelp RepeatMasker programvare [24] (fig. 6). Generelt ordningen med

sinus

s,

LINE

s,

LTR

s, og korte repetisjoner i blokk B viser delvis likheten mellom det menneskelige og macaque genom. Posisjonen og type repeterende sekvenser funnet over hele

m2

regionen er nesten identiske med de som finnes i den distale halvdel av

h2

. En tilsvarende fordeling av repeterende sekvenser er observert mellom en region av

m5 Hotell og

h5

, og likheten er også observert mellom en del av

m4

og at

h4

. Imidlertid artsspesifikke områder synes å være til stede i hver genomet. Hos mennesker er den regionen ~40 kb lang og strekker seg fra midten av

h2

til

h4

, mens hos aper, er artsspesifikke regionen ~ 30 kb og strekker seg fra midten av

m2

til

m4

. I motsetning til resultatene av fylogeni og genetisk avstand analyser (fig. 5

C

og 6), de cladistic markører viste at

h2

med menneskelig

MAGE-A6 Hotell og

m2

med macaque

MAGE3L

er faktisk ortologe til hverandre.

Fargede trekanter viser ispedd elementer (

linjer

eller

Sines

) ,

LTR

, transposoner DNA (

DNA-TP

) eller enkle repetisjoner (

SR

) funnet i menneske- eller macaque genom, henholdsvis. Brak under hvert linje indikerer dupliserte enheter. Lys rosa piler indikerer palindrom struktur. Lyset blå pilen viser sekvense hull hos aper. Bokstavene a til l og en til i «på trekanter indikerer ortologe innsetting elementer i de menneskelige og macaque genomer. Lyset grønne linjen viser et humanistisk eller macaque-spesifikk region stiplede linjer viser grensen mellom artsspesifikke og ortologe regioner.

Human-spesifikke palindrom og genet konvertering

dot-matrix-analyse viste at palindrom i blokk B er åpenbart bare hos mennesker. Selv om sekvense hull for tiden eksisterer i sjimpanse og orangutang genomet, de tilgjengelige sekvensene viste at palindrom i blokk B er mindre tydelig i disse to aper enn hos mennesker (fig. 7). Vi parsimoniously utledes forfedrenes state of the palindrom ved hjelp av sekvensinformasjon av genomet av bevarte primater.

Størrelsen er 500 bp uten overlapping mellom tilstøtende vinduer. Fargede rektangler nederst på figuren angir duplisert enhet inkludert

MAGE

gener (lys rosa piler). Ordinaten representerer nukleotid divergens (

d

) og abscissen representerer posisjon (bp) i forhold til midten av løkken (stilling null, blå pil). Området rundt en rød stiplet linje indikerer høy avvek regionen i

MAGE-A3 Hotell og

MAGE-A6

.

Gener på palindromes kan oppleve hyppig genet konvertering .

Legg att eit svar