Abstract
Den evolusjonære modusen for en multi-genet familien kan endres over tid, avhengig av funksjonell differensiering og lokal genomisk miljø av familiemedlemmer. I denne studien viser vi en slik endring i melanom antigen (
MAGE
) genet familie på pattedyrs X-kromosomet.
MAGE
genet familie består av ti underfamilier som kan kategoriseres i to typer. Type I genene er av relativt ny opprinnelse, og de koder epitoper for human leukocytt antigen (HLA) i kreftceller. Type II-gener er relativt gammel, og noen av deres produkter er kjent for å være involvert i apoptose eller celleproliferasjon. Den evolusjonære historien til
MAGE
genet familien kan deles inn i fire faser. I fase I, en løssalgs tilstand av en nedarvet genet og evolusjonært konserverte modus hadde varte til fremveksten av eutherian pattedyr. I fase II, åtte underfamilien forfedre, med unntak for
MAGE-C Hotell og
MAGE-D
underfamilier, ble dannet via retrotransposition uavhengig. Dette vil falle sammen med en innarbeiding utbrudd av
LINE
elementer på eutherian stråling. Men
MAGE-C
ble generert av genet duplisering av
MAGE-A
. Fase III er preget av omfattende genduplikasjon innenfor hver underfamilien og spesielt dannelsen av palindromes i
MAGE-A
underfamilien, som skjedde i en stamfar til østaper. Fase IV er kjennetegnet ved nedbrytning av en palindrom i de fleste østaper, med unntak av mennesker. Selv om palindrome avkortes ved hyppige slettinger i aper og dyreaper, er det beholdt hos mennesker. Her argumenterer vi for at denne menneskelige spesifikke oppbevaring stammer fra negativ seleksjon virker på
MAGE-A
gener som koder for epitoper av kreftceller, som bevarer sin evne til å binde seg til svært divergerende HLA molekyler. Disse funnene er tolket med hensyn til de biologiske faktorer forme siste menneskelige
MAGE-A
gener
Citation. Katsura Y, Satta Y (2011) evolusjonære historien til Kreft immunitet Antigen
MAGE
Gene Family. PLoS ONE seks (6): e20365. doi: 10,1371 /journal.pone.0020365
Redaktør: Nikolas Nikolaidis, California statsuniversitet Fullerton, USA
mottatt: 14 februar 2011; Godkjent: 18 april 2011; Publisert: 10 juni 2011
Copyright: © 2011 Katsura, Satta. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av en Grant-in Aid for Scientific Research på Prioriterte områder (17018032). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
den evolusjonære modus av et gen familie, nemlig prosessen med fødsel og død av gener og omfang av sekvens divergens, avhenger av den funksjonelle divergens av duplisert gener og på den lokale strukturen av genomet hvor familien bor [1], [2]. Her, lokal struktur av genomet refererer til tandem eller inverterte repetisjoner (IRS). Utviklingen av en genfamilien på IR kan være spesielt komplisert som følge av homogenisering ved hyppig gen omdannelse og strukturell ustabilitet, for eksempel på grunn av hyppige innsettinger og /eller delesjoner.
Warburton et al. (2004) fant en overvekt av store, IR med en høy grad av likhet mellom repetisjoner på X og Y-kromosomer (~ 30% av IR i det menneskelige genom er på X- og Y-kromosomer) [3]. Mange IR på X og Y inneholder gener uttrykt overveiende i testiklene [3]. Warburton og hans kolleger foreslo at disse IR spiller en viktig rolle i menneskets genom evolusjon. Imidlertid har den nøyaktige rolle av IR i evolusjonen forble uklart. Derfor, i denne studien, forsøker vi å undersøke tempo og modus for genet familie evolusjon i IR, med et spesifikt fokus på melanom antigen (
MAGE
) genet familie, der medlemmene er plassert på en stor ( ~ 100 kb) palindrom på menneske X-kromosomet.
MAGE
ble opprinnelig identifisert som «en melanom antigen» og senere
MAGE Hotell og dets homologer ble oppdaget å danne en multi-genfamilien i eutherian genomer [4] – [7].
MAGE
homologe sekvenser har blitt funnet i noen virveldyr (sebrafisk og kylling) [8], [9] og virvelløse dyr (bananflue) [10]. I det humane genom, er denne familien består av 10 underfamilier, og hver underfamilie består av en til 15 gener [7]. I tillegg til klassifisering av underfamilien,
MAGE
gener kan også deles inn i type I eller type II, basert på deres uttrykk mønstre og funksjon. Type I genene er sammensatt av tre underfamilier (
MAGE-A
, til –
C
) og type II gener av syv underfamilier (
MAGE-D
til –
F
, –
H
, –
L2
,
NDN
,
NDNL2
). Type I-genene blir uttrykt i meget prolifererende celler, slik som svulster, placenta og bakterie linjeceller [4]. Type II-gener, derimot, er allestedsnærværende uttrykt i somatiske celler, og noen type II-gener er kjent for å være involvert i apoptose eller celle proliferasjon [11].
Alle type I
MAGE-gener
ligger på X-kromosomet og kode tumorantigener som spiller en nøkkelrolle i kreft immunitet. Peptider i humane MAGE homologi domene (MHD), som er 160-170 aminosyrer lang, er epitoper av human leukocytt antigen (HLA) klasse I-molekyler [4]. Når den antigen (peptid i MHD) på en tumorcelle binder til en reseptor på en killer T-celle, T-celleangrep på tumorcelle [4], [12].
HLA
er svært polymorfe i det menneskelige genom og annerledes
HLA
alleler kan binde forskjellige epitoper [13], [14].
MAGE
gener kan kode for mange epitoper for derved å binde til, eller reagere med, hver HLA-molekyl. Dermed er det av interesse å spore opprinnelsen til sammenhengen mellom
HLA Hotell og
MAGE
samt å bestemme hvordan det genetiske mangfoldet i epitop-kodende region har utviklet seg og blitt opprettholdt.
Mange
MAGE
gener antas å være pattedyr spesifikke [7]. I tillegg har de fleste eutherian
MAGE
gener har en enkelt ekson å kode et protein og derfor er de sannsynligvis til å ha kommet fra retrotransposition av
MAGE-D product: [7], fordi bare
MAGE-D
underfamilie medlemmer har 14 eksoner hvor en ORF er kodet mellom andre til 12. eksoner [15]. Likevel forblir forholdet mellom type I og type II gener er ikke ferdig etterforsket, og modusen for spredning av disse genene uklart.
I denne studien undersøker vi den evolusjonære historien til
MAGE
genet familien. Først søkte vi etter de fordums sin retning
MAGE
gener i virveldyr og virvelløse genomer. For det andre, undersøkte vi hvordan og når forfedrene hvert tre type I og syv type II underfamilier ble generert med spesiell referanse til deres modus for forsterkning. For det tredje har vi fokus på
MAGE Anmeldelser –
A
familien (en av de type I underfamilier) og vise hvordan genomet ordningen har oppstått hos primater. Til slutt viser vi at noen menneskelig
MAGE Anmeldelser –
En
gener har gjennomgått negativ seleksjon mot homogenisering av genet konvertering for å beholde sine genetiske variasjoner blant aminosyresekvenser. Vi foreslår at dette valget er knyttet til vedlikehold av en rekke HLA-epitoper i kreftceller.
Materialer og metoder
Sekvenser brukes
Menneske (
Homo sapiens
) nukleotid sekvens data og tilsvarende genet informasjon ble hentet fra NCBI databasen (bygge 36,3; https://www.ncbi.nlm.nih.gov/). Syntenic eller homologe genomiske sekvenser fra andre primater og pattedyr, inkludert opossums (
Monodelphis domestica
) og platypuses (
Ornithorhynchus anatinus
), ble hentet fra NCBI og Ensembl databaser (http: //uswest .ensembl.org /index.html). For å finne bevart synteny mellom det menneskelige X-kromosom og kromosomer i andre dyr, analyser BLAST bruker menneskelige
MAGE
gener som spørringer ble utført. Å identifisere homologe sekvenser, bruker vi 70% som en cut-off verdi for BLAST søk.
Identifikasjon av genomisk strukturer
Identifikasjon av skattemyndighetene og tandem repetisjoner ble utført ved bruk av en matrise tilnærming [ ,,,0],16]. GenomeMatcher [17] ble deretter anvendt for å oppnå detaljert informasjon om nukleotid-sekvenslikhet mellom like enheter. Et diagram trukket av dette programmet viser graden av likhet mellom sekvenser med fargekoder, med rød representerer likheten større enn 95%, appelsin som representerer ca. 90% -95%, grønn som representerer ca. 85% -90%, og blå representerer lavere enn 85 %.
fylogenetisk og molekylær evolusjonær analyser
For å studere fylogenetiske relasjoner mellom
MAGE
familiemedlemmer, 158 kodende sekvenser (CDS) i den menneskelige, sjimpanse (
Pan troglodytes
), macaque (
Macaca mulatta
), mus (
mus musculus
), ku (
Bos taurus
), hund (
Canis lupus
), opossum, nebbdyr, kylling (
Gallus gallus
) og sebrafisk (
Danio rerio
) genom ble hentet fra NCBI databasen (tabell S1).
MAGE
homologer ble også søkt i Ensembl database av den vestlige afrikanske klorte frog (
Xenopus tropic
), lampreys (
Petromyzon marinus
), lancelets (
Branchiostoma floridae
), sekkedyr (
Ciona intestinalis
) og kråkeboller (
Strongylocentrotus purpuratus
). For hver av disse artene, vi søkte på
MAGE
homologer over hele genomer. I de søker etter homologer,
MAGE-D
underfamilie medlemmer ble brukt som en spørring, fordi
MAGE-D
er tenkt å være forfedrenes
MAGE
familien [7] . Når vi bruker andre menneskelige
MAGE
sekvenser som en spørring, fant vi at sekvenser oppdaget allerede var inkludert i resultatet oppnådd ved hjelp av
MAGE-D
.
I det menneskelige genom det var 37 kommenterte
MAGE
gener på X-kromosomet: 15
MAGE-A
s, 11
MAGE-B
s, tre
MAGE-C
s, fem
MAGE-D
s, to
MAGE-E
s og en
MAGE-H
. I tillegg er to
MAGE-F
s ligger på kromosom 3, og
necdin lignende to plakater (
NDNL2
eller
MAGE-G
)
MAGE-lignende to plakater (
MAGE-L2
) og
necdin product: (
NDN
) er på kromosom 15. i tillegg kommenterte gener, en homolog sekvens (
psMAGEA-like: psMAGEAL
, NC_000023: 2765558 ‥ 2770471) som tilsvarer den menneskelige
MAGE
pseudogen,
psMAGEA plakater (NC_000023: utfyllende 151952946 ‥ 151957859) ble identifisert. Gene forkortelser som brukes i denne studien følger standardene som brukes for menneskegener.
Sekvensene ble oppnådd ble justert ved hjelp Clustal W programvare [18] med manuelle korrigeringer. Sekvensene av menneskelig
MAGE-H
, –
A5
og mus –
A9
var kort. Disse ble forkastet fordi inkludering av disse sekvensene gjort en meningsfull sekvens innretting kort. Antall nukleotidforskjeller per område (
p
-Avstand) ble deretter beregnet ved anvendelse MEGA4 [19], og den fylogenien ble konstruert ved anvendelse av nabo-sammenføyning (NJ) [20] Fremgangsmåte tilgjengelig i denne programvaren. Phylogenies ble også konstruert med Randomized A (x) ccelerated Maximum Likelihood (RAxML) [21] og Bayesianske (Bayes) metoder. Et program for RAxML fremgangsmåte er tilveiebrakt ved https://phylobench.vital-it.ch/raxml-bb/og at det for Bayes metode er MrBayes 3 [22]. De justeringer som brukes her er tilgjengelig på forespørsel. DnaSP v5 [23] ble anvendt for vinduet analyse av nukleotid- divergens. RepeatMasker [24] ble benyttet for å undersøke sekvenser for ispedd gjentar i NCBI databasen. Et program, GENECONV [25] ble brukt til å påvise genet konvertering.
transkripsjon faktor bindingssteder
transkripsjon faktor bindingssteder (TFBs) ble undersøkt ved hjelp av TRANSFAC R4.3 databasen [26], tilgjengelig på TFBIND hjemmeside (http: //tfbind.ims.u-tokyo.acjp/) [27]. For å finne en kandidat TFB, ble sekvenser oppstrøms av målgener justert, og svært konserverte sekvenser ble valgt. Sekvensene ble sjekket for forekomst av TFBs kommentert i databasen.
Resultater
Hvor stammer virveldyr og pattedyr
MAGE
genet familie
For å identifisere
MAGE
homologer i lampreys, lancelets, kappedyr og kråkeboller, ble en BLAST søk utført for deres genom og EST sekvenser, ved hjelp av
MAGE-D
gener som spørringer. Selv om det var ingen påvisbare homologe gener i lampreys og kråkeboller, hypotetiske gener i begge kappedyr (XM_002119518) og lancelets (XM_002613563) viste 37% sekvenslikhet med den menneskelige
MAGE-D1
. Eksplosjonen søkeresultater indikerte at fremveksten av
MAGE
genet kunne ha skjedd før divergens av Protochordata fra Chrodata.
I Jawed virveldyr, sebrafisk genomet besitter en enkelt
MAGE
genet,
Necdin lignende to plakater (
DareNDNL2
) [8].
NDNL2
gener finnes også hos mennesker, mus og kyr, men eutherian
NDNL2s
behandles gener og har et enkelt ekson, mens
DareNDNL2
besitter ~11 eksoner. En fylogenetisk tre basert på aminosyresekvenser viser at eutherian
NDNL2
s er paraphyletic til
DareNDNL2 plakater (figur 1 og S1.):
DareNDNL2
er en «primær» ortolog av eutherian
MAGE
gener [28]. Dette fylogenetisk forhold (topologien av treet) er også støttet av RAxML og Bayes trær (data ikke vist).
CDS av 158
MAGE
gener ble brukt (se tabell S1). CDS forhold er 204 bp lang. Etter justering, ble alle åpninger ekskludert for tre konstruksjon. Subfamily klynger vises. Tallet på hver node er bootstrap verdi støtter node. Fisk
NDNL2 product: (
Dare NDNL2
) og pattedyr
NDNL2
er vist i blått. Artsnavnet forkortelser er som følger: Bota (
Bos taraus
), Capo (
Cavia porcellus
), Dare (
Danio rerio
), Gaga (
Gallus gallus
), Hosa (
Homo sapiens
), Mamu (
Macaca Mulatta
), Modo (
Monodelphis domestica
), Mumu (
Mus musculus
), Orna (
Ornithorhynchus anatinus
), og Patr (
Pan troglodytes
). Figur S1 er en forstørret versjon av dette tallet, og har leselig tekst.
Hver av frosk og kylling genomer besitter bare en
MAGE
genet. I begge tilfeller, når det gjelder forholdet til syntenic
DareNDNL2
, stillingen av genet på et kromosom kunne ikke bli bekreftet på grunn av den ufullstendige tildeling av gener på kromosomer i disse artene. Men gitt at fasene på hvert exon og intron grense i CDS av fisker, frosker og kyllinger var godt bevart (tabell 1), den eneste
MAGE
gener i frosken og kylling er sannsynlig å være en-til -on ortologer av
DareNDNL2
.
Selv om bare en enkelt
MAGE
ble funnet i fisk, frosker og høns, mennesker og mus har flere underfamilier av
MAGE
gener [7]. Dermed er det interessant å undersøke
MAGE
homologer i monotremes (nebbdyr) og pungdyr (opossum). En full-genom BLAST søk ved hjelp av menneskelig
MAGE-D1
som en spørring oppdaget en
MAGE
-lignende (
Magel
) sekvens i nebbdyr og to
Magel
s på pungrotte. Disse ble forsøksvis kalt henholdsvis
OrnaMAGEL Hotell og
ModoMAGEL1 Twitter /
L2
,. BLAST søker hjelp andre
MAGE
gener som
DareNDNL2
som en spørring resulterte i påvisning av de samme genene.
opossums
ModoMAGEL1 Hotell og
ModoMAGEL2
er lokalisert på kromosomer X og 8, respektivt.
ModoMAGEL2
er kodet av en enkelt ekson, mens
ModoMAGEL1
er kodet med 11 eksoner. Dermed
ModoMAGEL2
er sannsynlig å være en bearbeidet gen avledet fra
ModoMAGEL1
. Faktisk
ModoMAGEL1 Hotell og
ModoMAGEL2
danne en monofyletisk gruppe i treet (Fig. 1, fig. S1) og i trær konstruert av tre ulike metoder (NJ, RAxML og Bayes).
de platypuses
OrnaMAGEL
genet ligger på contig Ultra 403 og består av 10 eksoner. Selv om antallet eksoner er forskjellig fra den i
ModoMAGEL1
, fasene og størrelser av delte eksoner er godt bevart (tabell 1). Videre inneholder Ultra 403 også ubiquitin ligase genet
HUWE1 plakater (hect, UBA og WWE domene som inneholder en), som ligger ~600 kb oppstrøms fra
OrnaMAGEL
. En
in situ
hybridisering studien bekreftet at de nebbdyr,
HUWE1
ligger på kromosom 6 [29]; Dermed er det sannsynlig at dette contig er en del av kromosom 6. Platypus kromosom 6 er homolog med autosomal stamfar eutherian og pungdyr X-kromosomer [29]. Faktisk regionen rundt
OrnaMAGEL
på contig viste en syntenic forhold til den menneskelige Xp11 regionen. I det menneskelige genom, posisjonen som tilsvarer
OrnaMAGEL
er okkupert av
MAGE-D2 Hotell og –
D3 plakater (Fig. 2). Menneskelig
MAGE-D2 Hotell og –
D3
har 13 eksoner, og fasene og størrelser av felles eksoner er konservert med
OrnaMAGEL
, så vel som med
ModoMAGEL1 Hotell og annen
MAGE
gener i kylling, frosk og sebrafisk genomer (tabell 1).
Røde linjer indikerer
MAGE-D
eller
Magel
gener i menneske eller nebbdyr, henholdsvis. Svarte striper og gen navnene indikerer syntenic gener mellom mennesker og platypuses. Blå barer og genet navn indikerer gener som ikke viser synteny. Andre
MAGE-D
underfamilien medlemmer,
MAGE-D1 Hotell og
MAGE-D4
ligger på 51,6 m og 51,9 M på menneske X-kromosomet, henholdsvis.
Fylogeni av pattedyr
MAGE
genet familie
Et tre av menneskelig
MAGE
gener viser at tre type i
MAGE
underfamilier (
MAGE-A
, –
B Hotell og –
C
) danner en monophyletic klynge som er forskjellig fra de sju type II underfamilier (
MAGE- D
, –
E
, –
F
, –
H
, –
L2
,
NDN Hotell og
NDNL2
) (fig. 3). Bevisene er støttet av fem fylogenetisk informative erstatninger (D16Y, K23T, I62V, A113E og R156Q i en justering av MHD, fig. S3). I tillegg
MAGE-D
gener danner en monophyletic klynge. Selv om antallet av nukleotider anvendt i denne analysen er liten, er det klart at type I underfamilier avvek mer nylig enn type II-underfamilier (fig. 3 og S2 fig.).
Treet er basert på antall aminosyre forskjeller per område (
p
-distances). Gener men for
DareNDNL2
i treet er alle
MAGE
gener funnet i det menneskelige genom.
DareNDNL2
fra sebrafisk brukes til å finne roten av treet. Antallet nettsteder forhold er 92 aminosyrer uten mellomrom. Bootstrap verdi indikeres ved noden. Sekvenser er oppført i tabell S1.
MAGE-E
har duplisert MHD og duplisering har oppstått tidligere enn fremveksten av typen klammeren gener.
MAGEE1_1 product: (
MAGEE2_1
) og
MAGEE1_2 product: (
MAGEE2_2
) representerer MHD på N og C-terminalen siden av
MAGE-E1 product: (
MAGE-E2
), henholdsvis. Den eutherian
MAGE-D3
genet koder trophinin (TRO), som uttrykkes i morkaken og påvirker embryoimplantasjonen.
Med unntak av
MAGE-D
gener, pattedyr
MAGE
gener har en enkelt ekson for CDS. Dermed disse vil trolig bli behandlet gener som stammer fra transkripsjoner av
MAGE-D
eller andre
MAGE-D
behandlet gener [7], [30]. Men vi kan ikke utelukke muligheten for at en stamfar til hvert underfamilien resulterte fra duplisering av en bearbeidet gen.
For å undersøke hvordan stamfar til hvert gen familien oppsto, nukleotidsekvensene til en enkelt representanter fra hver underfamilien var sammenlignet med hverandre ved hjelp av matriseanalyse [16]. Hvis en hel kodende region inkludert flanke regionen har blitt duplisert, viser dotter analyse likheten utover CDS. På den annen side har en stamfar til hvert underfamilien blitt generert av retrotransposition, analysen viser likheten bare i CDS.
For det meste
MAGE
gener, dot-matrix analyse avdekket at innen og mellom type i og II betydelige likheter ble kun observert i CDS-regioner, noe som tyder på en retrotranspostion. En sammenligning mellom
MAGE-A
og
MAGE-C
, på den annen side, var et unntak. Sammenligningen viser likheten utover CDS, noe som tyder DNA-baserte genduplikasjon. Imidlertid kan det være mulig at andre underfamilier ble også dannet ved genduplikasjon. Den sekvenslikhet i flankerende regioner av dubletter ble muligens tapt i løpet av evolusjonen på grunn av den svakere funksjonelle begrensningen. Faktisk, omfanget av synonymt sekvens forskjeller mellom type II gens og de mellom type I og type II gener varierer fra 0,81 til 1,0, slik som ble observert noen signifikant likhet i en region utover CDS. Selv cladistic markører som
linjer
kan ha vært informativ for å skille retrotransposition fra genduplikasjon, ingen slike informative elementer ble funnet. Derfor, i fravær av støttende bevis, konkluderte vi med at
MAGE-C
ble duplisert fra
MAGE-A
og at andre underfamilier ble generert av retrotransposition. Totalt åtte innsetting av retrotransposed
MAGE
har skjedd i genomet til forfedrenes Eutheria og hver behandlet gen ble en stamfar til en underfamilie. Etter retrotransposition, vises en uavhengig genduplikasjon å ha funnet sted innenfor hver underfamilien.
Gene dobbeltarbeid og palindrom formasjon
Det er bemerkelsesverdig at clustering mønster av
MAGE-A
forskjellig fra den i
MAGE-B plakater (fig. 1, fig. S1). Hver av de 11 menneske
MAGE-B
gener danner en monophyletic klynge med ortologer i andre eutherians, mens 15
MAGE-A
gener danner arts- eller takson-spesifikke klynger (Fig. 1 , fig. S1 og S2). Videre tre
MAGE-C
genene synes å være primat-spesifikke. Innenfor de to type II
MAGE
underfamilier, fem
MAGE-D Hotell og to
MAGE Anmeldelser –
E
gener viser også en gruppering mønster (en- til-en ortologe forhold) lik som
MAGE-B plakater (fig. 1 og 3).
det er totalt 16
MAGE-A
genene er plassert på Xq28, i størrelsesorden 148 Mb til 153 Mb, og er gruppert i tre blokker A, B og C (fig. 4A). Blokker A og B inneholder fem (
MAGE Anmeldelser –
A11
, –
A9
, –
A9B
, –
A8 Hotell og
psMAGEA7
) og ti (
MAGE Anmeldelser –
A4
, –
A5
, –
A10
, –
A6
, –
A2B
, –
A2
, –
A12
, –
A3
,
psMAGEA Hotell og
psMAGEAL
) gener, respektivt, mens blokk C inneholder et enkelt gen (
MAGE-A1
) (fig. 4B og C). Hver av de tre blokkene i besittelse av en palindrom (fig. 4C). Men i bare blokk B fleste gener (seks av ti) er plassert på begge armene av palindrom (fig. 4C). Tre nesten identiske par av
MAGE Z –
A2 Twitter /
A2B
, –
A3 Twitter /
A6
,
psMAGEA /psMAGEAL
er plassert i symmetriske posisjoner på armene (fig. 4B og 4C), mens
MAGE-A12
ligger i sløyfen regionen. Vi utpekt et par like gener eller sekvenser x og y på symmetriske posisjoner på palindrom som x /y. Fylogenetisk forholdet mellom 16
MAGE-A
gener inkludert
psMAGEAL plakater (Fig. 4B, se Materialer og metoder) og med
MAGE-D
brukt som en outgroup avdekket at fem gener i blokk B er i en monofyletisk gruppe, mens et par av
psMAGEA Twitter /
psMAGEAL
gener er fjernt i slekt med andre
MAGE-A
gener.
(
A
) En diagonal linje trukket fra øvre venstre til nedre høyre indikerer identitet i regionen. Regionen er delt i tre underområder, A, B og C, som inneholder fem, ti og en
MAGE-A
gener, respektivt. (
B
) Treet ble bygget ved hjelp av antall nucleotide forskjeller (
p
-distances) blant CDS (1916 bp) av 16
MAGE-A
gener. Tallet på hver node representerer bootstrap sannsynlighet støtte som node. Bootstrap verdier større enn 50% vises. Operasjon taksonomiske enheter (Otu) i magenta, grønn og blå representerer gener i underregioner A, B og C, henholdsvis. (
C
) Tre spådd palindromes vist i underregioner A, B og C. I delområde B, er de fleste av gener som ligger på antatte palindromdager armene.
Menneske blokk B består av syv dupliserte enheter. Hver enhet er 10-20 kb lang og inneholder en
MAGE-A
og en chondrosarcoma forbundet gen (
CSAGE
) [31] (Fig. 5
A
). BLAST analyse av pattedyr genomer viser også fravær av
CSAGE
homologer i ikke-primat pattedyr. Den palindrome i blokk B ble ikke observert i ikke-primater genomer, for eksempel mus, hund og hest genomer.
(
A
) De diagonale linjer fra venstre øverst til høyre nederst indikerer identitet innenfor den menneskelige (venstre panel) eller macaque (høyre panel) sekvens. Hull i diagonal linje i macaque indikere sekvense hull. De fargede bokser i bunnen av hvert panel indikere syv dupliserte enheter. De samme fargede boksene innen en art tilsier at de er nærmere beslektet med hverandre enn til andre, mens de mellom artene indikerer mulige ortologer. (
B
) Palindromer spådde i underregion B av den menneskelige (venstre) eller macaque (høyre) sekvens. Numrene ved siden av linjene indikerer hver duplisert enhet. (
C
) En NJ treet basert på
p
-distances mellom dupliserte enheter (2880 bp) er vist. Den fargekode for Otu er den samme som i (
A
) og (
B
).
Blant primater, blokk B kan identifiseres hos aper (fig. 5
A
). Denne blokken inneholder også syv dupliserte enheter, men i form av den forventede palindrom varierer mellom de humane og macaque. I motsetning til den lange stammen og kort sløyfe observert i den humane, i macaque, er en kort stilk og en stor løkke struktur forutsagt (fig. 5
B
). Videre er orthology av enheter mellom aper og mennesker ferien gitt sine stillinger. For enkelhets skyld har vi utpekt de syv dupliserte enheter i blokk B som
h1
til
H7
hos mennesker og
m1
til
m
7 hos aper ( fig. 5
A
) og deretter undersøkt deres fylogenetiske relasjoner (fig. 5
C
). Enheter av
h1 Twitter /
h7
husing
psMAGEAL Hotell og
psMAGEA
gener er ortologe til
m1 Twitter /
m7
. Enheter av
h3 Twitter /
h5
med
MAGE-A2 /A2B
gener er ortologe til
m5
med
MAGE-A2
: men hos aper,
m5
ligger i loopen og det er ingen partner (en svært lik sekvens) på
m5
i blokken. Enheten for
h4
med
MAGE-A12
er ortologe til
m3
, men hos aper denne enheten ikke inneholder en
MAGE
genet (fig . 5
A
). Videre forholdet mellom
h2 Twitter /
h6
,
m
2,
m4 Hotell og
m
6 er litt forvirrende, til tross for at
MAEG-A3 /A6
er i
h2 Twitter /
h6 Hotell og tre mulige homologer (
MAGE-A3
, –
3L
, og –
A3L
) er i
m
2,
m4 Hotell og
m
6.
p
-Avstand mellom
h2 Hotell og
h6
var 0,7% (± 0,2), mens
p
-distances blant
m
2,
m4 Hotell og
m
6 er mye større (12,1%) enn tidligere. De parvise avstander heter mellom mennesker og aper varierte fra 8,3% (± 0,5) til 17,7% (± 0,7), som er for stor for en ortologe forhold. Den fylogeni heller ikke støtte en ortologe forholdet mellom hver av de tre enhetene i makaker (
m
2,
m4
, eller
m
6) og
h2 Twitter /
h6 plakater (fig. 5
C
).
for ytterligere å undersøke ortologe relasjoner til disse dupliserte enheter, cladistic markører som
SINE
s og
LINE
s ble søkt hjelp RepeatMasker programvare [24] (fig. 6). Generelt ordningen med
sinus
s,
LINE
s,
LTR
s, og korte repetisjoner i blokk B viser delvis likheten mellom det menneskelige og macaque genom. Posisjonen og type repeterende sekvenser funnet over hele
m2
regionen er nesten identiske med de som finnes i den distale halvdel av
h2
. En tilsvarende fordeling av repeterende sekvenser er observert mellom en region av
m5 Hotell og
h5
, og likheten er også observert mellom en del av
m4
og at
h4
. Imidlertid artsspesifikke områder synes å være til stede i hver genomet. Hos mennesker er den regionen ~40 kb lang og strekker seg fra midten av
h2
til
h4
, mens hos aper, er artsspesifikke regionen ~ 30 kb og strekker seg fra midten av
m2
til
m4
. I motsetning til resultatene av fylogeni og genetisk avstand analyser (fig. 5
C
og 6), de cladistic markører viste at
h2
med menneskelig
MAGE-A6 Hotell og
m2
med macaque
MAGE3L
er faktisk ortologe til hverandre.
Fargede trekanter viser ispedd elementer (
linjer
eller
Sines
) ,
LTR
, transposoner DNA (
DNA-TP
) eller enkle repetisjoner (
SR
) funnet i menneske- eller macaque genom, henholdsvis. Brak under hvert linje indikerer dupliserte enheter. Lys rosa piler indikerer palindrom struktur. Lyset blå pilen viser sekvense hull hos aper. Bokstavene a til l og en til i «på trekanter indikerer ortologe innsetting elementer i de menneskelige og macaque genomer. Lyset grønne linjen viser et humanistisk eller macaque-spesifikk region stiplede linjer viser grensen mellom artsspesifikke og ortologe regioner.
Human-spesifikke palindrom og genet konvertering
dot-matrix-analyse viste at palindrom i blokk B er åpenbart bare hos mennesker. Selv om sekvense hull for tiden eksisterer i sjimpanse og orangutang genomet, de tilgjengelige sekvensene viste at palindrom i blokk B er mindre tydelig i disse to aper enn hos mennesker (fig. 7). Vi parsimoniously utledes forfedrenes state of the palindrom ved hjelp av sekvensinformasjon av genomet av bevarte primater.
Størrelsen er 500 bp uten overlapping mellom tilstøtende vinduer. Fargede rektangler nederst på figuren angir duplisert enhet inkludert
MAGE
gener (lys rosa piler). Ordinaten representerer nukleotid divergens (
d
) og abscissen representerer posisjon (bp) i forhold til midten av løkken (stilling null, blå pil). Området rundt en rød stiplet linje indikerer høy avvek regionen i
MAGE-A3 Hotell og
MAGE-A6
.
Gener på palindromes kan oppleve hyppig genet konvertering .