Abstract
PBOV1
er et kjent menneske proteinkodende gen med en uncharacterized funksjon. Vi har tidligere funnet at
PBOV1
mangler ortologer i ikke-primat-genomer, og er uttrykt i et bredt spekter av tumortyper. Her rapporterer vi at
PBOV1
proteinkodende sekvens er menneske-spesifikke og har sin opprinnelse
de novo
i primat evolusjon gjennom en serie av ramme-shift og stoppkodon mutasjoner. Vi profilert
PBOV1
uttrykk i flere kreft og normal vevsprøver og fant ut at det ble uttrykt i 19 av 34 svulster i ulike opprinnelse, men helt manglet uttrykk i noen av normal voksen eller foster menneskelig vev. Vi har funnet at, i motsetning til cancer /testis antigener som vanligvis styres av CpG øy-inneholdende promotorer,
PBOV1
ble uttrykt fra en GC-fattig TATA-inneholdende promoter som ikke var påvirket av CpG demetylering og var inaktiv i testikkel. Vår analyse av offentlig microarray data tyder på at
PBOV1
aktivering i svulster kan være avhengig av Hedgehog signalveien. Til tross for den siste
de novo
opprinnelse og mangelen på identifiserbare funksjonelle signaturer, en missense SNP i
PBOV1
kodende sekvens har tidligere blitt assosiert med økt risiko for brystkreft. Ved hjelp av offentlig tilgjengelige microarray datasett, fant vi at høye nivåer av
PBOV1
uttrykk i brystkreft og glioma prøver ble signifikant assosiert med et positivt utfall av kreftsykdom. Vi fant også at
PBOV1
ble sterkt uttrykt i grunnskolen, men ikke i tilbakevendende høy klasse hjernesvulst, noe som tyder på tilstedeværelsen av en negativ seleksjon mot
PBOV1
-expressing kreftceller. Våre funn kan bidra til forståelsen av mekanismene bak
de novo
genet opprinnelse og den mulige rollen av svulster i denne prosessen
Citation. Samusik N, Krukovskaya L, Meln jeg, Shilov E , Kozlov AP (2013) PBOV1 er et menneske
De Novo
Gene med Tumor-spesifikt uttrykk som er forbundet med en positiv klinisk utfall av kreft. PLoS ONE 8 (2): e56162. doi: 10,1371 /journal.pone.0056162
Redaktør: Ludmila Prokunina-Olsson, National Cancer Institute, National Institutes of Health, USA
mottatt: May 23, 2012; Godkjent: 10 januar 2013; Publisert: 13. februar 2013
Copyright: © 2013 Samusik et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble finansiert av Biomedical Centre og ved den russisk-hviterussiske program # K-32-NIR /111-3. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet, med unntak av Prof. Andrey P. Kozlov som, å være leder av Biomedical Centre, samtidig fullmakt til finansiering og overvåket dette arbeidet .
konkurrerende interesser: forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
opprinnelsen av nye gener i utviklingen av flercellede organismer har lenge vært postulert å spille. en fundamental rolle i utviklingen av nye funksjoner [1]. Det er flere godt etablerte mekanismer for romanen genet opprinnelse. For eksempel, duplisering og divergens, retroposition, genet fusjon, ekson stokking og horisontal genoverføring alle avhengige av gjenbruk av eksisterende genetisk materiale (se [2] til vurdering). Det er også foreslått at noen protein-kodende gener kan ha sin opprinnelse
de novo
fra ikke-kodende genomiske regioner gjennom en serie av mutasjoner til syvende og sist fører til utseendet av et nytt protein-kodende transkripsjon. De resulterende proteiner kan festes i utviklingen enten som et resultat av genetisk drift eller på grunn av et tilfeldig positivt bidrag til organismen kondisjon. Den positive valg etter fiksering kan ytterligere forbedre funksjonaliteten til slike proteiner.
Til tross for
de novo
mekanisme genet opprinnelse i lang tid blitt ansett urealistisk, er det et økende antall rapporter fra forskjellige arter som viser at
de novo
genet opprinnelse er en utbredt prosess som foregår i alle grener av livets tre [3] – [9]. Men detaljert forståelse av
de novo
genet opprinnelse er fortsatt savnet, inkludert hva er de kreftene som driver den innledende fiksering av en nylig oppsto genet og hvordan dens funksjon blir formet og integrert i organismen sammenheng. Vi har tidligere en hypotese om at tumorogenesis kan spille en viktig rolle i den nye genet opprinnelse og fiksering (beskrevet i [10] og [11]). I korthet, en fremtredende trekk av forskjellige tumortyper er rikelig oppregulering av forskjellige transkripter, hvorav mange har et uncharacterized funksjon [12], [13]. Et eksempel er den store klasse av såkalte kreft /testis antigener. Disse gener blir styrt av CpG-øy baserte promotorer og aktiveres preferensielt i spermatocytter og i forskjellige krefttyper, hvoretter aktivering i begge tilfeller er knyttet til en utbredt tap av CpG metylering [14], [15]. De fleste av slike transkripter mangler en etablert funksjon og er stille i de fleste normale vev. Imidlertid kan noen tilfeldigvis har en proteinkodende potensiale og dermed kan potensielt klassifisert som
de novo
gener.
For det andre, Fisher og medarbeidere [16] har vist at noen av proteinene fra et bibliotek med tilfeldig genererte proteinkodende sekvenser var i stand til å redde auxotrofe mutanter av
E. coli
. Selv om dette proof-of-prinsippet eksemplet viser at en tidligere ikke-kodende og ikke-optimalisert sekvens kan lett gi opphav til en minimal funksjonell protein, tror vi at i de fleste tilfeller en nylig dukket de novo-genet ville i utgangspunktet mangler funksjonelle egenskaper slik at de ville være tilstrekkelig til å lette dens evolusjonære fiksering. Gitt den pågående mutasjonsprosess og mangelen på selektive trykk halveringstiden av et slikt gen kan være forholdsvis kort. Vi antok at uttrykket av nye
de novo
gener i tumorer kan på noen måte bidrar til å skape en fenotypisk feedback loop som ville lette evolusjonære fiksering av disse genene og deres videre funksjonell integrering i sammenheng med organismen. Med et mål å finne konkrete eksempler som støtter denne hypotesen, fokuserte vi på å søke for menneske evolusjonært nye gener med fortrinnsrett uttrykk i svulster. Vi har tidligere rapportert flere slike utskrifter, men de fleste av dem manglet proteinkodende potensiale [17], [18]. I løpet av våre søk, kom vi over en studie av Clamp og medarbeidere som tar sikte på å filtrere det menneskelige proteinkodende gen katalogen ved å fjerne misannotated ikke-kodende gener basert på en kombinasjon av kriterier, som for eksempel tilstedeværelse av ortologer i mus og hunde genomer, PFAM domene signaler, Ka /Ks ratio etc [19]. Foruten rapportering at ca 20% av menneskets gener ble misannotated som protein-koding, forfatterne også laget en liste over 10 gener som hadde blitt klassifisert som falsk, men kodet for eksperimentelt validerte proteiner. Vi har tidligere analysert evolusjonære historie og EST-avledet uttrykk profiler av gener i denne listen og interessant, har vi funnet at ett gen i denne listen,
PBOV1
, manglet ortologer i ikke-primater genomer og dens mRNA /EST sekvenser hadde vært utelukkende hentet fra tumor kilder [20].
PBOV1 product: (
UROC28, UC28
) er en menneskelig proteinkodende gen med en 2501 bp enkelt- exon mRNA og en 135-aa åpen leseramme. Den genet er blitt først kjennetegnet ved en og medarbeidere [21] som blir overuttrykt i prostata, bryst, og blærekreft. Forfatterne uttrykte protein
in vitro
, produsert antistoffer og viste at PBOV1 protein var til stede i blodet hos pasienter med prostatakreft, men ikke i friske kontroller. De viste også at
PBOV1
uttrykk i prostatakreftceller ble oppregulert ved androgen behandling [21]. En annen gruppe rapporterte at
PBOV1
transkripsjon i brystkreftceller ble positivt regulert av østradiol [22].
Vi har tidligere rapportert at
PBOV1
genet ble uttrykt i flere typer menneske tumorer, men ikke i normale vevsprøver [20]. Men uttrykket studier i tidligere arbeidet vårt var ikke helt avgjørende fordi RT-PCR eksperimenter inkluderte ikke tilstrekkelig DNA forurensning kontroller.
Her kan vi utføre en fokusert analyse av
PBOV1
evolusjonære historie, uttrykk regulering og sykdom foreningen. Ved hjelp av komparativ genomikk analyse viser vi at
PBOV1
proteinkodende sekvens er med 80% unik for mennesker og har sin opprinnelse
de novo
under utviklingen av primater gjennom en rekke ramme-shift og stopp-kodon mutasjoner.
Vi bekrefter vår tidlig rapport fra
PBOV1
tumor-spesifikke uttrykk [20] med en ny serie med uttrykk profilering eksperimenter som bruker en annen gruppe med cDNA prøvene og inkluderer omfattende kontroller for cDNA kvalitet og genomisk DNA forurensning. Videre analyserer vi offentlig tilgjengelige genomisk, microarray og Chip-seq data for å belyse de mulige mekanismene bak
PBOV1
transkripsjonen aktivering og avdekke eventuelle koblinger mellom
PBOV1
uttrykk og kreft klinisk utfall. Til slutt, rapporterer vi at uttrykket nivåer av
PBOV1
i brystkreft og glioma kliniske prøver positivt korrelert til pasient tilbakefall overlevelse. Basert på våre funn spekulere vi at
PBOV1
genet kunne fungere som en svulst antigen og en suppressor av visse typer kreft. Vi hypotese at fiksering av dette genet i menneskets evolusjonære avstamning kan bli fremmet av en tumor-mediert immunologiske tilbakemeldinger.
Resultater
PBOV1
proteinkodende sekvens stammer
de novo
i menneskets evolusjon og ser ut til å utvikle seg nøytralt
Ifølge hg19 versjon av menneskelige UCSC Genome Browser [https://genome.ucscs.edu],
PBOV1
genet er kartlagt til chr6: 138’537’127-138’539’627, innenfor den fjerde intron av
BIG3 product: (
KIAA1244
) genet, ca 56 kbp nedstrøms BIG3 transkripsjon start stedet .
PBOV1
er transkribert fra strand som er motsatt av
BIG3
. Utskriften består av en enkelt ekson 2501 nt lange og inneholder en ORF som spenner 96-503 nt koding for 135 aminosyrer.
Vi utførte en detaljert komparativ genomisk studie av proteinkodende sekvens (CDS) av
PBOV1
. Vi pakket ut flere innretting av 34 genomer fra placenta pattedyr (se Materialer og Metoder for liste over arter) fra databasen MULTIZ flere genomkryss arter justeringer [23] som er tilgjengelige fra UCSC Genome Browser. For hvert genom, beregnet vi brøkdel av menneskelige CDS som kan være på linje med det. Basert på tilstedeværelsen av rammeskiftmutasjoner og stopp-kodoner, utledet vi brøkdel av humane proteinsekvens som var homo til det antatte proteinet som kan resultere fra oversettelse av målsekvensen i de andre arter. Vi kartlagt resultatene til pattedyr evolusjonære treet og indikerte de viktigste evolusjonære trinn som førte til utseendet av menneskelig
PBOV1 plakater (figur 1A). Den kodende sekvensen til
PBOV1
ser ut til å være dårlig konservert i evolusjonen pattedyr. Det er praktisk talt fraværende fra genomene til
atlantogenata
, med unntak av berg hyrax genomet til hvilken 71% av den humane sekvens kan justeres. Samtidig, sekvensen er homolog til
PBOV1
CDS er til stede gjennom
boreoeutheria
. Vi kan konkludere med at den siste felles stamfar av dette clade hadde mest sannsynlig minst 97% av de moderne menneske CDS (som maksimalt 97% av menneskelig sekvensen kan bli justert til genomene til hest og flygehunder), samt start ATG kodon. Men ortologe loci i
Laurasiatherae
eller
glires
kan ikke kode for et protein med en betydelig likhet med den menneskelige PBOV1: i
glires
start ATG kodon er mutert, og dermed å eliminere den åpne leseramme, og i
Laurasiatherae
en ramme-skiftende delesjon på 12 bp begrenser proteinet likheten av den N-terminale 3% av den humane sekvens
A:. den evolusjonære treet av 34 pattedyr med tilgjengelige genomiske sekvenser. Verdiene ved siden av artsnavnene viser fraksjoner av CDS menneskelige
PBOV1
som kunne være på linje med de respektive genomet og fraksjoner av kodede proteiner (forutsatt at de finnes) som kunne være på linje med den menneskelige PBOV1 protein. For utvalgte taxons, er de mest sannsynlige verdiene av de fraksjoner som i den siste felles stamfar (LCA) er gitt. Genomet av LCA av
boreoeutheria
inneholdt mest sannsynlig startkodonet av
PBOV1
, 97% av respektive genomisk sekvens (som maksimalt 97% av menneskelig sekvensen kan bli justert til genomene til hest og flygehunder) og 7% av den antatte proteinsekvensen. Men i gnagere og
Haredyr
rammen ble tapt på grunn av en mutasjon i ATG kodon.
laurasiatheria
beholde inntil 97% av genomisk sekvens homolog til
PBOV1
CDS, men proteinet homologi er under 3% på grunn av en synapomorphic ramme-shift sletting. Alle høyere primater inneholde minst 99% av humant genomisk sekvens, men proteinet homologien er bare 20%. Et viktig evolusjons arrangementet sammen den menneskelige avstamning var A → T substitusjon ved posisjonen 90 i den siste felles stamfar av
hominidae
som fjernet stoppkodon. Men alle
hominidae
genomer mangler en i-ramme stoppkodon over span av den menneskelige karakterutskrift, som kan gjøre karakterutskriften i denne arten et mål av non-stop forfall [24]. Endelig en enkelt nukleotid sletting som skjedde etter at avvik fra sjimpanse førte til en ramme-shift som endelig formet det moderne mennesket PBOV1 proteinsekvens. B: Flere justeringer på menneske
PBOV1
CDS med ortologe loci fra utvalgte pattedyrarter. De strekninger av genomer som bidrar til den antatte protein homologi til menneskelig PBOV1 er merket med gult, etterfulgt av de funksjonene som forstyrrer protein homologi (frame-skift og stoppkodoner). For å få til representasjon er de eksakte sekvenser av artsspesifikke innsett utelatt fra justeringen.
Mer enn 99% av den menneskelige
PBOV1
CDS kan være på linje med hver primat genomet som vi studerte. Men tilstedeværelsen av en tidlig stoppkodon i ikke-hominide primater begrenser likhet med det humane protein ved den N-terminale 20%. Dette stoppkodon er mutert i felles stamfar
hominidae
, åpne leserammen. Imidlertid, utvider denne ramme utover det menneskelige-identisk polyadenyleringssignaler, som kunne merke endene av de antatte transkripter i genomene til gorilla, orangutang og sjimpanse. Dette ville bety at PBOV1 lignende-transkripter i disse artene kan være gjenstand for non-stop-nedbrytning [24], og følgelig kan ikke kode for et protein, med mindre transkripter i disse artene avsluttes ved en annen polyadenyleringssignal videre nedstrøms. Men selv i dette tilfelle vil det resulterende protein være mer enn 660 aminosyrer lang og således vil ha mindre enn 20% av sekvens felles med PBOV1 protein. Til slutt, en ett-bp sletting som har skjedd i stamfar moderne mennesket etter splitt med sjimpanse førte til en ramme-shift som endelig har formet menneske
PBOV1
proteinkodende sekvens ved å sette et stoppkodon i ramme og feste sin lengde på 135 kodoner
CDS av
PBOV1
gen ikke viser en betydelig basen messig bevaring tvers av pattedyr. PhyloP [25] mener parvise bevaring -log-p- verdi var 0,07 +/- 0,82. En annen vanlig indikator på et seleksjonspress på en protein-kodende sekvens er forholdet av ikke-synonymt med synonyme substitusjoner (Ka /Ks), som har en gjennomsnittsverdi 0,21 for en typisk human human-sjimpanse-genet paret [26]. Vi beregnet Ka /Ks ratio bruke metoden for Comeron [27] i et fler justering av menneskelige CDS med rhesus, gorilla, orangutang og sjimpanse genomiske sekvenser og synes ikke det å være vesentlig forskjellig fra 1,0 (Ka /Ks 0,958, 95% CI 0,598 til 1,876), noe som indikerer at aminosyresekvensen i disse organismene utvikler seg nøytralt.
Evolusjonære funksjoner som lav sekvenskonservering, mangel på Ka /Ks skjevhet og flere frameshifts kan indikere en falsk åpen leseramme i en ikke-kodende transkript som er blitt misannotated som et protein-kodende gen. Men eksistensen av PBOV1 protein er tidligere blitt vist eksperimentelt i [21]. I tillegg støtter eksistensen av proteinet, søkte vi EBI PRIDE database med MS /MS-identifikasjoner og funnet to forskjellige peptider som entydig passet PBOV1 proteinsekvens og sammen dekket 32% av proteinet.
Vi har beregnet kodonbruk poengsum for
PBOV1
kodende region ved hjelp av fremgangsmåten ifølge Guigó [28] (se metoder for detaljer). Stillingen kvantifiserer fortrinnsrett bruk av synonymt kodoner, og høyere verdier indikerer at sekvensen bruker kodon med rikelig tilsvarende tRNAs. Høy kodonbruk indeksene angir den høye effektiviteten av mRNA oversettelse og er vanligvis observert i gener som er valgt for høye nivåer av ekspresjon. For
PBOV1
, erholdt vi et kodonbruk poengsum på 0,21 som er uventet høy for en ORF som nylig har sin opprinnelse fra et ikke-kodende sekvens og er betydelig høyere enn forventet i en tilfeldig rekkefølge av den samme lengde og basen sammensetningen (p = 0,004, basert på bootstrapping ved sekvens omstokking). Til sammenligning er den gjennomsnittlige kodonbruken score for et humant gen er 0,15 [4]. Selv om vi bare kan konkludere med at en slik høy kodonbruk stillingen er et resultat av en ren tilfeldighet, kan det være en av faktorene som positivt bidro til selve protein-kodende kapasitet av den nylig dukket opp ORF, som det er kjent at kodonbruk har en betydelig innflytelse på menneskets genekspresjon [29].
Disse funnene helt sterkt at menneskelig PBOV1 er et protein av en aller siste
de novo
evolusjonær opprinnelse, med 80% av sekvensen være konkret minst til
hominidae
. Chimp, gorilla og orangutang enten mangel homologe proteiner på grunn av en non-stop degradering eller kode for homologer av en mye høyere lengde, noe som i praksis betyr at PBOV1 protein kan betraktes som en human-spesifikke. Til tross for den nyere opprinnelse fra et ikke-kodende sekvens,
PBOV1
CDS har en uvanlig høy kodonbruk preferanse indeks og eksistensen det tilsvarende protein er blitt vist eksperimentelt.
Bio-analyse av PBOV1 protein viser mangel på funksjonelle egenskaper
en PSI-BLAST søk av PBOV1 proteinsekvens mot Uniprot NRDB90 database gav ingen treff med en E-verdi under 10, noe som indikerer en mangel på proteiner med betydelig homologi og bekrefter vår konklusjon om den siste
de novo
opprinnelse PBOV1 protein. Vi ytterligere søkte etter mulige fold og domene strukturer av PBOV1 protein ved hjelp av fritt tilgjengelige elektroniske verktøy. Fordi proteinet ikke er evolusjonært konservert, brukte vi IPSSP [30] programvare for sekundær struktur prediksjon, som, så vidt vi vet, er den mest nøyaktige sekundær struktur prediksjon verktøy som ikke er avhengig av evolusjonære informasjon. Ifølge IPSSP forutsigelse, inneholder PBOV1 protein 4 korte alfa-helikser som dekker 35% av sekvensen med resten blir uoversiktlig. Et søk etter strukturelle domene motivene i PBOV1 bruker I-Tasser threading server [31] ingen signifikante treff, som alle spådommer scoret under -3,5. PBOV1 protein inneholder 4 cysteiner og spådommer gjort av Dianna [32] webserver viste at to av dem (pos. 49-122) kan danne en disulfidbinding. I tillegg ble et søk etter post-translasjonell modifikasjon spådommer utført ved hjelp av CBS prediksjon server verktøy [https://www.cbs.dtu.dk/services] og betydelige score for fosforylering ble hentet på seriner 62, 94, 101 og tyrosinene 82 og 89.
PBOV1
har et bredt og sterkt tumor-spesifikke uttrykk profil
Vi studerte uttrykk for
PBOV1
gen i et bredt spekter av kreft og normalt vev ved hjelp av PCR på paneler av cDNA fra ulike normalt vev og kreftprøver. Først har vi testet uttrykket i Clontech MTC I, MTC II og immunsystem cDNA paneler. Vi observerte ikke noe uttrykk signal i noen av de 37 voksne og fostervev testet (figur 2). Dette resultatet var identisk med den som vi tidligere har rapportert med en uavhengig gruppe med cDNA-paneler oppnådd fra forskjellige donorer [20].
A. Humant MTC Panel I (1-8), Human MTC Panel II (9-16): 1 – hjerne, 2 – hjerte, 3 – nyre, 4 – lever, 5 – lunge, 6 – bukspyttkjertel, 7 – placenta, 8 – skjelettmuskulatur, 9 – tykktarm, 10 – eggstokk, 11 – perifert blod leukocytter, 12 – prostata, 13 – tynntarm, 14 – milt, 15 – testis, 16 – thymus; Full størrelse bilder av gels er vist på figur S1 og Figur S2 i File S1. B. menneskets fordøyelsessystem MTC Panel: 1 – cecum, 2 – tykktarm, stigende 3 – kolon, synkende 4 – tykktarm, tverr 5 – tolvfingertarmen, 6 – spiserør, 7 – ileocecum, 8 – ileum, 9 – jejunum, 10 – lever 11 – rektum, 12 – mage. Full størrelse bilder av gels er presentert på figur S5 og figur S6 i File S1. C. menneskets immunsystem MTC Panel (1-7), Human Fetal MTC Panel (8-15): 1 – beinmarg, 2 – fosterets lever, 3 – lymfeknute, 4 – perifert blod leukocytter, 5 – milt, 6 – thymus, 7 – mandel, 8 – fosterets hjerne, 9 – fosterets hjerte, 10 – fetal nyre, 11 – fosterets lever, 12 – føtal lunge, 13 – fosterets skjelettmuskulatur, 14 – foster milt, 15 – føtal thymus; A-C: NC – PCR uten mal, PC – PCR med menneskelig DNA. Full størrelse bilder av gels er vist på Figur S3 og Figur S4 i File S1.
Deretter studerte vi uttrykk for
PBOV1
i cDNA paneler av tumorprøver. Den BioChain cDNA panel besto av 32 prøver fra svulster av forskjellige histologiske typer oppnådd fra 28 forskjellige organer og vev. Vi observerte en bestemt signal i svulster i 16 forskjellige vev og organer: hjerne, lunge, lever, galleblære, mage, tynntarm, tykktarm, eggstokk, eggleder, livmor, ureter, prostata, binyre, spyttkjertel, bukspyttkjertel, thymus , testikler og milten (figur 3A). Dette resultatet var svært konsistent med den som vi tidligere har rapportert ved bruk av cDNA paneler hentet fra et annet parti av tumorprøver [20].
A. Tumor cDNA Panel (BioChain Institute, USA): 1 – Brain medulloblastoma, med gliom, 2 – Lung plateepitelkarsinom, 3 – Nyre kornet cellekreft, 4 – Nyre klarcellet karsinom, 5 – Liver cholangiocellular karsinom, 6 – leverkreft, 7 – Galleblæren adenokarsinom, 8 – spiserør plateepitelkarsinom, 9 – magen signetring cellekreft, 10 – tynntarmen adenokarsinom, 11 – Colon papillær adenokarsinom, 12 – endetarm adenokarsinom, 13 – Bryst fibroadenoma, 14 – eggstokk serøs cystoadenocarcinoma, 15 – egglederen medullær karsinom, 16 – Livmor adenokarsinom, 17 – Ureter papillær overgangsordning celle carcinoma, 18 – Blære overgangsordning celle carcinoma, 19 – testikler seminom, 20 – Prostate adenokarsinom, 21 – malignt melanom, 22 – Skeletal Muscle malignitet fiber histocytoma, 23 – adrenal pheochromocytoma, 24 – Non-Hodgkins lymfom, 25 – Thyroid papillær adenokarsinom, 26 – Parotid blandet svulst, 27 – Pancreas adenokarsinom, 28 – Thymus seminom, 29 – Spleen serøs adenokarsinom, 30 – Hodgkins lymfom, 31 – T-celle Hodgkins lymfom, 32 – Ondartet lymfom. NC – PCR uten mal, PC – PCR med menneskelig DNA. DNA-kontaminering ble kontrollert ved hjelp gDNA-CTR primere. Full størrelse bilder av gels er presentert på figur S7 og Figur S8 i File S1. B. PBOV1 uttrykk i kliniske tumorprøver (se Materialer og Metoder for full beskrivelse av prøvene). PBOV1 er uttrykt i brystkreft (9-250), eggstokk kreft (1, 6), cervical cancer (2, 13), livmorkreft (156, 270), lungekreft (12, 14, 17), seminom (7) , meningeom (63), non-Hodgkin lymfom (67, 82, 92, 102, 113) i full størrelse bilder av gels er presentert på figur S9 og figur S10 i File S1.
Vi videre studerte uttrykk for
PBOV1
i et panel av cDNA fra kliniske tumorprøver som var blitt isolert i vårt laboratorium (se Metoder). Panelet inneholdt prøver fra ulike krefttyper: bryst (6 prøver), kvinnelige reproduktive system (10 prøver), lunge (3 prøver), testis (en prøve) og lymfomer av ulike geneses (8 prøver). Resultatene av PCR på dette panelet er vist i figur 3B. Vi observerte en bestemt signal i 22 ut av 31 tumor cDNA-prøvene, inkludert brystkreft, livmorhalsen, eggstokk og livmorkreft, lungekreft, ikke-Hodgkins lymfomer, meningeom og seminom.
PBOV1
uttrykk i brystkreft og gliom positivt korrelert til tilbakefall overlevelse
Menneske
PBOV1
genet koder for et protein av nyere
de novo
opprinnelse som mangler evolusjonære bevaring og gjenkjennelige proteindomener . Dette, tatt sammen med mangel på ekspresjon i normale vev, gjør ett spørsmål hvorvidt det kodede proteinet har en hvilken som helst fysiologisk funksjon i den menneskelige organisme. Likevel, en missense SNP i
PBOV1
genet som resulterer i
I73T
bytte ble tidligere funnet å være assosiert med økt risiko for brystkreft hos kypriotiske befolkningen [33].
Vi bestemte oss for å undersøke om uttrykk for
PBOV1
i brystkreft og andre krefttyper er korrelert med sykdomsprogresjon og utfall. For dette, søkte vi etter offentlig tilgjengelige datasett fra studier som korrelerte kreftprøve uttrykk profiler med sykdomsutvikling og klinisk utfall.
Først brukte vi Gobo nettbasert verktøy for å utføre en Kaplan-Meier overlevelsesanalyse med hensyn til
PBOV1
uttrykk nivåer i et samlet datasett fra 6 uavhengige studier som målte genuttrykk profiler i de kliniske prøver av brystkreft [34]. Det har vi funnet at høyere nivåer av
PBOV1
signifikant korrelert med tilbakefall overlevelse (p = 0,013), som vist i figur 4A. Ut av de ulike kliniske undergrupper, fant vi at signifikant sammenheng kan bare observeres for pasienter med lymfeknutemetastaser, men ikke for pasienter uten lymfeknutemetastase. Tilsvarende sammenheng med tilbakefall overlevelse var signifikant i gruppen av pasienter med grad 2 tumorer, men ikke for pasienter med tumor grad 1 og 3.
A. Kaplan-Meier analyse av et samlet datasett av brystkreft uttrykk profiler fra seks uavhengige kliniske studier [34] viser at høyere nivåer av
PBOV1
uttrykk positivt korrelert til tilbakefall overlevelse ved brystkreft. Blant kliniske undergrupper effekten var stort sett uttalt i tilfeller av lymfeknute positive kreft og i tilfeller av grad 2 tumorer (data innhentet fra Gobo nettbasert verktøy [34]). B.
PBOV1
uttrykk nivåer i kliniske prøver av østrogen reseptor-positiv brystkreft positivt korrelert til pasienten tilbakefall overlevelse over 5 år etter behandling med tamoksifen (data innhentet fra GEO datasett GDS806 [35]). Feilstolpene representerer standardfeil av gjennomsnittet. C. PBOV1 uttrykk nivåer i kliniske kreftprøver fra proneural glioma pasienter positivt korrelert med overlevelse i løpet av 209 uker (data hentet fra GEO datasett GDS1816 [36]). Feilstolpene representerer standardfeil av gjennomsnittet. D. Primære proneural hjernesvulst har betydelig høyere uttrykk nivåer av
PBOV1
uttrykk enn tilbakevendende de (data innhentet fra GEO datasett GDS1816 [36]). Feilfelt representerer standard feil av gjennomsnittet.
Neste, vi analyserte datasettet fra en uavhengig studie som korrelert genuttrykk profiler av østrogen reseptor-positiv brystkreft med tilbakefall fritt pasient overlevelse over 5 år etter tamoksifenbehandling (Gene Expression Omnibus (GEO) tiltredelse GDS806 [35]). I dette datasettet, har vi funnet at høyere nivåer av
PBOV1
uttrykk positivt korrelert med progresjonsfri overlevelse (figur 4B, ensidige T-test p = 0,02).
Vi har fått en lignende et resultat av analysen av et gen ekspresjon datasett av kliniske glioma prøver (GEO tiltredelse GDS1816 [36]). Her har vi funnet at tumorprøver fra pasienter med proneural glioma som overlevde i mer enn 209 uker viste signifikant høyere
PBOV1
uttrykk nivåer sammenlignet med pasienter som overlevde 52-209 uker (figur 4C, ensidige T-test p = 0,04). Dessuten prøver av primær proneural glioma svulster viste en høyere
PBOV1
uttrykk enn prøver av tilbakevendende proneural gliomer (figur 4D, ensidige T-test p = 0,001), noe som tyder på at det kan være en negativ seleksjon mot kreft celler som uttrykker
PBOV1
løpet av kreft somatisk evolusjon.
til slutt analyserte vi en microarray datasett som profilert 22 prostatakreft prøver og ikke-kreft prostata prøver fra forskjellige pasienter (GEO tiltredelse GDS1746 [ ,,,0],37]). Her fant vi at
PBOV1
uttrykk var betydelig høyere i prøver fra kreft stadium III enn fra trinn II (p = 0,0012). Men etter at regnskap for scenespesifikke uttrykk forskjeller, vi kunne ikke finne noen signifikant korrelasjon av
PBOV1
uttrykk med tilbakefall overlevelse i dette datasettet. Dette resultatet enten tyder på at
PBOV1
uttrykk er ikke forbundet med utfallet av prostatakreft, eller kan også være grunn til en liten størrelse av datasettet (22 prøver), som begrenser deteksjon makt.
Regulering av
PBOV1
genuttrykk
PBOV1
viser en sterk tumor-spesifikke mønster av uttrykk med en viss affinitet mot slike hormonavhengig kreft som brystkreft og prostatakreft .
virveldyr gen arrangører kan deles inn i to klasser med ulike mekanismer for regulering av transkripsjon initiering (se [38] for en omfattende gjennomgang). I korte trekk, et mindretall av arrangører inneholde et typisk sett av signaler som TATA-boksen og Initiativtaker at nettopp posisjonere transkripsjon start hotellet (TSS). Aktiviteten til slike promotere avhenger sterkt av transkripsjonsfaktorer og kromatin remodeling komplekser som inneholder histone acetyltransferases. Resten av promotorene er GC-rike og inneholder typisk ingen TATA-boksen. Disse promotorer er kjennetegnet ved løst plassert TSS og deres aktivitet avhenger først og fremst CpG metylering og, i en lavere grad, på transkripsjonsfaktorer.
Vi fant at GC-innholdet i +/- 100 bp regionen rundt TSS var 35 websites.
Clontech:
[https://www.clontech.com/US/Products/cDNA_Synthesis_and_Library_Construction/cDNA_and_Genomic_DNA/Multiple_Tissue_cDNA_Panels#]
BioChain:
[https://www.biochain.com/biochain/Technical%20Resources/Reference.htm]
cDNA [https://www.clontech.com/US/Products/cDNA_Synthesis_and_Library_Construction/cDNA_and_Genomic_DNA/Multiple_Tissue_cDNA_Panels#]
Tumor