Abstract
Gitt vell av ressurser bioinformatikk og den økende kompleksiteten i biologisk informasjon, er det verdifullt å integrere data fra ulike kilder for å få innsikt i hvilken rolle gener /proteiner i helse og sykdom. Vi har utviklet en bioinformatikk rammeverk som kombinerer litteratur gruvedrift med informasjon fra biomedisinske ontologier og kuratert databaser for å skape kunnskap «kart» av gener /proteiner av interesse. Vi har anvendt denne tilnærming til studiet av beta-catenin, en celle adhesjonsmolekyl, og transkripsjonelle regulator implisert i kreft. Kunnskapen kart omfatter post-translasjonelle modifikasjoner (PTMs), protein-protein interaksjoner, sykdomsassosierte mutasjoner, og transkripsjonsfaktorer samtidig aktiveres av beta-catenin og deres mål og fanger opp de store prosesser hvor beta-catenin er kjent for å delta. Ved hjelp av kartet, genererte vi testbare hypoteser om beta-catenin biologi i normale celler og kreftceller. Ved å fokusere på proteiner som deltar i flere relasjonstyper, identifiserte vi proteiner som kan delta i feedbacksløyfer som regulerer beta-catenin transkripsjonen aktivitet. Ved å kombinere flere nettverksrelasjoner med PTM proteoform spesifikk funksjonell informasjon, foreslo vi en mekanisme for å forklare observasjonen at cyclin avhengig kinase
cdk5
regulerer positivt beta-catenin co-aktivator aktivitet. Til slutt, ved overliggende kreft-assosiert mutasjon data med sekvens funksjoner, observerte vi mutasjon mønstre i flere beta-catenin PTM nettsteder og PTM enzym bindingsseter som varierte fra vevstype, tyder på at flere mekanismer som beta-catenin mutasjoner kan bidra til kreft. Den tilnærmingen som er beskrevet, som fanger fyldig informasjon for molekylære arter fra gener og proteiner til PTM proteoforms, er utvidbar til andre proteiner og deres engasjement i sykdom
Citation. Celen İ, Ross KE, Arighi CN, Wu CH ( 2015) Bioinformatikk Kunnskap kart for Analyse av Beta-catenin Funksjon i Krepsen. PLoS ONE 10 (10): e0141773. doi: 10,1371 /journal.pone.0141773
Redaktør: Min Zhao, University of the Sunshine Coast, AUSTRALIA
mottatt: 24 juni 2015; Godkjent: 13 oktober 2015; Publisert: 28 oktober 2015
Copyright: © 2015 Celen et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer
Finansiering:. IC erkjenner republikken Tyrkia Ministry of National Education for finansiering henne under masterstudier. Dette arbeidet har vært støttet av National Science Foundation (tilskudd nummer: ABI-1062520 til CHW) og National Institutes of Health (stipend nummer: 5R01GM080646 og P20GM103446 til CHW). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Forkortelser : COSMIC, katalog av somatiske mutasjoner; eFIP, Trekke Funksjonell Impact of Fosforylering; GO, Gene ontologi; PPI, Protein-Protein Interaction; PRO, Protein ontologi; PTM, Post-translasjonell modifikasjon; RLIMS-P, Regelbasert litteratur Mining System for proteinfosforylering; siRNA, liten interfering RNA; STRING, søkeverktøy for henting av samspill Gener /Proteiner; TCF /LSF, T-Cell Factor /Lymfoid Styrking Factor; TcoF Dragon Database of Transkripsjons co-faktorer og transkripsjonsfaktor samspill proteiner; TRED, Transkripsjonell Regulatory Element Database
Innledning
Et vell av kunnskap som er relevant for de biologiske mekanismer for sykdom hos mennesker, inkludert informasjon om protein-protein interaksjoner (PPI), protein posttranslasjonelle modifikasjoner (PTMs ), er genet /protein uttrykk og sykdomsassosierte mutasjoner som finnes i den vitenskapelige litteraturen og bioinformatikk databaser. Selv om det er vanskelig å samle inn informasjon som er relatert til et gen /protein eller sykdom av interesse som er spredt over den vitenskapelige litteratur og plassert i spesialiserte databaser med inkompatible formater, til utvikling av systematiske arbeidsflyter integrere og analysere informasjon fra forskjellige kilder har potensial til å avdekke manglende koblinger og føre til ny innsikt i sykdommen etiologi og behandling.
kombinasjon av tekst gruvedrift verktøy for å trekke ut informasjon fra den vitenskapelige litteraturen, kuratert databaser, og ontologier, som gjør det mulig strukturert representasjon av enheter, relasjoner, og konsepter er en kraftig strategi for kunnskapsintegrasjon. I tidligere arbeid [1], har vi utviklet en bioinformatikk rammeverk for bygging av fosforylering-sentriske nettverk som ansatt Regelbasert litteratur Mining System for proteinfosforylering (RLIMS-P) tekst mining system for å trekke fosforylering hendelser fra den vitenskapelige litteratur og informasjon fra fosforylering og PPI databaser (f.eks PhosphoSitePlus [2] og intakt [3]), samt protein ontologi (PRO) for å representere fosforylerte proteinformer (proteoforms [4]) og Gene ontologi (GO) [5] for funksjonell annotering. Her utvider vi at rammene til flere informasjonstyper og bruke den til beta-catenin, en høyt studert protein med en rolle i sykdom, for å utvide anvendelsen av tilnærmingen til sykdom driver mekanismer.
Beta -catenin (genet navn:
CTNNB1
) er et multifunksjonelt protein som fungerer som både en celle adhesjon molekyl og transkripsjonen co-aktivator [6]. I metazoans, er koordinert gjennomføring av disse funksjonene avgjørende for embryonal utvikling og vedlikehold av vev integritet hos voksne organismer. Ved cellemembranen, er beta-catenin en kritisk komponent i adherens veikryss, strukturer som formidler celle-celle-kontakter i polariserte epitelvev. I kjernen, fungerer den som en transkripsjon co-aktivator av T-Cell Factor /Lymfoid Styrking Factor (TCF /LSF) familie transkripsjonsfaktorer, kjøring transkripsjon av målgener. Gratis beta-catenin i cytoplasma er raskt målrettet for ubiquitin-mediert degradering. Den subcellulære lokalisering og stabiliteten av p-catenin er regulert av ekstracellulære signaler, så vel som et komplekst nettverk av PTM arrangementer. Signalisering gjennom Wnt vei, utløses ved binding av Wnt ligand til celleoverflatereseptorer, stabiliserer beta-catenin og fremmer beta-catenin transkripsjonen aktivitet. Omvendt, fosforylering av Ser-45 på beta-catenin av kasein kinase I (CKI) etterfulgt av sekvensiell fosforylering av Thr-41, Ser-37, og Ser-33 fosforylering av glykogen syntase kinase,
GSK3B
skaper et gjenkjenningssete for ubiquitin ligase
BTRC
, som ubiquitinates beta-catenin, rettet mot den for nedbrytning av proteasome. Feilregulering av beta-catenin aktivitet er sterkt korrelert med kreft. Mutasjoner som fører til beta-catenin disassociation fra adherens veikryss og flykte fra ubiquitin-mediert degradering resultat i sin translokasjon til kjernen hvor den hyper-aktiverer transkripsjon av sine mål gener, hvorav flere har onkogen aktivitet [7].
I denne rapporten presenterer vi en beta-catenin kunnskap kartet bygget ved hjelp av vår kunnskap integrasjon tilnærming som omfatter molekylære relasjoner, protein sekvens funksjoner, og proteoform spesifikk funksjonell informasjon. Ved å fokusere på ulike undernettverk og funksjoner i kartet, adressert vi vitenskapelige spørsmål om den biologiske funksjonen til beta-catenin og dens rolle i kreft. Spesielt preget vi en gruppe av beta-catenin samspill proteiner som uttrykk er potensielt styrt av beta-catenin; vi foreslått en mekanisme for regulering av beta-catenin transkripsjonen aktivitet av cyclin avhengig kinase
cdk5
, som ble identifisert som en beta-catenin regulator i en storstilt miRNA-baserte knock-down skjerm av kinome [ ,,,0],8]; og til slutt, vi undersøkte beta-catenin kreftassosierte mutasjoner i forbindelse med annen sekvens funksjoner for å bestemme hvordan beta-catenin aktivitet kan endres på forskjellige krefttyper.
Resultater
Anleggs og karakterisering av Beta-catenin Knowledge Map
å utvide vår tidligere arbeid, har vi utviklet en bioinformaticsframework å fange opp og integrere viktige molekylære relasjoner og attributter for proteiner av interesse for bygging av kunnskapskart (fig 1). Den generelle tilnærmingen innebærer tekst mining å oppdage molekylære relasjoner i vitenskapelig litteratur, integrering av informasjon fra kuraterte databaser og ontologiske representasjon av informasjon. De litteratur gruvedrift verktøy og databaser som brukes kan skreddersys til de kjente rollene til proteinet som studeres; flere eksempler på ressurser som kan integreres er vist i figur 1. Fordi PTMs er viktige regulatorer av beta-catenin aktivitet, understreket vi inkorporering av rike PTM informasjon til kunnskap kartet beta-catenin. Fosforylering hendelser som involverer humant beta-catenin ble oppdaget i den vitenskapelige litteraturen med RLIMS-P, en litteratur mining system som identifiserer nevner av kinase, substrat, og fosforylering stedet i teksten [9]. De beta-catenin PTM proteoforms beskrevet i litteraturen var representert i PRO [10] og merket med funksjonell informasjon ved hjelp av GO vilkår [5]. Totalt har vi identifisert 13 menneskelige beta-catenin proteoforms fosforylert på ulike kombinasjoner av 15 forskjellige nettsteder (åtte seriner, to treoniner, og fem tyrosinene). Ytterligere informasjon om beta-catenin fosforylering, acetylering, og ubiquitinering, inkludert PTM enzymer og nettsteder, ble hentet fra bioinformatikk databaser. Vi bare integrert informasjon fra manuelt kuratert databaser med eksperimentell validering (i motsetning til resultatene av prediksjon verktøy), sammen med klare koblinger til støtte bevis, helst til artikler i den vitenskapelige litteraturen. For fosforylering informasjon, brukte vi vår nylig utviklet iPTMnet database (https://proteininformationresource.org/iPTMnet/), som gir en samlet presentasjon av PTM informasjon tekst-utvunnet fra den vitenskapelige litteraturen og fra flere av høy kvalitet kuratert databaser, inkludert PhosphoSitePlus [2] -og Phospho.ELM [11]. Å utvikle et helhetlig syn på rollen som beta-catenin i reguleringen av genuttrykk og sykdomsutvikling, utvidet vi kartet kunnskap til å omfatte beta-catenin samspill proteiner, inkludert transkripsjonsfaktorer co-aktivert av beta-catenin og sine mål, som samt beta-catenin sekvens funksjoner som PTM enzym bindingsseter og kreftassosierte mutasjoner.
Et nettverk av beta-catenin molekylære forbindelser er vist i figur 2. Den består av 727 forskjellige proteiner som deltar i 861 relasjoner (S1 Table), inkludert seks transkripsjonsfaktorer co-aktivert av beta-catenin (stiplet sorte kanter), 445 transkripsjonsfaktor-målet relasjoner (lilla kanter), 381 beta-catenin PPIs, og 29 PTM enzym-beta-catenin relasjoner ( 26 phosphorylations (blå kanter), to acetylations (rosa kanter), og en ubiquitinering (rød kant)). Integrering av slik kunnskap for protein av interesse ikke bare gir omfattende informasjon, men gjør det også mulig å bygge bro hullene i kunnskapen om proteinet på systemer nivå. For eksempel kan en forsker identifisere de manglende deler av en potensiell signalveien, transkripsjonsfaktor-target tilbakekoblingsmekanismer, eller komplekse regulering av multi PTMs (se nedenfor). Hvis nettverket omfattende fanger biologisk relevante beta-catenin molekylære relasjoner, da de biologiske prosessene knyttet til nettverksnoder skal være representative for de kjente roller beta-catenin. For å bekrefte dette, utførte vi GO sikt berikelse og funksjonelle klyngeanalyse, hvilke grupper beriket vilkår basert på antagelsen om at vilkårene knyttet til tilsvarende sett med gener er sannsynlig å være relatert til hverandre [12]. Høyanriket betingelser fra de ti klyngene er vist i TreeMap i figur 3. De kanoniske biologiske prosesser i hvilke beta-catenin er kjent for å delta-transkripsjon, celle bevegelse, og celleadhesjon-er representert i de ti klynger. Klynger av fosforylering og signaltransduksjon vilkår sannsynlig gjenspeiler fokus for nettverket på beta-catenin PTM, spesielt fosforylering. De gjenværende klynger omfatter reaksjon på hormon, sår /inflammasjon og apoptose, som alle er forbundet med Wnt /beta-catenin signalisering i litteraturen [13-15]. Dermed relasjonene i nettverket fange de mest fremtredende molekylære relasjoner av beta-catenin.
Nettverket viser forbindelser mellom beta-catenin (CTNNB1) PTM enzymer, samspill proteiner og transkripsjonsfaktorer co-aktivert beta-catenin og sine mål.
Beriket vilkårene ble gruppert i funksjonelle klynger. De mest høyanriket vilkår for de ti beste klyngene er vist i TreeMap, representert som ulike fargede blokker. For hvert semester, reflekterer boksen størrelse p-verdien av begrepet berikelse.
Identifikasjon av Potential Beta-catenin Transkripsjontilbakekoblingsmekanismer
Proteiner i nettverket som deltar i mer enn ett molekylære forhold er av spesiell interesse fordi de kan gi innsikt i reguleringen av beta-catenin og koordinering av sine mange funksjoner. For å demonstrere denne ideen, har vi brukt beta-catenin nettverk for å identifisere proteiner som kan være involvert i transcriptional tilbakemeldinger looper med beta-catenin. Tilbakekoblingsmekanismer, hvor produktet av en uttrykt genet stimulerer (positive tilbakemeldinger) eller undertrykker (negativ feedback) transkripsjons program som styrer det, spille en avgjørende rolle i cellulære transkripsjonsregulering. For eksempel, transkripsjonsfaktor
LEF1
, er blitt vist å delta i en positiv tilbakekoplingssløyfe med transkripsjonen beta-catenin. I tykktarm kreft celler, beta-catenin /
LEF1
komplekser kjøre transkripsjon av full-lengde
LEF1
isoform som kan binde beta-catenin på bekostning av en dominant negativ isoform. Det uttrykte
LEF1
deretter forbinder med beta-catenin å drive videre uttrykk for full-lengde
LEF1 product: [16].
Som beskrevet i figur 4A, vi tenkte at potensialet formidlere av tilbakekoblingsmekanismer kan bli funnet blant de proteiner som er både beta-catenin transkripsjons mål og beta-catenin samspill proteiner. Vi har identifisert en sub-nett av 35 beta-catenin samspill proteiner (inkludert seks beta-catenin kinaser og to transkripsjonsfaktorer co-regulert av beta-catenin), så vel som p-catenin selv som er mål for en beta-catenin regulert transkripsjonsfaktor (fig 4B). Således er disse proteiner som potensielt kan være regulert på ekspresjonsnivået av beta-catenin og også modulerer beta-catenin funksjon. Vi vil referere til disse proteinene som «target-interactors» for å reflektere dette dobbeltrolle.
(A) Arbeidsflyt for å identifisere beta-catenin transkripsjons mål som påvirker beta-catenin transkripsjonen aktivitet, og dermed delta i positive og /eller negative tilbakemeldinger looper. (B) Sub-nettverk av beta-catenin samspill proteiner hvis uttrykk er regulert av en transkripsjonsfaktor co-aktivert av beta-catenin ( «target-interactors»). Node fyllfarge indikerer effekten av samspill proteiner på beta-catenin transkripsjonen aktivitet. Noder med tunge grenser representerer gener som det er eksperimentelle bevis for transcriptional regulering av beta-catenin
Fem forskjellige transkripsjonsfaktorer regulerer uttrykket av målet-interactors.
LEF1
, et medlem av TCF /LEF familie transkripsjonsfaktorer; androgen reseptor
AR
; den CCAAT /Enhancer bindende protein C
EBPA
; østrogen reseptor
ESR1
; og den kjernefysiske faktor-B kappa P105 subenhet (
NFKB1
). Med unntak av
LEF1
, disse transkripsjonsfaktorene er ikke helt avhengig av beta-catenin for aktivitet; de kan arbeide med andre co-regulatorer eller starte sin egen transkripsjon. Derfor rådførte vi litteraturen for å finne ut hva som er kjent om bidraget fra beta-catenin til transkripsjon av målet-interactors vi identifisert. Femten av de mål-interactors pluss beta-catenin selv enten har vist seg å være regulert av beta-catenin i småskala studier (Wnt hjemmeside (https://web.stanford.edu/group/nusselab/cgi-bin/wnt /target_genes),.. Herbst et al, Tabell 1 [17] eller ble regulert av beta-catenin i minst to av tre kolon kreft cellelinjer undersøkt i en fersk genom-wide studie [17] Denne gruppen omfatter flertallet ( 6/8) av
LEF1
-regulated target-interactors, og også flere mål av
ESR1
,
NFKB1
, og
CEBPA plakater (fig 4B, noder med fet grenser). ti gener (
CCND1
,
juni
,
CCND2
,
EGFR
,
LEF1
MET
,
MMP7
,
MYC
,
TCF3
,
TERT
, og beta-catenin selv (
CTNNB1
)) var oppregulert av beta-catenin og to (
FOS Hotell og
CDH1
) ble nedregulert, for de resterende gener, retningen av beta-catenin effekten ble ikke rapportert.
ikke alle proteiner som samhandler med beta-catenin nødvendigvis påvirke transkripsjonen aktivitet. Derfor, neste skritt mot å identifisere potensielle transcriptional tilbakemeldinger meklere var å finne ut hvilken effekt, om noen, målet-interactors hadde på transkripsjonen regulering funksjon av beta-catenin (fig 4A). Vi søkte etter informasjon adressering effekten av mark interactors på beta-catenin transkripsjonen aktivitet ved hjelp av tekst mining muligheten til STRING databasen [18] og ved manuell gjennomgang av litteratur sitert av STRING som bevis for samhandling. For målet-interactors som er beta-catenin kinaser, vi også søkte den funksjonelle annotering av beta-catenin proteoforms i PRO som fosforyleres av disse kinaser. Basert på denne informasjonen, identifiserte vi 14 mål-interactors som øker (figur 4B, røde noder) og fire som reduserer (figur 4B, grønne noder) transkripsjonen regulatoriske aktiviteten av beta-catenin.
mark interactors som potensielt øke beta-catenin transkripsjonsregulerende aktivitet inkluderer beta-catenin seg selv og flere transkripsjonsfaktorer co-regulert av beta-catenin: tre TCF /LEF familiemedlemmer (
TCF3
,
TCF7L1
, og
LEF1
),
AR
, og
MITF
, som kontrollerer transkripsjon av melanocyte-spesifikke gener [19].
To beta-catenin kinases-
FYN Hotell og
EGFR
-også økning beta-catenin transkripsjonen aktivitet.
FYN
phosphorylates beta catenin på Tyr-142 og
EGFR
phosphorylates beta-catenin på Tyr-654. Proteoform bestemt merknad i PRO indikerer at Tyr-654-fosforylert beta-catenin har forbedret transkripsjonsrelaterte funksjoner (PR: 000044478). Videre Tyr-142 fosforylering reduserer beta-catenin tilknytning til adherens krysset, ved å hemme binding til alfa-catenin (PR: 000036860), henholdsvis. Reduksjon av tilknytning til adherens krysset øker pool av beta-catenin tilgjengelig for transkripsjonsregulering i kjernen. Tilsvarende to andre mål-interactors-
MET Hotell og
MUC
-dissociate beta-catenin fra adherens krysset og fremme dens translokasjon til kjernen [20,21].
mark interactors som reduserer beta-catenin transkripsjonsregulerende aktivitet handle via flere mekanismer: i) ved å fremme beta-catenin nedbrytning (for eksempel
GSK3B
phosphorylates beta-catenin på N-terminal nettsteder (PR: 000035772) som fremmer tilknytningen med ubiquitin ligase
BTRC Hotell og påfølgende nedbrytning); ii) via interaksjon med «inhibitorer» i kjernen (f.eks,
TFAP2A
direkte hemmer beta-catenin ko-aktivator-aktivitet ved å danne et kompleks med beta-catenin og adenomatøs polypose coli (
APC
) protein i cellekjernen [22]); og iii) ved å øke beta-catenin tilknytning til adherens krysset, og dermed binde den bort fra kjernen (f.eks E-cadherin (
CDH1
) forbinder med beta-catenin på adherens krysset [6]). Det er viktig å merke seg at beta-catenin transkripsjonen aktivitet omfatter både dets ko-aktivator og ko-repressor-funksjoner. Dermed gitt at beta-catenin har vist seg å undertrykke
CDH1
transkripsjon,
CDH1
lagring av beta-catenin vekk fra kjernen kan faktisk føre til en økning i
CDH1
uttrykk.
Interessant, kasein kinase II (
CSNK2A1 Hotell og
CSNK2A2
, figur 4B, blå noder) ser ut til å være i stand til å delta i positive eller negative tilbakemeldinger avhengig hvilke nettsteder på beta-catenin det phosphorylates. Fosforylering av beta-catenin på Thr-393 øker sin co-aktivator funksjon (PR: 000044474), mens fosforylering av beta-catenin på Ser-29, Thr-102, og Thr-112 (PR: 000037187) fører til sin tilknytning til adherens veikryss og destabilisering gjennom økt samarbeid med kinase
GSK3B
.
Analyse av kinase-signalering for Regulering av Beta-catenin transkripsjonen aktivitet
Multiple kinome dekkende små interfererende RNA ( siRNA) knock-down skjermer har blitt utført for å forstå effekten av kinase signalveier på beta-catenin aktivitet og sub-cellulære distribusjon. En slik studie identifisert en gruppe av kinaser som synes å positivt regulere beta-catenin co-aktivator aktivitet under normale forhold [8]. En av kinaser identifisert, men ikke videre karakterisert i studien, var
cdk5
.
cdk5
er et medlem av den cyklin-avhengig kinase familien av proteinkinaser implisert i utviklingen av nervesystemet og neuronal celleoverlevelse [23]. Nylig,
cdk5
er blitt vist å delta i en rekke biologiske prosesser utsiden av nervesystemet, inkludert noen av de samme fremgangs-transkripsjon, celleproliferasjon, celleadhesjon og-som er regulert av beta-catenin [24] . Cdk5, som p-catenin har også vært implisert i tumorgenese. For eksempel, fremmer cdk5 celle migrasjon og invasjon i bukspyttkjertelen kreftceller, og hemming av cdk5 undertrykker bukspyttkjerteltumorvekst og metastasering [25]. Aktivering av erbB2 (Her2) og cdk5 og påfølgende fosforylering av STAT3 transcriptional regulator er forbundet med celleproliferasjon i medullære thyroid tumorer [26]. Endelig spiller fosforylering av androgen reseptoren ved cdk5 en rolle i å drive prostata kreftvekst [27]. Dermed var vi interessert i å bruke beta-catenin kunnskapsnettverk for å identifisere mulige sammenhenger mellom
cdk5 Hotell og positiv regulering av beta-catenin co-aktivator funksjon som kan være relevante for kreft.
cdk5
phosphorylates beta-catenin på Ser-191 og Ser-246 (PR: 000037229); Imidlertid har effekten av denne fosforylering på beta-catenin transkripsjonen aktivitet ikke blitt rapportert. Selv om det fortsatt er mulig at
cdk5
direkte regulerer beta-catenin transkripsjonen aktivitet, så vi for bevis for at
cdk5
kan virke indirekte gjennom fosforylering av et annet protein i beta-catenin biologisk nettverk. Arbeidsflyten for denne analysen er presentert i figur 5A. Først identifiserte vi alle proteiner i beta-catenin nettverk som er rapportert å være cdk5 substrater i vår iPTMnet database. Det var 17 slike proteiner, inkludert to beta-catenin kinaser (SRC og PAK1), og ErbB3, en co-reseptor for to ekstra beta-catenin kinaser,
EGFR Hotell og
erbB2
. Videre rotte
ErbB2
er rapportert å være en
cdk5
substrat i PhosphoSitePlus [28]. Humant og rotte-beta-catenin er 99% identiske, og alle de kjente humane beta-catenin fosforyleringsseter er bevart; Dermed er det sannsynlig at menneskelig
ErbB2
kan også bli fosforylert av
cdk5
. Disse funnene øke muligheten for at
cdk5
kan indirekte regulere fosforylering av beta-catenin gjennom sin innflytelse på andre beta-catenin kinaser.
(A) Arbeidsflyt for å utforske effekten av cdk5 på beta- catenin transkripsjonen aktivitet. (B) Sub-nettverk av cdk5 underlag (blå noder) i beta-catenin nettverk (Trinn 1 av arbeidsflyt) (C) Under nettverk av cdk5 underlag valgt for videre studier (trinn 2 av arbeidsflyt). Pathways gjennom hvilke cdk5 kinase aktivitet påvirker beta-catenin (CTNNB1) fosforylering staten og transkripsjonen aktivitet vises.
Vi neste gjennomført en grundig studie av forholdet mellom cdk5, ErbB2, ErbB3, SRC, PAK1, og beta-catenin basert på tekstgruve resultater og PRO funksjonell merknader. Som vist i figur 5B, fosforylering av p-catenin ved
cdk5
og kinaser det regulerer fører til produksjon av fem fosforylerte proteoforms: en Tyr-654 fosforylert form (PR: 000044478, produsert av
EGFR
,
ErbB2
, eller
SRC
); en Tyr-333 fosforylert form (PR: 000037192, produsert av
SRC
); en Tyr-86 /Tyr-654 dobbelt fosforylert form (PR: 000037194, produsert av
SRC
); en Ser-191 /Ser-246 dobbelt fosforylert form (PR: 000037229, produsert av
cdk5
); og en Ser-663 /Ser-675 dobbel fosforylert form (PR: 000030192, produsert av
PAK1
). Med unntak av Ser-191 /Ser-246 fosforylert form, indikerer PRO merknad at alle disse formene er transkripsjonelt aktive. Vi brukte RLIMS-P til å identifisere setninger i litteraturen beskriver fosforylering av
ErbB2
,
SRC
, og
PAK1
av
cdk5 Hotell og manuelt gjennomgått artikkel seksjoner som inneholder setninger for å fastslå effekten av
cdk5
fosforylering på underlaget aktivitet. To av kinases-
PAK1 Hotell og
SRC
-Er hemmet av
cdk5 Hotell og en-
ErbB2
-er aktivert [28-30]. Dermed
cdk5
kan ha en tendens til å redusere beta-catenin co-aktivator funksjon gjennom sin effekt på
PAK1 Hotell og
SRC Hotell og øke co-aktivator funksjon gjennom dens virkning på
erbB2
. Nettoeffekten av
cdk5
vil være avhengig av nivåene av disse tre kinaser, deres relative affiniteter for beta-catenin og den cellulære sammenheng. Det faktum at
cdk5
fremmet beta-catenin transkripsjonen aktivitet i siRNA skjermen tyder på at dens rolle i
ErbB2
aktivering kan dominere. Interessant,
cdk5
har vist seg å svekke beta-catenin forbindelse med adherens krysset ved å fremme fosforyleringen av Tyr-654 [31]. Siden Tyr-654 er
ErbB2
fosforylering nettstedet på beta-catenin, er i tråd med vår hypotese om at
dette resultatet cdk5
aktiverer
ErbB2
, som igjen fosforylerer beta- catenin på Tyr-654, som fører til en forskyvning av p-catenin bort fra adherens krysset og inn i cellekjernen hvor det kan tjene som en transkripsjonen ko-aktivator. Videre, i kreftceller,
cdk5
,
ErbB2 /ErbB3
, og beta-catenin er knyttet sammen gjennom et annet medlem av beta-catenin nettverk-androgen reseptor (
AR
). I
ErbB2
-overexpressing brystkreftceller, beta-catenin co-aktiverer
AR
å kjøre transkripsjon av flere kreftfremmende mål, inkludert
ErbB3 {{}} product: [ ,,,0],32]. Som nevnt ovenfor,
AR
aktivering ved
cdk5
fosforyleringen har blitt identifisert som et cancer-drivmekanisme i prostata-tumorer [27]. Tatt sammen med resultatene av vår kinase analyse, disse observasjonene tyder på at cdk5 fosforylering av både
ErbB2 /ErbB3 Hotell og
AR
kunne drive en feedback loop, der
ErbB2 /ErbB3
fremmer beta-catenin transkripsjonen aktivitet som da bidrar til høyere uttrykk av
ErbB3
. Ved å kombinere kinase og underlaget informasjon i flere fosforylering databaser med fosforylering-fokusert gruve av vitenskapelig litteratur, identifiserte vi en vei å knytte beta-catenin til en oppstrøms kinase,
cdk5
, vist å påvirke beta-catenin co- aktivator aktivitet i et kinome omfattende siRNA skjermen.
Analyse av Kreft-Associated Beta-catenin mutasjoner for Cancer Klassifisering
Vi har samlet nesten 4100 kreftrelaterte missense mutasjoner på 137 av 781 rester av beta -catenin og kartlagt dem på beta-catenin sekvens merket med sekvens funksjoner som PTM områder og PTM enzym bindende motiver. Over 90% av kreftrelaterte mutasjoner skjedde i området som er kodet av ekson 3 av beta-catenin (restene 20 til 60). De seks beste hyppigst muterte nettsteder over alle krefttyper, sto for 6-25% av alle kreftassosierte mutasjoner i beta-catenin (fig 6A, røde prikker) omfatter CKI og
GSK3B
fosforyleringsseter (Ser -45, Thr-41, Ser-37, og Ser-33) og to svært konserverte rester i
BTRC
ubiquitin ligase anerkjennelse motiv (Asp-32 og Gly-34). Flere proteoforms fosforylerte på forskjellige kombinasjoner av de fire sterkt muterte fosforyleringsseter er blitt beskrevet i litteraturen (figur 6B). Mens tre av de fire proteoforms (fig 6B, danner en, to og tre) bind
BTRC
, gjør dem ustabile, den fjerde proteoform, fosforylert på Ser-45 bare (figur 6B, form 4, PR: 000035774), er funnet på adherens krysset i forbindelse med E-cadherin og i kjernen, noe som tyder på det kan spille en aktiv rolle i adhesjon og /eller transkripsjonsregulering [33].
PTM nettsider, PTM enzymet bindende nettsteder, og frekvenser av kreft mutasjoner i enkeltsetene er angitt. (B) Beta-catenin proteoforms fosforylert på kombinasjoner av de fire N-terminale fosforyleringsseter Tjen-33, Tjen-37, Thr-41, og Tjen-45 og deres funksjonelle merknads.
For å undersøke mønsteret av mutasjonsfrekvenser over enkelte krefttyper, utførte vi hierarkisk clustering analyse for 20 forskjellige vev basert på fordelingen av kreftassosierte mutasjoner over de seks mest mutert nettsteder kreft samlet (Asp-32, Ser-33, Gly-34 , Ser-37, Thr-41, og Ser-45). Siden den totale frekvensen av mutasjoner av disse områdene er lik vi anta lik frekvensen av mutasjoner i de samplede vev. Men fant vi to klynger med svært forskjellige mutasjoner profiler dukket opp fra denne analysen (figur 7A). Cluster 1 består av ni vev med mutasjoner hovedsakelig Asp-32, Ser-33, og Ser-37 og relativt få mutasjoner i Thr-41 og Ser-45 (figur 7A, blå boks). I kontrast, Cluster 2 består av fire vev med mutasjoner i Thr-41 og spesielt Ser-45 med få mutasjoner i
BTRC
bindende region (ASP-32, Tjen-33, Gly-34, og tjeneste- 37, fig 7A, rosa boks).