PLoS ONE: Klassifisere Ti typer større Kreft Basert på Reverse Phase Protein Array profiler

Abstract

Gathering enorme datasett kreft genomer krever mer effektive og selvstyrte prosedyrer for å klassifisere krefttyper og til å oppdage noen viktige gener for å skille ulike kreftformer. Fordi protein uttrykk er mer stabil enn genekspresjon, valgte vi omvendt fase protein array (RPPA) data, en kraftig og robust antistoff-baserte high-throughput tilnærming for målrettede proteomikk, for å utføre vår forskning. I denne studien foreslo vi en beregnings rammeverk for å klassifisere pasientprøvene til ti store krefttyper basert på RPPA data ved hjelp av SMO (Sequential minimal optimalisering) -metoden. En forsiktig funksjonen utvelgelsesprosedyre ble ansatt for å velge 23 viktige proteiner fra totalt 187 proteiner ved mRMR (minimum Redundancy Maksimal Relevans funksjonsvalg) og IFS (inkrementell funksjonsvalg) på treningssettet. Ved å bruke de 23 proteiner, vi lykkes klassifisert de ti krefttyper med en MCC (Matthews korrelasjonskoeffisient) fra 0,904 på treningssett, evalueres av 10-fold kryssvalidering, og en MCC av 0,936 på et uavhengig testsett. Ytterligere analyse av disse 23 proteinene ble utført. De fleste av disse proteinene kan presentere kjennetegnene til kreft; Chk2, for eksempel, spiller en viktig rolle i spredning av kreftceller. Vår analyse av disse 23 proteiner gir tilslutning til betydningen av disse genene som indikatorer på kreft klassifisering. Vi tror også våre metoder og funn kan kaste lys over funn av spesifikke biomarkører for ulike typer kreft

Citation. Zhang PW, Chen L, Huang T, Zhang N, Kong XY, Cai RT (2015) klassifisere ti typer større Kreft Basert på Reverse Phase Protein Array profiler. PLoS ONE 10 (3): e0123147. doi: 10,1371 /journal.pone.0123147

Academic Redaktør: Lukasz Kurgan, University of Alberta, CANADA

mottatt: 20 oktober 2014; Godkjent: 24 februar 2015; Publisert: 30 mars 2015

Copyright: © 2015 Zhang et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer

Finansiering:. Dette arbeidet ble støttet med tilskudd fra National Basic Research Program of China (2011CB510102, 2011CB510101), og Natural Science Foundation National of China (31371335, 81171342, 81201148 , 61401302), Innovasjon Program of Shanghai Municipal Education Commission (12ZZ087), tildeling av «The førsteklasses Discipline of Universities i Shanghai», Tianjin Research Program for Application Foundation og Advanced Technology (14JCQNJC09500), National Research Foundation for doktorgrads program of Higher Education of China (20130032120070, 20120032120073) og Innovasjon Foundation Uavhengig av Tianjin University (60302064, 60302069). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Identifisere kreftspesifikke gener involvert i tumordannelse og kreft progresjon er en av de viktigste måtene å forstå de patofysiologiske mekanismer for kreft og for å finne terapeutiske narkotika mål. Mange forsøk har vært gjort for å identifisere kreft biomarkører ved hjelp genuttrykk profiler [1]. Imidlertid er robustheten microarray-avledet biomarkører svært dårlig [2]; Dette er delvis fordi robusthet lett kan påvirkes i genuttrykk nivåer av små miljøendringer. Uten evalueringen av proteinet uttrykket nivåer, ville det ikke være noen måte å illustrere årsaker til tumor proliferasjon og differensiering. Derfor vil bedre forståelse av translasjonsforskning statene disse genomer bringe oss et skritt nærmere å finne potensielle narkotika mål og for å illustrere off-target effekter på kreftmedisin.

Omvendt fase protein array (RPPA) er en kraftig og robust antistoff-baserte high-throughput tilnærming for målrettede proteomikk som tillater oss å vurdere kvantitativt mål protein uttrykk i store prøvesett [3]. I denne prosessen, er eksempler på analytter immobilisert på den faste fase, og analytt-spesifikke antistoffer er benyttet i oppløsningsfasen. Gjennom å bruke sekundær tagging og signalforsterkning for å påvise bundne antistoffer, kan proteiner måles. Sammenlignet med konvensjonelle protein kvantifisere metoder, slik som western blotting eller ELISA, fordelene ved RPPA omfatter: storskala kvantifisering av protein, høy følsomhet, og små prøvevolum kravene [4]. Mens massespektrometri, som vanligvis brukes til å kvantifisere antallet fosforyleringsseter eller fosforpeptider, krever videre protein fordøyelse, peptid fraksjonering og phosphopeptide anrikning etter proteinekstraksjon, kan RPPA direkte kvantifisere det ekstraherte protein [5]. Anvendelsen av RPPA har blitt grundig validert for begge cellelinjer og pasientprøver [6], og det illustrerer mekanistiske innsikt bak sykdommer.

Foreløpig er krefttyper klassifisert av anatomiske stillinger der de er funnet, for eksempel lunge kreft, brystkreft, etc. Hvorvidt disse navnene kunne presentere sin proteomikk funksjonen er ikke bestemt før nå. Selv om det har vært noen metoder for å finne biomarkører signaturer for bestemte krefttyper, er det fortsatt lite forskning som blir gjort som vurderer ulike typer kreft som en helhet for å identifisere sine lignende eller distinkte proteomikk uttrykk mønstre og klasse funksjoner.

i denne studien foreslo vi en beregnings arbeidsflyt for å lykkes med å bruke 23 proteiner for å klassifisere pasientprøver i ti viktigste krefttyper. Først må vi tilfeldig delt de 3467 prøvene fra ti typer kreft i et treningssett med 2775 prøver og et uavhengig testsett med 692 prøver. Andelene av hver type kreft var lik i treningssettet og den uavhengige testsett. Deretter, med treningssettet, alle funksjoner for å skille gruppene ble rangert av de mRMR (minimum Redundancy Maksimal Relevans Feature Selection) kriterier. Med 10-fold kryssvalidering på treningssettet, SMO (Sequential minimal optimalisering) og IFS (Incremental funksjonsvalg) [7] metoder ble brukt for å velge en optimal funksjon sett. I alt 23 proteiner ble valgt fra treningssettet. Deres MCC (Matthews korrelasjonskoeffisient) for treningssettet var 0,904 evaluert av 10-fold kryssvalidering og deres MCC på den uavhengige testsettet var 0,936. Våre metoder kan gi klinikere med kunnskap om sentrale forskjellige biokjemiske egenskaper krefttyper, og kan kaste nytt lys over funn av spesifikke biomarkører for ulike typer kreft.

Materialer og metoder

datasett

De RPPA data ble lastet ned fra TCPA (Kreft Proteome Atlas) database [8] (https://app1.bioinformatics.mdanderson.org/tcpa/_design/basic/download.html etter Pan-Cancer 11 RBN ), som inneholdt proteomikk ekspresjon av 3467 kreftpasienter i 11 cancertyper (tabell 1). Fordi coad (Colon adenokarsinom) og LES (endetarm adenokarsinom) dele lignende patologi og ble analysert sammen i TCGA (The Cancer Genome Atlas) tykktarm og endetarmskreft studien [9], kombinert vi Coad og lese prøvene sammen som «Colon adenokarsinom og endetarm adenokarsinom «prøver. Derfor ble ti krefttyper analysert i følgende trinn.

Fordi vi ikke har en annen kohort å gjøre multisenter validering, vi tilfeldig delt de 3467 prøvene inn i et treningssett med 2775 prøver og en uavhengig testsett med 692 prøver. Forholdet mellom treningsprøvene i løpet av testprøvene var ca. 4: 1, og vi holdt andelen av hver krefttype omtrent den samme i treningssettet og det uavhengige testsett. Beskrivelsen av de ti krefttyper og deres prøvestørrelsene i er gitt i tabell 1. trenings- og testdatasettene er anordnet i S1 Fil.

Hver prøve inneholdt 187 proteiner viss ekspresjon ble målt med reversfase-protein array (RPPA). RPPA er et protein matrise som tillater måling av protein ekspresjonsnivåer i et stort antall prøver samtidig på en kvantitativ måte når høykvalitets antistoffer er tilgjengelige [4]. De 187 protein uttrykk nivåer ble ansett som 187 funksjoner som skal brukes for kreft typen klassifikasjoner i denne studien.

Feature utvalg

uttrykk nivåer av 187 proteiner kan ikke alle bidrar like mye til klassifisering . Den maksimale relevans minimum redundans (mRMR) metoden [10-13] ble benyttet til å rangere viktigheten av de 187 funksjonene i treningssettet. De 187 funksjoner kan bestilles ved hjelp av denne metoden i henhold til hver funksjon relevans til målet og i henhold til redundans blant funksjonene selv.

La Ω betegner hele settet med 187 funksjoner, mens Ω

s

betegner den allerede valgte funksjonssettet som inkluderer m funksjoner og Ω

t

betegner å-være-valgt funksjon sett som inkluderer n funksjoner. Relevansen

D

av funksjonen

f

i Ω

t

med kreft klassene

c

kan beregnes ved:

(1)

Og redundans

R

av funksjonen

f

i Ω

t

med allerede utvalgte funksjoner i Ω

s

kan beregnes ved: product: (2)

For å få den funksjonen

f

j

i Ω

t

med maksimal relevans med kreft klasser

c Hotell og minimum redundans med allerede valgte funksjoner Ω

s

, ligning (1) og ligning (2) er kombinert som mRMR funksjon: product: (3)

funksjonen evalueringen vil fortsette 187 runder. Etter disse evalueringene, en rangert funksjon listen

S

av mRMR metoden kan fås: product: (4)

Funksjonen indeksen h indikerer viktigheten av funksjonen. En funksjon med en mindre indeks h indikerte at det hadde en bedre avveining mellom det maksimale relevans og minimum redundans, og det kan bidra mer i klassifiseringen.

Basert på rangert funksjonen listen i mRMR tabellen vedtok vi trinnvis funksjonsvalg (IFS) metoden [14, 15] for å finne den optimale funksjon sett, eller en som oppnår den beste klassifiseringen ytelse. For å utføre denne metoden, ble funksjoner i mRMR tabellen lagt en etter en fra høyere til lavere rang.

Når en annen funksjon hadde blitt lagt til en ny funksjon sett ble generert. Og vi får 187 har sett, og i-te funksjonene er: product: (5)

Basert på hver av de 187 har sett, ble classifiers bygget og testet på trening satt med 10-fold kryssvalidering . Med Matthews korrelasjonskoeffisient (MCC) på 10-fold kryssvalidering beregnet på treningssett, får vi en IFS tabell med antall funksjoner og utførelsen av dem.

S

optimalt er det optimale verdier som oppnår høyest MCC på treningssett. Endelig modellen ble bygget med funksjoner fra

S

optimal på treningssett og hevet på testsettet.

Tips metoder

Vi tilfeldig fordelt i hele data satt inn i et treningssett og et uavhengig testsett. Treningssettet ble videre delt opp i 10 like store partisjoner. Den 10-fold kryssvalidering på treningssettet ble brukt til å velge funksjoner og bygge prediksjon modell. Den konstruerte prediksjon modellen ble testet på det uavhengige testsettet. Rammen av modellen bygging og evaluering ble vist i figur 1.

Først vi tilfeldig delt hele data satt inn i et treningssett og en uavhengig testsett. Deretter treningssettet ble videre delt opp i 10 like store partisjoner for å utføre 10-fold kryssvalidering. Basert på treningssettet, ble funksjonene valgt og prediksjon modellen ble bygget. Endelig ble bygget prediksjon modellen testet på det uavhengige testsettet

Vi prøvde følgende fire maskinlæringsalgoritmer:. SMO (Sequential minimal optimalisering), Ib1 (nærmeste nabo algoritme), Dagging, RandomForest (Random Forest), og velges den optimale å konstruere klassifikator. Den kortfattet beskrivelse av disse algoritmene var like nedenfor.

SMO metoden er en av de populære algoritmer for opplæring støtte vektor maskiner (SVM) [16]. Det bryter optimaliseringsproblemet av en SVM til en rekke av de minste mulige sub-problemer, som deretter løses analytisk [16]. For å håndtere multi-klasse problemer, parvise koblingen [17] anvendes for å bygge fler klasse klassifisereren.

IB1 er en nærmeste nabo klassifikator, hvor den normaliserte euklidske avstanden blir brukt til å måle avstanden mellom to prøver . For en spørring testprøve, er klassen av et trenings prøve med minsteavstand som er tilordnet testprøven som den forutsagte resultat. For mer informasjon, vennligst se Aha og Kibler studie [18].

Dagging er en meta klassifikator som kombinerer flere modeller som stammer fra en enkelt læringsalgoritme bruker atskilte prøver fra trening datasett og integrerer resultatene av disse modellene ved stemmeflertall [19]. Anta at det er en trening datasett som inneholder

n

prøver.

k

undergrupper er konstruert ved tilfeldig prøvetaking i uten erstatning slik at hver av dem inneholder

n

«prøver, der

kn

« ≤

n

. En valgt grunnleggende læring algoritmen er trent på disse

k

undergrupper, og dermed indusere

k

klassifiseringsmodeller

M

1,

M

2, …,

M

k

. For en spørring prøve,

M

i

(1≤

i

k

) gir en forutsi resultatet og den endelige spådd resultatet av Dagging er den klassen med flest stemmer.

Random Forest algoritmen ble først foreslått av Loe Breiman [20]. Det er et ensemble prediktor som består av formere beslutningstrær. Anta at det er

n

prøvene i treningssettet og hver prøve ble representert av

M

funksjoner. Hvert tre er konstruert ved tilfeldig velge

N

, med erstatning, fra treningssettet. Ved hver node, tilfeldig velge

m

funksjoner og velg optimalisert splitt for å vokse treet. Etter å konstruere formere beslutningstrær, er det spådd resultatet av en gitt prøve den klassen som får flest stemmer fra disse trærne.

Matthews korrelasjonskoeffisient (MCC)

MCC [21], en balansert måle selv om klassene er av svært ulik størrelse, blir ofte brukt til å evaluere resultatene av prediksjon metoder på en to-klasse klassifisering problem. For å beregne MCC, må man regne fire verdier: true positive (TP), falske positive (FP), sant negative (TN) og falske negative (FN) [22, 23]. Deretter kan MCC beregnes ved plakater (6)

Men mange problemer involverer mer enn to klasser, sier

N

klasser kodet av 1,2, …,

N

(

N

2). I dette tilfellet kan vi beregne MCC for klassen

jeg anbefale til dels måle ytelsen til prediksjon metoder ved å telle TP, FP, TN og FN som følgende måter:

TP

i

: antall prøver slik at klassen

i

er deres spådd klasse og sann klasse;

FP

i

: antall prøver slik at klassen

i

er deres spådd klasse og klassen

i

er ikke deres sanne klasse;

TN

i

: antall av prøvene slik at klassen

i

verken deres spådd klassen eller deres sanne klasse;

FN

i

: antall prøver slik at klassen

i

er ikke deres spådd klasse og klassen

i

er deres sanne klasse.

Derfor MCC for klasse

i

, betegnet ved MCC

i

, kan beregnes ved plakater (7)

Men disse verdiene kan ikke helt måle ytelsen til prediksjon metoder, er den generelle MCC i multiclass tilfelle fortsatt nødvendig. Heldigvis Gorodkin [24] har rapportert MCC i multiclass saken, som ble brukt til å evaluere resultatene av prediksjon metodene nevnt i avsnittet «Tips metoder». Parallelt vil MCC for hver klasse også gis som referanser. Her ga vi en kort beskrivelse av den samlede MCC i multiclass tilfelle som nedenfor.

Anta at det er en klassifisering problem på

n

prøver, sier

s

1,

s

2, …,

s

n

, og

n

klasser kodet av 1,2, …

N

. Definere en matrise

Y

med

n

rader og

N

kolonner, der

Y

ij

= 1 hvis

i

-te prøven tilhører klassen

j Hotell og

Y

ij

= 0 ellers. For en klassifiseringsmodell, kan dens anslåtte resultater på problemet være representert med to matriser

X Hotell og

C

, der

X

har

n

rader og

N

kolonner, (8) og

C

har

N

rader og

N

kolonner,

C

ij

er antall prøver i klasse

i

som har blitt spådd til å bli klasse

j

.

for matriser

X

og

Y

, samvariasjon funksjon kan beregnes ved (9) der

X

k Hotell og

Y

k

er

k

-te kolonne av matriser

X Hotell og

Y

, henholdsvis, og er middelverdien av tallene i

X

k Hotell og

Y

henholdsvis k

,. Deretter kan MCC i multiclass tilfelle bli beregnet ved den følgende formulering [25]: plakater (10)

I likhet med MCC i to klasser tilfellet MCC i multiclass tilfelle varierer mellom -1 og 1, hvor ett indikerer den perfekte klassifisering, -1 den ekstreme feilklassifisering.

diskusjon

de mRMR og IFS resultater

Ved å bruke maksimal relevans minimum redundans (mRMR) metoden

resultater og den 187 funksjoner ble rangert etter viktighet i treningssettet. Resultatet av mRMR tabellen kan bli funnet i S2 File.

I løpet av IFS tilnærming, ble hvert protein funksjon lagt en etter en. Klassifiseringen MCC som ble oppnådd ved fire prediksjon metoder, på treningssett evaluert av 10-fold kryssvalidering er presentert i S3 fil. Vi avbildet klassifisering MCC-ene som figur 2 fra dataene i S3 fil. Det kan observeres at de høyeste MCC for SMO, IB1, Dagging og RandomForest var 0,985, 0,937, 0,969 og 0,925, noe som indikerer SMO kan brukes til å konstruere en optimal klassifikator. Ved å nøye sjekke de antatte resultatene av SMO, kan det ses at ved å bruke de beste 23 proteiner, MCC nådde 0,904 som var den første rekkevidde over 0.900. Med mer proteiner, gjorde MCC ikke øke med mye. Derfor, i denne studien, vurderte vi de 23 proteiner som den optimale funksjonssettet og disse 23 proteinene ble ansett som de viktigste proteinene i å klassifisere disse ti typer kreft. Vi evaluerte sin prediksjon ytelse på den uavhengige testsettet og MCC var 0,936. MCC for hver krefttype kan bli funnet i S3 fil.

Plot å vise MCC-ene av de ulike klassifiserings konstruert av forskjellig antall protein funksjoner valgt fra mRMR tabellen under IFS prosessen på treningssett. Da de første 23 proteinene ble valgt, MCC nådde 0,904, som var den første rekkevidde over 0.900, og med flere protein funksjoner, gjorde MCC ikke øke mye. Vi vurderte de 23 proteiner som de mest betydningsfulle proteiner for klassifisering.

De valgte topp 23 proteiner for å skille krefttyper

Den valgte topp 23 proteiner er oppsummert i tabell 2. Disse proteiner kan spille viktige roller i å klassifisere de ti ulike krefttyper. De fleste av disse proteinene har blitt rapportert å være relatert til visse tumorer. For eksempel har claudin-7 blitt rapportert å være overuttrykt i brysttumorer [26] og nedregulert i hode og nakke karsinomer [27]. Tigar er oppregulert i colontumorer [28]. Gene forsterkning av ESR1 oppstår ofte med brystkreft [29]. PREX1 er sterkt uttrykt i prostata kreft [30]. Dermed er våre funn ytterligere bekreftet av disse tidligere resultater. Nedenfor vil vi diskutere den biologiske betydningen av de 23 proteiner i detalj basert på gen-funksjon, celle stier og biologiske funksjoner, som kan kaste lys over forskjellene av ulike kreftformer i protein expression nivåer. Vi hovedsakelig drøfte disse genene i seksjoner etter Robert A. Weinburg s [31]. For noen gener som ikke gjelder for kreft er kjennetegnene, prøver vi å sette disse genene med lignende funksjoner sammen for diskusjon (se figur 3).

De 23 utvalgte proteiner tilskrives syv seksjoner i hovedsak basert på kjennetegnene til kreft . For de som ikke er forbundet med kreft-relaterte pathways, setter vi gener med tilsvarende funksjoner sammen for å diskutere.

Forhindre celledød er avgjørende for utvikling av kreft fordi kreftceller er ofte resistente mot apoptotiske signalering forårsaket av DNA-skade og andre faktorer. I våre resultater, fant vi ett gen som er relatert til apoptotisk maskiner og kan brukes til å skille mellom forskjellige kreftformer. Her diskuterer vi NDRG1, samt tidligere funn som viser sitt forhold til kreft. NDRG1 (N-myc nedstrøms-regulert gen 1) er et fosforylert protein [32] som kan aktiveres av tumor suppressor genet p53 og som er nødvendig for induksjon av p53-mediert apoptose i kolon kreftcellelinjen [33]. Fordi NDRG1 protein har en avgjørende rolle i å hemme primær tumorvekst, er det godt kjent som en metastase suppressor i en rekke kreftformer, inkludert tykktarm, prostata og bryst kreft [34].

replicative udødelighet er en viktig kjennetegn på kreft, som er allment anerkjent som deregulert celleproliferasjon. Våre funn på flere viktige cellesyklusrelaterte gener i utvalgte proteiner illustrerer ikke bare deres betydning for utvikling av kreft, men er også først brukt som indikatorer på kreft klassifisering. Disse cellesyklusrelaterte gener er omtalt nedenfor: cyklin B1 har en rolle i regulering av cellesyklusen: før de går inn mitose, celler flip mellom G2 og mitose inntil det er tilstrekkelig opphopning av cyclin B for å støtte CDK1 aktivitet [35]. Feilekspriraert cyklin B1 i kjernen har blitt funnet i en stor andel av celler av noen svulster, og cyklin B1 har vært betraktet som en potent prognostisk faktor i humane bryst-karsinom og squamous cell carcinoma [36]. Cyclin E1, kodet av CCNE1, er ett av medlemmene av cyclin-familien, som kontrollerer cellecyklus-prosesser ved dramatisk periodisitet av overflod. Nylig har et genom-wide forening studie fant at rs8102137 i CCNE1 genet er assosiert med blærekreft [37]. Meta-analyse viser også at det er over-uttrykk for dette proteinet med brystkreft [38]. Chk2 (kontrollpunktet kinase 2), som en serin /treonin proteinkinase, kan svare på DNA-skade, for å opprettholde integriteten genomiske [39]. Det har vist seg at Chk2 spiller en viktig rolle i spredning av kreftceller [40], tiltrekker seg mye oppmerksomhet for å gjøre det en mulig anti-kreft legemiddel utforming target [41].

Det er klart at invasjon er et kjennetegn på kreft, selv om de underliggende mekanismene er fortsatt en gåte. Inntil nå, gevinst og tap av celle-celle feste proteiner er de viktigste årsakene til invasjonen, spesielt tap av E-cadherin [31]. I våre resultater, er E-cadherin og noen polaritet relaterte proteiner funnet som kan brukes til å skille mellom forskjellige krefttyper. Disse proteinene er omtalt nedenfor: E-cadherin, som type-1 klassisk cadherin, medierer celle-interaksjoner. Tumorprogresjon er ofte knyttet til tap av E-cadherin funksjon, som fører til en mer bevegelig og invasiv fenotype [42]. PREX1 (fosfatidylinositol-3,4,5-trisphosphate avhengig Rac utveksling faktor) blir høyt uttrykt i prostata cancer, noe som indikerer et forhold mellom celleinvasjon og dets ekspresjon [30]. I melanomer, ble PREX1 overekspresjon koblet til aktivering av ERK-MAPK og signalering som er nødvendig for effektiv melanoblast metastase så vel som for migrasjon [43]. Claudin-7, en felles transmembranprotein, spiller en viktig rolle i dannelsen og opprettholdelsen av permeabiliteten i polariserte epitelceller [44]. Den avvikende claudin-7 uttrykk profil er funnet i ulike svulster, som for eksempel høyt indusert claudin-7 uttrykk i både grunnskolen og metastatisk brystkreft svulster, [26] men det er nedregulert i hode og nakke Kreftsvulster [27]. Disse tidligere studier ytterligere understøttet våre funn at claudin-7 kan bli brukt som en biomarkør for differensiering og klassifisering av forskjellige tumorer. Rab-25, som et medlem av Rab familie av GTPases, Rab-25 er en konstitutivt aktiv Rab GTPase som spiller en avgjørende rolle i apikale resirkulering og transcytose trasé i polariserte epitelceller. Fordi tap av celle polaritet er et viktig kjennetegn på kreft, har Rab-25 relaterte trafficking en viktig innvirkning på epitelceller polaritet program i kreft progresjon [45].

Anomalous kreftcelle energiomsetningen ble først observert av Otto Warbugy i 1930 og har blitt akseptert som et kjennetegn på kreft. Unormal fettsyresyntese som en form for energimetabolisme er funnet i mange kreftceller [46]. Her er flere viktige fettsyrer og glykolytiske metabolisme-relaterte gener som finnes i de valgte 23 proteinene: FASN er et nøkkelenzym som er nødvendig for de novo syntese av fettsyre. Det har blitt funnet at den FASN ekspresjon og aktivitet blir unormalt forhøyet i mange typer humane cancere, som kan bidra til cellulær motstand mot narkotika og strålingsinduserte apoptose [46]. ACC1 er et hastighetsbegrensende enzym i de novo fettsyrer syntese. Det synes å være den begrensende enzymet i prolifererende kreftceller. ACC1 har blitt funnet å være oppregulert i prolifererende kreftcellelinjer så som prostata, bryst og lever. Faktisk har det vist seg at knock-down av ACC1 ved siRNA fremmer apoptose i prostatacancer og brysttumorceller, men ikke i kontroll noncancerous celler, noe som understreker kreftcellenes større avhengighet av dette enzymet enn normalt vev [47]. AMPK (AMP-aktivert proteinkinase, kodet for av genet PRKAA1 /2) spiller en avgjørende rolle i å avføle tilgjengelig energi og koordinere ytre vekstsignaler med cellulær metabolisme [48]. En reduksjon av AMPK signalering, for det meste forårsaket av tap av funksjons genet STK11, kan føre til økt aktivering av mTOR og en forskyvning mot glykolytisk metabolisme, som er funnet i en rekke kreftformer, inkludert NSCLC [49] og livmorhalskreft [50] .

Unormal uttrykk for hormonreseptorer blir ofte vist i sex-relaterte kreftformer, som brystkreft og prostatakreft. Tre hormonreseptorer er også rapportert i de utvalgte proteiner: progestin reseptoren (PR), som en kjernefysisk steroid-reseptoren, har en høy spesifisitet for binding av progesteron [51]. Det har vært vist i litteraturen at PR hindrer overgang fra G1 til S i cellesyklus og fremme apoptose i endometrial kreft celler [52]. I GOG119 fase II-studie, kan en østrogen surrogat heter tamoxifen forbedre progestin aktiviteten for å indusere PR og kurere endometrial pasienter [53]. Østrogenreseptor (ER, aktivert av hormonet østrogen) er en av de viktigste terapeutiske mål i brystkreft, gitt at korrelasjonen mellom ER ekspresjon og cellulær respons overfor østrogen [54]. Det har blitt rapportert at genamplifikasjon av ESR1 oppstår ofte med brystkreft [29]. Androgen reseptor (AR; NR3C4) antas å utelukkende formidle alle de biologiske virkninger av endogen, fungerende hovedsakelig i å regulere mannlig utvikling. På grunn av den sterke sammenhengen mellom ARS og prostatakreft, androgen antagonister eller androgen deprivasjon terapi har blitt brukt til å hindre kreftcelle spredning av pasienter med androgen-avhengige prostatakreft i klinisk behandling [55].

Overraskende, blant disse 23 markerte proteiner som brukes til å skille mellom forskjellige kreftformer, α-tubulin og GAPDH blir ofte brukt som kontroller i western blot-analyse. I den følgende delen vil vi diskutere kjente funn om α-tubulin og GAPDH som egner tiltro til gyldigheten av våre funn for deres betydning å skille kreft. For eksempel, både a- og p- tubulin proteiner er ansvarlig for montering mikrotubuli (MTS, cytoskeletal polymere strukturer), og visse posttranslational modifikasjoner. Den acetylering av α-tubulin (Lys-40) [56] kunne endre dynamisk oppførsel av MTS, noe som kan føre til endringer i biologiske funksjoner som MTS utfører under celledeling, migrering og intracellulær trafficking. Tar dynamiske parametere i betraktning, mts tilveiebringe et attraktivt mål for kjemoterapi mot raskt voksende tumorceller, for eksempel i lymfom og leukemi, metastatisk cancer, og langsomt voksende tumorer i bryst, eggstokk og lunge [57, 58]. I løpet av det siste tiåret, ble GAPDH (glyseraldehyd-3-fosfat dehydrogenase) regnes som en husholdningsgenet og var som en kontroll for lik belastning under den eksperimentelle prosessen. Imidlertid har det vist seg at GAPDH uttrykk varierer forskjellige typer vev. Videre GAPDH uttrykk varierer på grunn av oksygenspenningen [59], og uttrykket nivåer av GAPDH variere i egglederen kreft og eggstokk-kreft [60]. På grunnlag av GAPDH forkjærlighet for AU-rik elementer, har det vist seg at GAPDH kan binde til CSF-1 3’UTR som stabiliserer mRNA [60]. For å oppsummere, ved å kombinere alle bevis, tubulin proteiner og GAPDH kan bringe et nytt perspektiv på studier av kreft, og det er antydet at de ikke blir benyttet som kontroller i Western blot-analyse av forskjellige typer kreft.

Other utvalgt proteiner omfatter fosfataser, transkripsjonelle aktivatorer, linker proteiner og transferrin reseptorer: GATA3 er en transkripsjonen aktivator med høye ekspresjonsnivåer [61], og den tredje mest vanlige muterte genet i brystkreft [62]. Således har GATA3 vist seg å være en nyttig markør immunhistokjemisk å forutsi tumorresidiv tidlig i utviklingen av brystcancer. PEA15, som et multifunksjonelt bindende protein uttrykkes hovedsakelig i cellene i nervesystemet, så som astrocytter [63], kontrollerer en rekke cellulære prosesser, for eksempel celleoverlevelse, proliferasjon, migrering og adhesjon [64]. PEA15 funksjoner i ulike kreftformer, konkluderer med glioblastom, astrocytom, og melke, samt hudkreft. PEA15 kan ha både anti- (i ovarialcancer [65]) og pro- (glioblastom [66]) tumorigene funksjoner, avhengig av sine handlinger. TFRC er et transferrin reseptor. Det er en vesentlig jern importør i de fleste pattedyrceller. Det har vist seg at TFRC proteiner økning i bryst, ondartet kreft i bukspyttkjertelen, og andre krefttyper [67, 68]. PKCα kodes av PRKCA genet og er et serin og threonine- spesifikke kinase. Dette genet er sterkt uttrykt i flere kreftformer, og den høye aktiveringen av PKCα har blitt identifisert til å fremme dannelsen av brystkreft [69].

Legg att eit svar