Abstract
Prostatakreft (PCA) er den vanligste typen kreft hos menn og blant de viktigste årsakene til kreft dødsfall i den vestlige verden. I denne studien sammenlignet vi de enkelte protein uttrykk mønstre fra histologisk preget PCa og det omkringliggende godartet vev oppnås ved manuell mikro disseksjon ved hjelp av svært sensitive todimensjonal differensial gelelektroforese (2D-DIGE) kombinert med massespektrometri. Proteomikk data avdekket 118 protein flekker å være forskjellig uttrykt i kreft (n = 24) sammenlignet med benign (n = 21) prostatavevet. Disse flekker ble analysert ved hjelp av MALDI-TOF-MS /MS og 79 forskjellige proteiner ble identifisert. Ved hjelp av prinsipal komponent analyse vi kunne tydelig atskilt tumor og normalt vev og to forskjellige kreft grupper basert på protein uttrykk mønster. Ved hjelp av en systembiologisk metode, kunne vi kart mange av disse proteinene både til hovedveier som er involvert i PCa progresjon, så vel som inn i en gruppe av potensielle diagnostiske og /eller prognostiske markører. På grunn av kompleksiteten i den svært sammenhengende korteste vei nettverk, funksjonsundernettverk avslørt noen av de potensielle kandidat biomarkør proteiner for videre validering. Ved å bruke en systembiologi tilnærming, vår studie avdekket nye proteiner og molekylære nettverk med endret uttrykk ved PCA. Videre funksjonelle validering av enkelte proteiner er pågående og kan gi ny innsikt ved PCA progresjon som potensielt fører til utformingen av nye diagnostiske og terapeutiske strategier
Citation. Ummanni R, Mundt F, Pospisil H, Venz S, Scharf C , Barett C, et al. (2011) Identifisering av klinisk relevante Protein Targets i prostatakreft med 2D-DIGE Sammen massespektrometri og Systems Biology Network Platform. PLoS ONE 6 (2): e16833. doi: 10,1371 /journal.pone.0016833
Redaktør: Ming Tat Ling, Queensland University of Technology, Australia
mottatt: 30 august 2010; Godkjent: 16 januar 2011; Publisert: 11 februar 2011
Copyright: © 2011 Ummanni et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av det tyske føderale departementet for utdanning og forskning innenfor rammen av programmet for medisinsk genomforskning (Grants: 01GS0890, 01GS0892, 01GS0189). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Prostatakreft (PCA) er i dag den ledende kreft blant menn i vestlige land [1]. Obduksjon studier har avdekket at ca 30% av menn over en alder av 50 år og 80% av menn i 70-årene har mikroskopisk bevis for prostatakreft [2], [3]. I året 2007 i USA, anslagsvis 218,890 nye tilfeller diagnostisert og 27,050 mennesker døde av PCa [4]. Den (tidlig) deteksjonsraten og dermed forekomst av PCa har økt dramatisk på grunn av innføring av PSA-screening. Likevel, bestemmelse av serum PSA utstillings noen store begrensninger, som forhøyede nivåer tett korrelert med både hyperplasi og kreft.
To-dimensjonal elektroforese (2DE), et kraftig verktøy som brukes for proteinseparasjon og uttrykk profilering er en av kjerneteknologier i proteomikk [5], [6]. Proteinekspresjon analyse av pasient materialer er informative førte til identifisering av kreft spesifikke markører for diagnostikk, terapeutiske mål og er grunnlaget for å avsløre ulike cellulære hendelser assosiert med cancer progresjon [7]. Hittil har flere forskningsgrupper allerede er utført protein og gen-ekspresjon profilering studier av kirurgiske og biopsiprøver PCA [8] – [12], men det meste av det potensielle rapporterte markørene ikke er i klinisk anvendelse for definitiv diagnose av PCa. Men tidligere studier fokusert på inter sammenligninger av proteomikk analyser av radikale prostatectomies fra kreftpasienter til de av ikke-kreftpasienter med konvensjonell 2DE. Intra-individuell analyse av tumor og prøvene godartede vev (som grenser til tumor) fra de samme kreftpasienter kan redusere teknisk variabilitet og således tilveiebringe et middel for å øke spesifisiteten av resultatene og for å øke sjansene for å identifisere spesifikke sykdomsassosierte protein endringer.
i denne studien undersøkte vi sammenlignende proteomet av prostatakreft og dens tilstøtende histologisk godartet vev fra kreftpasienter med definitive patologisk karakterisering i vår 2-D differensial in-gel elektroforese (DIGE) system for protein 2-D elektroforese [13 ] og MALDI-TOF-MS /MS for protein identifikasjon. De differensielt uttrykte proteiner ble analysert ved MetaCore ™ (Gene GO) og oppfinnsomhet Pathway Analysis program (oppfinnsomhet Systems). De store huber av betydelige under nettverk ble validert ved real-time PCR-analyse. Systembiologi nettverksanalyse kan gi den potensielle rolle proteiner i ulike reguleringsveier som styrer PCa progresjon og forutsi nye biomarkører, som kan bli ytterligere validert ved hjelp av Western blotting og immunhistokjemisk (IHC) nærmer seg.
Materialer og metoder
kliniske prøver og etikk erklæringen
Vevsprøver og pasientdata ble oppnådd med informert skriftlig samtykke. Studien ble godkjent av etikkomiteen ved Universitetssykehuset Hamburg Eppendorf og utføres i samsvar med Helsinkideklarasjonen. For protein uttrykk analyse hele prostata ble samlet etter radikal prostatektomi fra pasienter med forhøyet PSA-verdier og preoperative patologisk undersøkelse på Martini klinikker, Hamburg, Tyskland. Pasientene fikk ingen preoperativ behandling. 24 pasienter ble valgt og tilsvarende kliniske og patologiske data leveres er i tabell 1. serum PSA nivåer av disse pasientene ble bestemt og alle pasientene hadde et område mellom 3,9 og 30,4 ng /ml (gjennomsnittlig PSA-verdi = 10,93 ng /ml) og en Gleason score mellom 3 + 3 og 4 + 5 [14], [15].
Etter radikal prostatektomi prøvene ble frosset i flytende nitrogen inntil bruk. Tumor og godartede områder ble markert på seksjonene. Vi ansatt manual mikro disseksjon metode for å skaffe patologisk karakteriserte materialer for vår proteomikk tilnærming. De tilsvarende områder på de resterende blokkene ble skiver med skarp kniv, forankret i Tissue-tek® og lagret ved -80 ° C inntil bruk.
Protein isolasjon og merking med CyDyes
Tissue var renset med fysiologisk saltvann (0,9% NaCl) resterende monterings materialer for å fjerne, merking fargestoff og blod. Skiver Vevene ble homogenisert direkte i DIGE lyseringsbuffer (30 mM Tris, 2 M urea Thio, 7 M urea, 4% CHAPS; 0,5 ml /200 mg vev). Det resulterende homogenat ble fjernet for å fjerne alle rester ved sentrifugering ved 12.000 g i 15 min ved 4 ° C ble supernatanten oppsamlet protein og dets proteinkonsentrasjon ble bestemt ved en modifisert Bradford assay [16]. Kvaliteten av prøvene for DIGE ble evaluert ved å mini 2DE (7 cm IPG strimler, pH 4-7). Proteinlysatene ble merket med Cy Fargestoffer i henhold til produsentens protokoll for minimal merking (CyDye DIGE Fluor minimal fargestoffer, GE Healthcare). For å minimalisere dye-spesifikk merking gjenstander, ble Cy3 Cy5-og merkemønster byttet blant den samme gruppen av prøver. En intern standard basseng med like mengder av hver proteinprøven (25 ug) ble benyttet for å redusere inter-gel variasjon. De samlede interne standarder ble merket med Cy2. 50 pg protein fra hver prøve ble merket med 400
p
mol av tilsvarende fargestoff på is i mørket i 30 minutter. Reaksjonen ble stanset /stanset med 10 mM L-lysin i 10 minutter under de samme betingelser.
DIGE-To-dimensjonal gelelektroforese (DIGE-2-DE)
Den første dimensjonen isoelektrisk fokusering ble utført ved hjelp av 24 cm immobilisert pH gradient tørre strimler (IPG) med en lineær pH-gradient 4-7. For analytiske geler, et par Cy3 og Cy5 merkede prøver (hver 50 ug protein) og 50 ug Cy2 merkede intern standard ble slått sammen og fylt opp til 150 mL med 2 x prøvebuffer (7 M urea, 2 M tiourea, 4 % CHAPS, 2% DTT) supplert med 2% (v /v) IPG buffer, pH 4-7). For rehydrering, fortynne prøvene med 2 x rehydratisering buffer (8 M urea, 4% CHAPS, 13 mM DTT) supplert med 1% (v /v) IPG buffer pH 4-7, og noen få korn av bromfenol blå) til sluttvolum på 450 ul. IPG strimler (24 cm, pH 4-7, GE Health Care) ble passivt rehydrert over natten ved 20 ° C i IPGPhor kassetter. For preparative geler, ble 750 ug umerket protein sammenslått fra like mengder av prøver anvendt. Proteiner ble separert ved protean IEF-systemet (Bio-Rad) med en programmert spenning gradient ved 20 ° C med en gjeldende grense på 50 uA per stripe i mørket under følgende forutsetninger: 4 timer ved 250 V, 8000 V lineær gradient 15000 V timer, raske 8000 V til 75000 V timer, for totalt 90 KVH. Etter IEF ble IPG strimlene ekvilibrert i buffer 1 (50 mM Tris-HCl pH 8,8, 8 M urea, 30% glycerol, 2% SDS og 0,5% DTT) og buffer 2 inneholdende 4,5% jodacetamid i stedet for DTT i hvert tilfelle etter 15 minutter.
andre dimensjon ble utført i PROTEAN® Plus Dodeca ™ Cell system. Den ekvilibrerte strimler ble påført på toppen av 12,5% SDS-PAGE-geler og forseglet med 1% agarose fremstilt i SDS-Tris-glycin-buffer med spor av bromfenol blått som en sporings fargestoff for å overvåke elektroforese. Polyakrylamidgeler (12,5%) ble støpt i lave fluorescens glassplater. Elektroforese ble utført med konstant spenning (80V) ved 20 ° C inntil fargestoffet fram nådde bunnen av gelen. Den komplette anordning er beskyttet mot lys. Etter elektroforese ble analytiske gel kassetter vasket med DDH
2o og tørkes med støvfritt silkepapir. Den Cy2 (intern standard), Cy3 og Cy5 merket proteiner i hver gel ble visualisert ved hjelp av en Typhoon 9400 ™ laserskanner (GE Healthcare) på 100 mikrometer tetthet ved hjelp av ulike eksitasjon og emisjonsbølgelengder direkte fra gels mellom glassplater. Optimale eksitasjon /emisjonsbølgelengder for fluorescens deteksjon er 488/520 nm for Cy2, 532/580 nm for Cy3, og 633/680 nm for Cy5. Fremstillings geler ble farget med Roti®-Blue, et kolloidalt Coomassie brilliant blå G250 flekken. I korthet, ble gelene fiksert i 40% metanol, 15% eddiksyre i minst 4 timer, og deretter nedsenket i kolloidal fargeløsning over natten. For å fjerne bakgrunnsfarging gels ble vasket i 20% metanol.
Bildeanalyse
Delta 2D differensial analyse programvare versjon 4.0 (Decodon GmbH, Tyskland) ble brukt i denne studien. For individuell gel-analyse, ble flekker detekteres, kvantifisert og normalisert i samsvar med volumforhold på tilsvarende flekker detektert i Cy2 bildet av den sammenslåtte-prøven intern standard ved hjelp av intern standard modul. Alle normaliserte stikk mengder fra de gels ble kollektivt analysert som to uavhengige grupper «Tumor» og «Benign», som gjør det mulig matching av flere gel bilder fra ulike pasienter for å gi statistiske data om gjennomsnittlig overflod for hvert protein plass blant de Dige gels inkludert i analysen . Tre geler fra godartet gruppe ble ekskludert fra analysen på grunn av problemet i DIGE merking. Elevens
t
-test ble utført for å vurdere den statistiske betydningen av ulikt uttrykte proteiner. Basert på gjennomsnittlige spotvolumforholdet, blir flekker hvis relative uttrykk endres minst 1,5 ganger (økning eller reduksjon) mellom godartede og svulster ved 95% konfidensintervall (t-test; p 0,05) ble ansett for å være betydelig. For påfølgende massespektrometri analyse betydelig spot-koordinater ble overført til Coomassie farget preparativ gel for spot plukking.
Massespektrometri
Utarbeidelse av peptid blandinger for MALDI-TOF-MS /MS.
Protein identifikasjon ble utført som beskrevet nylig [11]. Kort, proteiner ble fjernet fra Kolloidalt Coomassie Brilliant Blue farget 2-DE gels med en flekk cutter. Fordøyelse med trypsin og påfølgende spotting av peptid løsninger på MALDI-målene ble utført automatisk i Ettan Spot Håndtering Workstation. Gelbitene ble vasket 50 mM ammoniumbicarbonate /50% (v /v) metanol og med 75% (v /v) ACN. Etter tørking trypsin-oppløsning inneholdende 20 ng /mL trypsin i 20 mM ammoniumbicarbonate ble tilsatt og inkubert ved 37 ° C i 120 min. For peptid ekstraksjon, ble gelbitene dekket med 50% (v /v) ACN /0,1% (vekt /volum) TFA og inkubert i 30 minutter ved 37 ° C. Peptidet supernatant ble overført inn i en ny mikroplate og ekstraksjonen ble gjentatt. Supernatantene ble slått sammen og tørket fullstendig ved 40 ° C i 220 min. Peptidene ble oppløst i 0,5% (w /v) TFA /50% (v /v) ACN og flekket på MALDI-target. Deretter matrise-oppløsning (50% (v /v) ACN /0,5% (w /v) TFA) mettet med CHCA ble tilsatt og blandet med prøveoppløsningen ved aspirering av blandingen fem ganger. Før målingen i MALDI-TOF instrument ble prøvene tørke på målet 10 til 15 min.
MALDI-TOF-MS.
MALDI-TOF måling av spotted peptid løsninger ble utført på en 4800 MALDI TOF /TOF ™ Analyzer. Spektrene ble tatt opp i reflektoren modus i et masseområde 800-4000 Da med en intern ett-punkts kalibrering på den autolytiske fragment av trypsin (mono-isotopisk (M + H)
+ m /z ved 2211,104, signal /støy ≥10). I tillegg ble utført MALDI-TOF-MS /MS-analyse for de 5 sterkeste toppene i TOF-spekteret etter subtraksjon av topper tilsvarende bakgrunn eller trypsin fragmenter. Den innvendige kalibrerings ble automatisk utført som ett-punkts kalibrering hvis mono-isotop-arginin (M + H)
+ m /z på 175,119 eller lysin (M + H)
+ m /z ved 147,107 nådd en signal til støyforhold (S /N) på minst 5. Etter kalibrering et kombinert databasesøk av MS og MS /MS-målinger ble utført ved anvendelse av programvaren v3.6 GPS Explorer (Applied Biosystems, Foster City, USA). Peak listene ble sammenlignet med SwissProt rel.49 begrenset til menneskelig taksonomi eller IPI menneskelig v3.12 databasen ved hjelp av Mascot søkemotor 1.9 (Matrix Science Ltd, London, UK). Peptid blandinger som ga minst to ganger i mowse score på minst 56 for SwissProt eller minst 59 for IPI database resultater ble betraktet som positive identifikasjoner.
Bioinformatikk analyse av proteomikk data
Den betydelige forskjellig uttrykt proteiner og deres respektive biologiske funksjoner eller relasjoner ble bestemt ved hjelp av KEGG database (https://www.genome.jp/kegg/) og Entrez protein database (https://www.ncbi.nlm.nih.gov/sites /entrez? db = protein) fra NCBI. Protein nettverk for å analysere korteste trasé mellom de identifiserte proteinene ble bygget av MetaCore ™ (Gene GO) programvare og oppfinnsomhet Pathways Analysis (IPA) program (oppfinnsomhet Systems) for å identifisere molekylære partnere er involvert i bestemt sykdom. En mester globalt nettverk av alle differensielt uttrykte proteiner (input objekter) ble opprettet i henhold til publisert litteratur baserte merknader, og deretter ytterligere under nettverk ble bygget fra hovednettet for å fokusere på aktiverte eksperimenter og /eller veier. Knutepunkter ble identifisert basert på tilkoblingene og kanter med i nettverket. The protein uttrykk data ble analysert ved hierarkisk clustering og partisjon analyse med R-språk for å finne potensielle markører som kan klassifisere alle prøvene som svulst og godartet med høy sikkerhet. Den unsupervised clustering ble utført ved hjelp av Euklidsk avstand mål og tettbebyggelse metoden «gjennomsnittlig» av loggtransformerte verdier av alle vesentlige differensielt uttrykte proteiner av 45 prøver i analysen sett.
Lukk et al. viste at genom-wide differensialuttrykk mellom tumorer og vev kontroll kan karakteriseres ved anvendelse av hovedkomponentanalyse (PCA) ved hjelp av en malignitet parameter som karakteriserer koherente differensial uttrykk mønstre som er forbundet med tumordannelse. For å analysere effekten av ko-regulering av proteinekspresjon på biomarkør identifikasjon, og uten tilsyn PCA blitt anvendt på protein ekspresjonsdata (normalisert på logaritmisk skala), både fra tumorprøver og normalt vev. PCA ble utført i Matlab [The Mathworks Inc, versjon 14]. De resulterende Hovedkomponentene i PCA er veiet middel for de enkelte protein uttrykk, hvor vektene er automatisk identifiseres slik at den største variasjon av protein ekspresjon i datasettet kan forklares med de første hovedbestanddeler.
I for å unngå falske resultater fra utliggere, ble en to-trinns metode anvendes, hvor i et første trinn PCA ble påført på de opprinnelige dataene. Uteliggeren påvisning ble brukt på uttrykk for de viktigste komponentene. I det andre trinn ble den PCA utført uten uteliggere. De resulterende uttrykk verdiene for de stabiliserte hovedbestanddeler hvor anvendt for videre analyse. For å analysere forholdet mellom informasjon med hensyn på differensiell ekspresjon som er representert ved de første tre hovedkomponenter og den gjenværende plass, for hvert protein uttrykket verdier for alle vev, kvantifisert ved vektoren x
i, der delt i to komponenter: hvor x
p, i er den komponent i x
i som er representert ved de første tre hovedkomponentene i PCA (S3) og x
r, i kvantifiserer de gjenværende protein uttrykk i komplementære plass CS3 som ikke kan representeres ved de første tre hovedkomponentene i PCA. For å kontrollere fordelingen av differensial uttrykk mellom begge komponentene, for de opprinnelige dataene gitt av x
i, de PCA-baserte komponenter x
p, i, og de gjenværende komponenter x
r, blant annet to -sided t-test for differensial uttrykk mellom normale og tumorprøver er utført.
RNA isolering og målinger av genet transkripsjoner av interesser ved kvantitativ real time PCR
kvantitativ real Time PCR for analyse av transkripsjonelle nivåer av proteiner av interesse ble utført ved bruk av SYBR grønn som beskrevet tidligere. I korthet RNA ble isolert fra de samme biopsier brukes for proteom analyse ved hjelp TRIzol® reagens (Invitrogen, Karlsruhe, Tyskland) i henhold til produsentens protokoll. CDNA ble fremstilt ved revers transkripsjon av 1 ug total RNA ved anvendelse av oligo dTprimer (15mer) og M-MLV-revers transkriptase (Fermentas biovitenskap GmbH, Tyskland). Quanti tect primere for gener av interesse GAPDH (husholdningsgenet) ble kjøpt direkte fra Qiagen, Tyskland. Primersett ble vist å generere et enkelt fragment av ønsket størrelse evaluert ved RT PCR etterfulgt av agarosegelelektroforese. Kvantitativ real time PCR ble utført i termosykler (Stratagene, Tyskland) ved hjelp Dynamo Flash SYBR Grønn qPCR kit (Finnzymes, Finland). PCR for mål- og housekeeping gener ble utført i tre paralleller og mener relative uttrykk nivåer ble rapportert. Forhold for sanntids-PCR reaksjonen var som følger: 1 syklus med 94 ° C i 3 minutter og 40 sykluser ved 94 ° C i 20 s, 60 ° C i 30 s og 68 ° C i 30 sek. Ved slutten av PCR, ble prøver underkastet en smelting analyse for å bekrefte spesifisiteten av amplikonet. For å oppnå statistisk signifikans data innhentet ble analysert ved uparet student
t
-test utført og p-verdi 0,05 ble betraktet som signifikant
Western blotting
Protein ekstrakter ble atskilt med. 12% SDS-PAGE og elektroforetisk overført til PVDF-membran. Blokkering ble utført i 1 x Rotiblock oppløsning (Roth Chemicals), etterfulgt av inkubering av membranen med primært antistoff over natten ved 4 ° C. Overskudd av antistoff ble fjernet ved vasking med NaCl-Tris-Tween 20. Inkubering med sekundært antistoff konjugert til pepperrotperoksidase [anti- (muse-IgG) eller anti- (kanin-IgG), fortynnet 1:5000 i 1 x Rotiblock] ble utført i ett timer ved romtemperatur. Etter tre vaskinger ble reaksjonen utviklet ved tilsetning av LumiGLO substrat (Thermo). Den utsendte lys ble fanget på X-ray film (GE Healthcare).
Resultater
2D-DIGE analyse og massespektrometri
I denne studien, var vi i stand til å etablere en standard prosedyre for manuell mikro disseksjon av radikal prostatektomi prøver å skaffe patologisk evaluert svulst og godartet vev for proteom analyse. Videre, analyserte vi proteomet av prostata fra 24 kreftpasienter og deres tilsvarende godartet vev i 21 tilfeller (tabell 1) ved 2D-DIGE med PI området 4,0 til 7,0 og molekylvekt i området mellom 10 kDa og 120 kDa. Under disse forholdene, ble totalt 1324 plasser tydelig oppdaget og deretter analysert ved hjelp Delta2D programvare for differensial protein uttrykk. 118 plasser ble vesentlig endret i sin overflod blant alle prøvene som inngår i analysen sett og ble valgt for videre identifikasjon. De gjennomsnittlige Forekomsten av flekker ble kvantifisert og de med relative endringer i overflod større enn 1,5 ganger mellom godartet og svulst (opp eller ned) på 95% konfidensnivået (
p
0,05) ble ansett som vesentlig. Interessante stedene ble fjernet fra fremstillings geler og protein identifikasjon (ID) ved tryptisk i-gel fordøyelse og MALDI-TOF MS /MS-analyse. Etter en Mascot database søk ved hjelp av de innsamlede MS data 96 flekker av 79 proteinene ble identifisert som forskjellig uttrykt i kreft sammenlignet med godartet vev. Flekkene med protein ID er avbildet i figur 1. individuelle proteiner ble reflektert av flere spots mest sannsynlig på grunn av posttranslational endring som fører til skift i 2-DE. Proteinene identifiserte ble gruppert i ulike klasser basert på funksjonell informasjon tilgjengelig. De fleste av de identifiserte proteiner var enten cytoskeletal proteiner, enzymer av intermediære metabolisme, signaloverføring, varmesjokkproteiner, tumor-relaterte proteiner, oksidativt stress-relaterte proteiner eller proteiner med ukjent funksjon (figur 2B). Detaljer om protein identifikasjoner, protein score, sekvens dekning, teoretiske pI verdi og molekylvekt samt gjennomsnittlig relative endringen er vist i tabell S1.
Proteiner ble løst ved IEF over pI område 4-7, etterfulgt med 12,5% SDS-PAGE og kledde av Delta2D. Etter ekstraksjon fra vev, ble proteiner merket med Cy3 og Cy5. En intern standard bestående av like stor mengde av proteiner fra alle prøvene (godartede og PCA-grupper) ble merket med Cy2 og inkludert i alle geler. De grønne flekker indikerer downregulated proteiner, mens de røde flekker indikerer oppregulert proteiner ved PCA i forhold til tilsvarende godartet vev. De identifiserte proteiner som viste signifikant endret uttrykk i PCA er angitt med piler og merket med respectives protein IDer.
(A) Unsupervised clustering (Euklidsk avstand mål og «gjennomsnittlig» agglomeration metode) ble utføres ved hjelp av logg forvandlet uttrykk proteinverdier på 45 prøver. Prøvene er vist horisontalt, proteiner vertikalt. De dendrogrammer representerer avstandene mellom klyngene. I den øvre fargelinjen, er tumorprøver merket med rødt, er de normalt vev vises i grønt. (B) Biologiske prosesser regulert av alle vesentlige differensielt uttrykte proteiner vurdert av Gene ontologi søk og oppsummert i henhold til deres funksjoner.
hierarkisk clustering og partisjon analyse av prøver
Figur 2A viser clustering resultat. Høyere uttrykk er farget rød, lavere seg i grønt. Prøvene er vist i kolonnene og radene indikerer proteiner. De dendrogrammer representerer avstandene mellom klyngene. Tumor og godartede prøvene ikke danner to tydelig atskilte klynger. Men hierarkisk clustering avslørt en gruppe av svært lik tumorprøver (10 prøver) danner en klynge. Disse prøvene ble betraktet som en svulst subgruppe i ytterligere analyse. Skillevegg analyse av uttrykket verdiene resulterte i det funn at et enkelt protein, kan PPA2 klassifisere prøver med signifikans (Fisher test med p-verdi 6.682e-09). Tumoren undergruppe ble riktig klassifisert, en (av 14) av de gjenværende tumorer ble misclassified som godartet og tre (av 21) av de benigne prøver ble misclassified som tumorer (data ikke vist). Skillevegg analyseresultater er også vist mange proteiner kan klassifisere samtlige prøver på riktig måte (data ikke vist). I et forsøk på å tildele en PSA bestemt protein signatur, ble det ikke observert direkte sammenheng mellom Ptil og ulikt uttrykte proteiner (data ikke vist). Tatt sammen, mer enn ett protein kan skille alle prøvene som de ble tildelt i gruppene.
Principal komponentanalyse (PCA)
A 3-dimensjonal spredningsplott av de første tre hovedkomponentene i vevsprøver viser en god separasjon mellom tumorer og normalt vev (Figur 3A). Dessuten, figur 3B, som viser logaritmisk p-verdiene av de opprinnelige data x
i for hvert protein på x-aksen og komponentene x
p, i og x
r, i i y- aksen, viser at nesten alle differensial ekspresjon kan bli reflektert av den PCA-baserte komponent (røde stjerner).
(A) spredningsplott av de første tre hovedkomponenter av PCA fra proteinet ekspresjonsdata. De blå stjerner representerer normalt vev, mens de røde stjerner vise svulster. (B) Distribusjon av informasjon med hensyn til forskjells uttrykk mellom tumor og normalt vev. Hvert kryss representerer et protein. P-verdiene i tosidig t-test er representert ved x-aksen, mens anslagene (red: projeksjon på S3, blå: projeksjon på komplementær plass) er representert ved verdiene på y-aksen. Angivelig for alle proteiner med betydelig differensial uttrykk i de opprinnelige dataene (log10 (p) -2) differensial uttrykk for den gjenværende komponent (blå stjerner) er ikke signifikant (log10 (p) -1), mens p -verdier på PCA-baserte komponenter (røde stjerner) er lik de opprinnelige p-verdier (x-akse). (C-D) Median nøyaktighet og odds ratio på prediktiv tumor /normal klassifisering. De blå kurvene viser økningen av modellkvalitet ved økt utvalgsstørrelsen som brukes for biomarkør modell. De røde stjerner viser kvalitetene til logit modell basert på de første tre hovedkomponenter. (E) Utgangssignalet fra regresjonsmodellen (y-aksen) indikerer eksistensen av to klasser tumor ulike vesentlig i henhold til deres separability. Normalt vev (blå og grønne bokser) ved hjelp av protein uttrykk.
Tilsynelatende differensial protein uttrykk mellom tumorer og normalt vev kan ikke overdras til en enkelt protein, men ser ut til å avhenge av samlede protein uttrykk mønstre som er representert av bare tre komponenter i PCA, i henhold til resultatene som er beskrevet av Lukk et al. [17]. Derav alle (generisk, ikke-redundante) kombinasjoner av minst tre proteiner som kan måles med stor nøyaktighet bør være tilstrekkelig til å etablere biomarkører med lignende prediktiv ytelse, hvis proteinene viser et betydelig bidrag til de første tre hovedkomponentene i PCA. De respektive proteinet settet kan velges i henhold til kriterier eksperimentelle, ikke-redundans og betydningen av korrelasjonen til de respektive PCA komponentene. På grunn av byggingen av de viktigste komponentene i PCA som vektet hjelp av uttrykk for nesten alle proteiner, kan hovedkomponentene fylle rollen som en «indre støyfilter». Derfor er det riktig å uttrykke hver hovedkomponent av den gjennomsnittlige uttrykk for en (liten) gruppe proteiner for å dra nytte av den iboende støy undertrykkelse av gjennomsnitt også. Figurene 3C-D viser virkningen av midling. Ekspresjonen av hver hovedkomponent er blitt representert ved den gjennomsnittlige ekspresjon av 1-25 proteiner, som er tilfeldig valgt fra settet av 38 proteiner med høyest korrelasjon til hver hovedkomponent. Tilsynelatende nøyaktighet og odds-forholdet er avhengig av prøvestørrelsen av proteinene som benyttes for fremstilling av hovedkomponentene. Medianen av modell kvaliteter i samme størrelse av egenskapene til markører som er basert på en biologisk begrunnelsen, noe som indikerer at den differensielle ekspresjonen kan bli dominert av stor skala, skifter sterkt co-regulert protein ekspresjon på grunn av tumordannelse.
for å kontrollere den forventede prediktiv ytelse, en logit-modellen har blitt identifisert ved hjelp av bare de første tre viktigste komponentene i PCA. I kryssvalidering (leave-en ut) nøyaktigheten av prediksjon av tumor og normalt vev i test-settet var 86%. Tre (av 21) normalt vev og 3 (av 24) tumorvev har blitt feilklassifisert. Modellen viser at tumorer kan deles inn i to grupper avviker signifikant med hensyn til deres adskillelse fra normale vev (figur 3E og tabell 2). Statistiske tester viste ingen direkte relasjon av tumor grupper til de merkede tumor characterizations (Gleason score, PSA markør etc.). Derfor enten påvirkningsfaktorer bortsett fra protein uttrykk kan bidra til prostata tumor egenskaper, eller svært komplekse, ikke-monoton samarbeidsprosesser mellom proteiner har en innvirkning på tumor status som ikke er dekket av de viktigste komponentene i PCA brukes i logit regresjonsmodell. Funksjonelle klassifisering av de 26 identifiserte proteiner uttrykt forskjellig mellom de to gruppene tumor er oppsummert i figur 4A-C. En total på 70% av proteinene fra dette datasettet ble klassifisert til metabolske prosesser, og mer enn 60% ble klassifisert til katalytiske eller bindende funksjoner.
(A) De biologiske prosesser, (B) molekylære funksjoner og (C ) cellulære avdelinger regulert av ulikt uttrykte proteiner mellom begge kreftgruppene vurderes av Gene ontologi søk.
Nettverk analyse av identifiserte proteiner i kreft vs. godartede prøver
Pathways og nettverk som er involvert proteiner fra 2-D Dige experimentations forskjellig uttrykt ved PCA ble analysert ved hjelp av MetaCore ™, web-basert integrerende programvare. Nettverket arkitektur representerer forbindelser mellom de enkelte proteiner (noder).
I denne analysen hubs (viktige proteiner) av protein nettverk er foreslått å være de viktigste regulatoriske proteiner involvert i flercellede prosesser. Den innebygde korteste nettverket (figur 5A) avslører at c-myc, p53, androgen reseptor, 14-3-3-epsilon, vimentin, Ptil og østrogen reseptor en som nettverkshubene. Røde, grønne og grå piler indikerer negative, positive, og uspesifiserte effekter, henholdsvis.