PLoS ONE: Bruk av hierarkisk Clustering til analyse av Protein Mønstre i Human Cancer-Associated Liver

Abstract

Bakgrunn

Det er to måter som statistiske metoder kan lære av biomedisinske data. En måte er å lære classifiers å identifisere sykdommer og å forutsi utfall ved hjelp av treningsdatasettet med etablert diagnose for hver prøve. Når treningen datasettet er ikke tilgjengelig oppgaven kan være til gruven for tilstedeværelse av meningsfulle grupper (klynger) av prøver og å utforske underliggende datastrukturen (uten tilsyn læring).

Resultater

Vi undersøkte proteomikk profiler av cytosoliske brøkdel av prøvene humane lever ved hjelp av to-dimensjonal elektroforese (2DE). Prøvene ble resected ved kirurgisk behandling av levermetastaser i tykk- og endetarmskreft. Unsupervised hierarkisk clustering av 2de gel bilder (n = 18) avslørt et par av klynger, som inneholder 11 og 7 prøver. Tidligere har vi brukt de samme prøvene for å måle biokjemiske profiler basert på cytokrom P450-avhengige enzymatiske aktiviteter og fant også at prøvene var tydelig delt i to godt adskilte grupper av klyngeanalyse. Det viste seg at grupper av enzymaktiviteten nesten passer perfekt til de gruppene som er identifisert fra proteomikk data. Av de 271 reproduserbare flekker på våre 2de geleer, valgte vi 15 å skille de menneskelige leveren cytosoliske klynger. Ved hjelp av MALDI-TOF peptid mass fingerprinting, identifiserte vi 12 proteiner for de utvalgte stedene, inkludert kjente kreftfrem forbundet arter.

Konklusjon /Betydning

Våre resultater markere betydningen av hierarkisk klyngeanalyse av proteomikk data, og viste overensstemmelse mellom resultatene av biokjemiske og proteomic tilnærminger. Gruppering av leverprøver menneskelige og /eller pasienter i ulike klynger kan gi innsikt i mulige molekylære mekanismen av legemiddelmetabolismen og skaper en begrunnelse for personlig behandling

Citation. Petushkova NA, Pyatnitskiy MA, Rudenko VA, Larina OV , Trifonova OP, Kisrieva JS et al. (2014) Bruk av hierarkisk Clustering til analyse av protein Mønstre i Human Cancer-Associated Liver. PLoS ONE 9 (8): e103950. doi: 10,1371 /journal.pone.0103950

Redaktør: Silvia Mazzuca, Università della Calabria, Italia

mottatt: 26 februar 2014; Godkjent: 04.07.2014; Publisert: 01.08.2014

Copyright: © 2014 Petushkova et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Arbeidet ble støttet av departementet for utdanning og vitenskap i den russiske føderasjonen, State kontrakt nummer 16.522.12.2002. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. To forfattere er ansatt også av et kommersielt selskap Postgen Tech LLC, men de gjorde ikke motta betaling eller tjenester fra selskapet for ethvert aspekt av innsendt arbeid (inkludert, men ikke begrenset til tilskudd, data overvåking bord, studere utforming, manuskript forberedelse, statistisk analyse, etc.). Dette endrer ikke forfatternes tilslutning til PLoS ONE politikk på deling av data og materialer.

Innledning

levermetastaser som regel gradvis skade leverfunksjon og er svært ondartet og ildfaste til konvensjonell terapi [1] . Forstå de molekylære og biologiske mekanismer for tykktarmskreft kan gi rom for utvikling av ytterligere terapeutiske strategier utviklet for å forebygge og behandle levermetastaser [2], [3]. Videre kan molekylære-baserte terapier forlenge tid til leveren tilbakefall etter kurativ reseksjon og kan forlenge pasientens overlevelse. Utvikling av mer effektive og mindre giftige kreft strategier også vil gi rom for tilpasning av terapiregimer i henhold til de molekylære funksjonene til den enkelte pasient [4].

proteomikk studier av leverprøver kan bidra til å identifisere spesifikke proteinmarkører for Metastaser [5]. En av de mest brukte fremgangsmåter for karakterisering av proteinkomponenter i biologiske systemer er to-dimensjonal polyakrylamidgelelektroforese (2DE) i kombinasjon med massespektrometri. Vanligvis er 2DE brukes til å sammenligne endringer i proteinnivå, modifisering, degradering og mellom behandlede og ubehandlede prøver [6]. Proteomikk endringer kan bli avslørt av gel bildeanalyse etter visualisering ved farging og identifisering av proteinarter med endret uttrykk eller i posttranslasjonelle stater [7].

De fleste studier basert på 2DE analyse av proteinprofiler i tykk- og endetarmskreft er utført på vev lysat av kolorektal adenokarsinom, ved normal tykktarmsslimhinne, og levermetastaser [8] – [10]. En slik strategi er i stor grad begrenset til tallrike proteiner (f.eks strukturelle proteiner, glykolytiske enzymer, katepsin annexins, og varmesjokkproteiner) som er overuttrykt i mange krefttyper [8]. Imidlertid kan disse proteinene hemme identifisering av lav-overflod proteiner, slik som membranproteiner, som spiller en fundamental rolle i cellesignalisering, celle-celleinteraksjoner, kommunikasjon og transport mekanismer, og er drug targets [11]. Målrettede tilnærminger forbundet med isolasjon fra klinisk materiale subproteomes, slik som secretome, proteasomet, plasmamembranfraksjonen, kjernematrise, etc., har nylig kommet til. Subcellulære fraksjonering kombinert med massespektrometriteknikker er en kraftfull tilnærming for å avdekke nye, lave rikelig, bestemte kolorektal-assosierte proteiner og kandidat biomarkører [8]. For eksempel ble 1687 protein flekker ble observert på storformat geler (24 x 33 cm) av en oppløselig proteinfraksjon av cancerøse og normal slimhinne vev, og det ble vist at intensiteten av ≥96% protein flekker ble spredt innenfor to-gangers forskjeller og 90,5% i løpet av 1,5-fold forskjeller [12]. For et menneske lever cytosoliske brøkdel på 17 × 24 cm gels, to ganger færre protein flekker (911 flekker) ble matchet [13]. 2de bilde analyser viste at antallet protein flekker ble vesentlig endret i primær kreft og levermetastatiske lesjoner. Visstnok membranfraksjonen av primærkreft og levermetastaser viste tap av proteininnhold (dvs. antall passet protein flekker på 2de geler) i forhold til membranfraksjonen av normal tykktarmsslimhinne [10]. Muto et al. [12] generelt rapportert at proteomet av normalt vev kan være mer homogen enn for tumorvev.

Tidligere beskrev vi en tilnærming til å diskriminere lever mikrosomale prøver i enkelte klasser basert på biokjemiske profiler [14]. I denne rapporten til en eksperimentell design sammenligne biokjemiske og proteomikk profiler blir presentert (figur 1). I det første trinn av denne fremgangsmåten ble det oppnådd den biokjemiske profilen. Det følger med 12 parametre, nemlig aktivitet av NADPH-cytokrom P450 reduktase, cytokrom P450 innhold og 10 cytokrom P450-avhengige monooksygenase aktiviteter med merke underlag. Rent fra ukontrollert statistisk analyse av biokjemiske profiler av humane levermikrosomer vi utledet at mønstre av leveren monooksygenase systemet dannet to godt adskilte grupper (figur 1, A). Det ble vist at minst 6 variablene var signifikant forskjellig mellom to store klynger av humane lever mikrosomale prøver med

p

-verdi 0,05 med Bonferroni korreksjon. I tillegg ble det funnet at forandringer i NADPH-cytokrom P450 reduktase-aktivitet utgjør den viktigste faktor som er ansvarlig for separasjon av biokjemiske profiler mellom to grupper av pasienter [14].

(A) Profilen inkluderte 12 parametere, nemlig aktivitet av NADPH-cytokrom P450 reduktase, cytokrom P450-innhold og cytokrom P450-avhengige mono-oksygenase aktivitet med markør substrater (Petushkova et al., 2010). (B) Profilen inkludert 2de bilder.

For å korrelere HLC protein profil, som definert av 2DE, med biokjemiske aktiviteter av mikrosomale systemet vi brukte tidligere innsamlede morfologisk normale leverprøver rundt levermetastaser av tykktarm kreft. Ultrasentrifugering protokoll ble anvendt under dannelse av humane lever cytosol og mikrosomale fraksjoner fra de samme leverprøven. Den aktuelle studien ble utført for å sammenligne prøve klynger som oppnås i henhold til mikrosomale biokjemisk aktivitet (figur 1, A) med de respektive cytosolic proteomikk profiler (figur 1, B). Videre var vi interessert i identifisering av løselige proteiner, som kan være noe relatert til aktiviteten til membranbundne cytokrom P450.

Materialer og metoder

Etiske prosedyrer

alle prøver fra rest leveren etter histologisk analyse ble godkjent av Institutt for patologisk anatomi av National Research Center of Surgery, russiske Academy of Medical Sciences (Moskva, Russland). Informert samtykke ble oppnådd fra alle pasienter. Enkeltpersoner enige om å delta i studien i henhold til lokale institusjon etiske komité av National Research Centre of Surgery. Prøver som har blitt beskrevet i tidligere publikasjoner [14], [15].

Chemicals

2- [4- (2-hydroksyetyl) piperazin-1-yl] etansulfonsyre, phenylmethanesulfonylfluoride (PMSF ), 2,5-dihydroksybenzosyre, etylendiamintetraeddiksyre (EDTA), nikotinamid-adenin-dinukleotid-fosfat, natrium-ditionitt, trypsin, og natriumdeoksycholat ble innkjøpt fra Sigma-Aldrich (St. Louis, MO, USA); acetonitril og trifluoreddiksyre ble kjøpt fra ICN Pharmaceuticals Inc. (Costa Mesa, CA, USA); Coomassie Brilliant Blue R-250 ble kjøpt fra Fluka (Seelze, Tyskland). Modifisert trypsin (katalog nr. V511C) ble oppnådd fra Promega (Madison, WI, USA). Andre kjemikalier ble kjøpt fra Reakhim-Penza, LLC (Penza, Russland).

2.3 Vevsprøver og forberedelse

Den menneskelige løselig leverproteinfraksjoner ble tilberedt på vår forrige undersøkelse (lagret ved -80 ° C før bruk) fra resekterte og kasserte massene av omkringliggende levervev, som ble tatt fra pasienter (n = 23) som gjennomgikk kirurgi lever [14]. Prøver av morfologisk normal lever (3-10 g) ble oppnådd fra den distale kanten av reseksjon, minst 5 cm av tumor. Prøvene ble diagnostisert av histopatologi.

Som besto med betingelsene for forsøket, vi ikke ta hensyn til noen personlig informasjon om pasienter eller om pasientbehandling. Men innsamling av prøver ble utført i henhold til følgende instruksjoner: (1) alle pasienter var under alvorlig kreftsykdom, noe som førte til operasjon av lever kanskje etter en forutgående kjemoterapi; (2) ingen strålebehandling ble utført før operasjonen; (3) ingen tegn av endokrin eller metabolsk sykdom; (4) ingen alvorlig infeksjon ble påvist; (4) pasientenes matbehov ble administrert av National Research Center of Surgery til en relativt ensartet standard; som et resultat av dette ble eksogene diett innflytelse på metabolsk profilering begrenset til det laveste nivå. De resekterte Prøvene ble plassert umiddelbart på is før innhenting av human lever mikrosomal fraksjon [14] og HLC. Alle forberedelser prosedyrer ble utført ved 0-4 ° C. leverprøvene ble homogenisert i to volumer av homogeniseringsbuffer inneholdende 1 mM EDTA, 1 mM ditiotreitol (DTT), 0,1 mM PMSF, og 150 mM KCl ved hjelp av et glass Potter-Elvehjem homogenisator med en teflon (Sartorius Stedim Biotech GmbH, Goettingen, Tyskland). Leveren Homogenatet ble suksessivt sentrifugert ved 10000 x

g

i 20 min og 105 000 ×

g

for 70 min. Pelleten (mikrosomal fraksjon) ble analysert som beskrevet i vårt tidligere studium [14]. I den foreliggende undersøkelse, ble supernatanten anvendt som HLC fraksjon. Proteinkonsentrasjonen av HLC prøvene ble beregnet ved hjelp av Bradford-analyse [16] med bovint serumalbumin som en standard.

prefraksjonering av HLC prøver før todimensjonal polyakrylamidgelelektroforese

Alikvoter av HLC (200 ul, 13,2 ± 5,6 mg protein) ble blandet med 1 ml kald 10% trikloreddiksyre (TCA) i aceton (v /v), inneholdende 0,07% merkaptoetanol. Etter en 3-timers inkubasjon ved -18 ° C ble blandingen sentrifugert ved 20.000 x

g

i 10 minutter (4 ° C). Supernatanten ble kastet og pelleten ble oppløst i 5 ml kald aceton inneholdende 0,07% merkaptoetanol, og sentrifugert som beskrevet ovenfor. Supernatanten ble kastet, og den resulterende pellet ble brukt for proteinseparasjon av 2DE.

To-dimensjonal polyakrylamidgelelektroforese (2DE)

2DE av HLC-proteiner ble utført som beskrevet av produsenten (Bio -Rad, Hercules, CA, USA). For hver HLC prøve ble den resulterende pellet ble oppløst i 200 ul av rehydratisering buffer (4 M urea, 2 M tiourea, 4% 3 – [(3-cholamidopropyl) -dimethylammonio] -1-propansulfonat, 50 mM DTT og 0,5 % ampholine). Proteiner ble lastet ved passiv rehydratisering på 11 cm, ikke-lineær, immobilisert, pH-gradient (IPG, pH 3-10) strimler over natten (14 timer) ved 50 V og i ytterligere 30 minutter ved 250 V. Isoelektrisk fokusering (IEF) var utføres ved hjelp av IEF Protean Cell (Bio-Rad) med en påført gradient 250-5500 V for en total av 35 000 V · time. Alle IEF trinn ble utført ved 20 ° C. Etter IEF ble IPG gel strimler ekvilibrert med ekvilibreringsbuffer (50 mM Tris-HCl, pH 6,8, 6 M urea, 2% natriumdodecylsulfat (SDS), 20% glycerol) inneholdende 1% DTT og ristet i 30 min ved 50 rpm på en orbital-rystemaskin [17]. De IPG strimler ble deretter overført til likevekt oppløsning, inneholdende 2,5% akrylamid, og ristet i ytterligere 30 minutter før separering på en polyakrylamidgel (135 x 80 x 1,0 mm, 4% strømpe gel, og 12% oppløsende gel). Separasjon i den andre dimensjonen ble utført ved anvendelse av mini-Protean Dodeca Cell (Bio-Rad) og Tris-glycin-buffer (25 mM Tris-base og 192 mM glycin), inneholdende 0,1% SDS, ved 150 V. Run Tiden var ca 60 min og ved utgangen av bromfenolblått inn i buffer, ble det elektro separasjon betraktes som komplett.

Protein visualisering og bildeanalyse

gel ble utsatt for sølvfarging [18], gel bildene ble anskaffet ved hjelp en GS-800 kalibrerte densitometer (Bio-Rad) og lastet inn i proprietær digital bildeanalyse programvare GelEditor. Det er skrevet i Java og supportsl verktøy for lasting av bilder, automatisert flekk deteksjon basert på Laplace av Gaussian filter, manuell flekk deteksjon, matching av protein profiler, og en mulighet til å lagre rapporter (Figur S1). Spot intensitet på gelen ble beregnet som summen av pikslene i et registrert manuelt spot. Den GelEditor programvare kan fritt lastes ned fra www.bioinformatics.ru/geleditor.zip.

I-gel fordøyelse

Protein flekker (~3 mm

3) ble skåret ut fra under anvendelse av modifisert 250-ul spisser og avfarget med 50 pl 100 mM K

3 [Fe (CN)

6] og 100 mM natriumtiosulfat i et forhold på 1:01 (v /v) per gel stykke ved romtemperatur i 30 min. Deretter ble gelbitene ble vasket med vann ved romtemperatur og ristet i 15 minutter ved 50 opm, på en orbital-rystemaskin. Prosedyren ble gjentatt tre ganger. Deretter ble gelbitene ble vasket to ganger med 150 pl av 50 mM NH

4HCO

3 i 50% acetonitril ved 37 ° C, ristet i 15 minutter ved 50 opm, på en orbital-rystemaskin, og inkubert i 15 min i dehydrering oppløsning (100% acetonitril). Etter at acetonitril ble fjernet og gelbitene ble tørket, 8 ± 2,0 mL av trypsin-oppløsning (25 ng /ul modifisert trypsin i 50 mM bikarbonat ammonium) ble tilsatt, og blandingen ble inkubert ved 37 ° C over natten. Deretter ble 15 ul av 0,7% trifluoreddiksyre tilsatt til hver gel stykke og prøvene ble inkubert i 2 timer ved romtemperatur. De ekstraherte tryptiske peptider ble brukt for massespektrometrisk analyse.

Matrix-assistert laser desorpsjon-ionisering time-of-flight massespektrometri (MALDI-TOF MS)

Hver blanding av proteolytiske peptider (1 mL) ble oppdaget på en MALDI mål (600/384 Anchor chip; Bruker Daltonik GmbH, Bremen, Tyskland) i tre gjentak og lufttørket. For ionisering, en oppløsning av 2,5-dihydrobenzoic syre (3 mg /ml) i acetonitril og 0,7% trifluoreddiksyre (01:01 v /v) ble anvendt. Massespektra i

m /z

spekter av 600-4000 ble manuelt anskaffet ved hjelp Flexcontrol programvare (Bruker Daltonik GmbH) i refleksjon /forsinket ekstraksjon modus med en akselererende spenning på 25 kV og en 135-ns forsinkelse hjelp den Ultraflex II MALDI-TOF MS analysator (Bruker Daltonik GmbH). Alle massespektra representert signaler i snitt 100 laser skudd fra ett sted på et utvalg spot. Fra hver prøve spot, ble 4-6 massespektra ervervet. Laser flytende ble justert ovenfor desorpsjon terskel av matrisen for å oppnå den beste oppløsningen, og den høyeste massemålenøyaktighet. Signaler med en S /N ratio 6 og maksimalt 100 topper per spektrum ble brukt til å bygge topp lister med SNAP algoritmen (FlexAnalysis programvare ver 2.0;. Bruker Daltonik GmbH) og internt kalibrert med trypsin autolyse-produkter (

m /z

842.5094 og 2211.1046 Da, henholdsvis). Dannede topplistene ble brukt til å søke mot UniProtKB /Swiss-Prot database (Uniprot slipper 2012_09 – 11 september 2012). Identifikasjon av peptid masse fingerprinting (PMF) ble utført ved hjelp av Mascot programvare (Matrix Science, Inc., Boston, MA, USA). Under databasesøk, ble et maksimum på en savnet spaltning tillatt, en masse toleranse på 80 ppm ble anvendt, og variable modifikasjoner, slik som metionin og cystein oksydasjon modifisering med akrylamid, ble tatt hensyn til. Den bevilget m /z toleranse (80 ppm) ble beregnet som totalvekt avviket basert på statistisk fordeling av masse feil i alt spektra og standardavvik.

Statistisk analyse

Den første datasettet besto av 19 prøver (2de gels), hvert preget i gjennomsnitt med 271 ± 99 protein spots /funksjoner (Tabell S1). Gel nei. 6 ble anvendt som hoved gel for manuell sted-til-sted justering. Siden vi var interessert i å sammenligne resultatene med tidligere kunnskap om biokjemiske profiler målt for de samme prøvene [14], vi også ekskludert gel nr.4 fordi i vår forrige undersøkelse ble det ansett som en avvikende; så vi hadde en samling av 18 gel bilder. For å sikre studie reproduserbarhet og redusere støy følsomhet, analyserte vi bare kvalitative forskjeller mellom gels i form av nærvær /fravær av en viss protein flekker. Hver gel ble replikert tre ganger, og de beste replika ble valgt ved visuell inspeksjon av separasjon kvalitet. Endelig datasett ble presentert som en binær matrise D består av 18 rader (geler bilder) og 389 kolonner (flekker) der

d

ij

= 1 hvis

j

-te sted var til stede på

i

-te gel, ellers

d

ij

= 0. For gel clustering, vi brukte Ward metode. Metrisk avstand mellom to binære vektorer ble definert som antallet av biter der disse vektorene varierer (også kjent som Hamming-avstand). Alle beregninger og grafikk ble utført med R statistisk språk (www.r-project.org). Kildekoden til dataanalysen skriptet kan bli funnet i dataanalyse Script S1. For å måle likheten mellom to data clusterings beregnet vi den justerte Rand indeksen hvis verdi er i området mellom -1 og 1, hvor 1 tilsvarer perfekt avtale mellom partisjoner.

Diskusjon

Resultater og

i våre forsøk alle prøvene ble tatt fra en kategori pasienter: kirurgisk behandlet for levermetastaser som følge av kreft i tykktarmen (figur 1). Derfor vårt mål var ikke å finne forskjeller mellom norm og kreft, men heller å utforske struktur inni en-gruppe datasettet, som beskriver menneskelige leveren narkotika-metabolizing system og cytosol fraksjonen (denne undersøkelsen). I forrige undersøkelse vedrørende legemiddelmetabolisme [14] til tross for relativt beskjedne utvalgsstørrelse (n = 22) vår resultatene utvilsomt bekreftet tilstedeværelsen av to klynger i data. Vi beregnet kriterier silhouette bredde for klyngen gyldighet, som viste at tilstedeværelsen av to klynger bekreftes med svært høy tillit (p 0,0001). Derfor avslørte heterogenitet innen ett like behandlet gruppe pasienter var en bakgrunn for den tiden rapportert proteomikk etterforskning.

2DE analyse av HLC

Studier på humane lever vev har blitt gjennomført for å finne ut om det er grupper av prøver særegne i sine proteom. Den HLC proteom var preget av en representativ samling av 19 prøver adskilt av 2DE på midten format gels i tre gjentak, og dermed totalt 58 2DE bildene ble undersøkt. De beste 2DE replikater ble valgt ut fra de tekniske forsøk i henhold til den separasjons kvalitet (fig S2). De valgte representative bilder ble konvertert til stedet lister og videre gruppert bruker uten tilsyn metoden. Konsekvent med vår tidligere arbeid med levermikrosomer her brukte vi en unsupervised tilnærming fordi den kliniske informasjonen om resected leverprøvene var utilgjengelig.

Vi har avvist noen prøver på grunn av lav kvalitet 2DE separasjon på grunn av særegenheter i prøveopparbeidelse (Figur 2). Den typiske 2de bilder av Ag-farget gel prøve no. 6 før og etter prefraksjonering med TCA i aceton (se Materialer og Metoder) er vist i figur 2,

en

og

b

. Uten prefraksjonering, 2DE av cytosol brøkdel hemmer utskillelse av protein flekker (figur 2

en

). Figur 2

b

er et representativt mester gel bilde som viser separasjon av proteiner fra menneske levervev etter TCA /aceton nedbør. Denne praksisen er ofte brukt for å fjerne forurensninger fordi det minimerer protein degradering [19], men TCA /aceton nedbør var utilstrekkelig til å skaffe egnede gel bilder av HLC prøve nos. 20-23, så vi ekskludert disse prøvene fra videre analyser. I alt ble 687 protein flekker løst på en sølv-farget 2DE gel fra HLC prøve nr.6, teknisk løp # 1, bruker punktdeteksjon verktøyet GelEditor programvare. I tillegg til sølvfarging basert på protokollen til Shevchenko et al. [18] Coomassieblå farging ble også undersøkt i denne studien og ca bare 100 protein spots ble oppdaget på samme gel nr.6 (figur 2

c

).

30 mikrogram av den menneskelige løselig leveren proteinfraksjon (HLC) ble separert ved 2DE og visualisert ved sølvfarging (

en

og

b

) eller Coomassie Brilliant Blue farging (

c

):

en

– HLC før forbehandling med trikloreddiksyre i aceton;

b Hotell og

c –

HLC etter forbehandling. Ved hjelp av Coomassie farging nesten 100 protein flekker kan bli avslørt, men ved hjelp av sølvfarging merking opp til 687 protein spots ble oppdaget automatisk. Flekker nos. 14, 25, 34, 36, 48, 56, 62, 63, 66, 210, 214, 219, 247, 252, 275, 276, 279, 301, 321, 322, og 408 er felles for alle 2de geler av 19 humane lever cytosol prøver.

De oppnådde gel bildene ble undersøkt for å karakterisere stedet reproduserbarhet og variasjon. Det ble observert at 96% av protein flekker var ved den nedre grense for påvisningsgrensen for sølv tiosulfat med en normalisert intensitet 0,02 relative enheter. En middels intensitet 0.02-0.04 heter ble observert for 2% av plassene, mens 1% av plassene var av høy overflod med relativ intensitet av . 0.1 enhet

Videre valgte vi master gel som den beste gel med høyest antall flekker og minimal spekter av spredning av gjennomsnittlig intensitet av hver spot. Hoved gel tilsvarte prøve noe 6. For å beregne teknisk variant av vår eksperimentelle oppsett, gjennomførte vi fire uavhengige replikative kjøringer av HLC prøve no. 6 til forskjellige tider. Ved første trinn i analysen benyttet vi antall flekker som et grovt mål på gel reproduserbarhet. Totalt 449, 420, 444, og 406 protein spots ble oppdaget i disse kjører i områder av pi 3,5 til 10,0 og MW 10-250 kDa. Den observerte gjennomsnittlig antall plasser var 430 ± 20, som var sammenlignbare med tidligere data fra cytoplasmafraksjonen av primære humane hepatocytter i HepG2 og Hep2B cellelinjer [20]. De gjenværende geler inneholdt tilstrekkelig færre flekker, som vist i Figur 3 for 19 HLC prøver. I hele serien, gjennomsnittlig antall oppdaget manuelt protein flekker var 271 ± 99 (gjennomsnitt ± SD, n = 58). Spot mengdene var tre ganger lavere i forhold til tidligere rapporterte resultatene av cytosoliske brøkdel analyse av humane lever vevsprøver [13], [21], [22]. Forskjellen i stedet antallet var sannsynligvis på grunn av 2DE oppsett, som vi brukte 11-cm IPG striper i stedet for 17 cm, som brukes av Wimmer et al. [13] og Kim et al. [23], og så gradienter for isoelektrisk fokusering var kortere. Kim et al. [23] analysert tumor og nontumor regioner av resekterte leverkreft vev ved identifikasjon av cytosoliske proteiner ved anvendelse av 2DE og MALDI-TOF-MS. De brukte sølvfarging for protein deteksjon på geleer og observert opp til 1060 plasser og identifisert 127 proteiner; De rapporterte også at et problem med variasjonen av stikk intensiteter ble bestemt ved hjelp av normaliserte intensiteter.

Gels tilhører cluster 1 er vist i hvite søyler. Geler som hører til klynge 2 er vist i grå kolonner. Gel som fjernet fra alle etterfølgende databehandling vises i den skyggelagte kolonnen.

For å evaluere gel-til-gel variasjon, sammenlignet vi flekker mellom fire replikert gel bilder hentet fra prøve no. 6 ved å bruke manuell flekk matchende trekk ved den proprietære GelEditor programvare (figur S1). Hver replikere ble manuelt justert til master image, som inneholdt et maksimalt antall plasser. Vi har funnet at 102 flekker var til stede i minst tre replikater, 80 flekker avstemt halvparten av gelene, mens 58 flekker var til stede på hoved gelen bare. Til slutt, 47% av stedene (209 flekker) matchet alle fire replikert 2de bilder.

For å bestemme reproduserbarheten av 2DE, vi undersøkt tekniske kjøringer av HLC prøven 6, analyserte de normaliserte intensiteter av hver spot, og plottet de mot hverandre på en X-Y og en quantile – kvantilregresjoner (Q-Q) plott [24]. De X-Y tomter til prøven nr.6, teknisk løp # 1 (master gel) sammenlignet med samme prøve, teknisk løp # 2 viser et Pearson korrelasjonskoeffisient r = 0,797 (Figur 4

en

). Vi utførte slike analyser for alle fire tekniske kjøringer av gelen 6 og bestemt gjennomsnittlig Pearsons korrelasjonskoeffisient som var lik 0,72 ± 0,06 (gjennomsnitt ± 95% konfidensintervall). Størrelsen av korrelasjonskoeffisienten r 0,7 foreslår en sterk korrelasjon, mens Q-Q plott ble anvendt som et grafisk verktøy for å sammenligne to fordelinger til hverandre. To datasett vil bli vurdert identisk hvis punktene i Q-Q tomter ligge nær en regresjonslinje

y = x

. Som vist i figur 4b dette kriteriet er perfekt oppfylt for HLC proteiner

Normaliserte stikk intensiteter fra to tekniske kjøringer av gelen no.- Y tomten og quantile-quantile. (Q – Q) plot. The X – Y plott viser sterk sammenheng mellom spot- intensiteter med en Pearson korrelasjonskoeffisient r = 0,797 (a). Q – Q plott viser høy likheten mellom spot- intensiteter distribusjon (b). Intensitet av hvert matchet flekk på gelen ble normalisert per intensiteten av matchede spots i denne gel.

Den svært reproduserbare flekker (209) ble brukt for å estimere spotintensitetsvariasjon over fire paralleller for HLC prøve no 6. i variasjonskoeffisienten (CV) fordeling histogram (se figur 5), ble 65% av stedene, karakterisert ved en CV 0,6. Denne graden av variasjon mellom de replikerte gels var sammenlignbar med CV observert mellom normalt vev vs. ulike kreft stadier [9], [25]. For eksempel, Shi et al. [9] observert en gjennomsnittlig CV på 62-69% i 1223 stikk funksjoner fra 18 2D-Dige stikk profiler blant ulike utvalgsgrupper (normal tykktarmsslimhinnen, primær tykktarmskreft og levermetastaser). Forfatterne fant at både primære og sekundære tumorer viste en betydelig høyere grad av base volumvariasjoner enn normal tykktarm.

Intensitet for hvert matchet flekk på gelen ble normalisert pr intensiteten av passet flekker i denne gel.

Generelt avhenger CV av type biologisk materiale, samt prøveforberedelser og punktdeteksjonsfremgangsmåter [26], [27]. I sølvfarging, samsvarende flekker forberedt og kjøres under identiske forhold varierer i intensitet; Derfor er det vanskelig å oppnå reproduserbarhet selv med parallelle replikater [26]. Derfor, som våre gels var dårlig reproduserbar i intensiteter av samsvarende flekker, vi bruker ikke intensitetsverdiene for videre analyse, men konverterte de plassene i binært format: enten det er et sted, eller ikke

3,2. unsupervised clustering av geler og mikrosomale prøver

Vi brukte klyngeanalyse for å skille gels og belyse grupper i vår samling av leverprøver. I begynnelsen var flekker på hver 2DE gel samles til flekker på master gel (nr. 6 # 1) med Perl-skript (Data Analysis Script S2). Våre resultater ble formatert inn i en tabell, hvor radene er angitt protein- flekker og kolonnene representerer HLC prøver. Dersom proteinet flekk var til stede på den HLC gelen og master gel, ble celleverdien satt til «1», ellers hvis flekken var fraværende på den neste HLC gel, ble det satt til «0». Vi utførte hierarkisk klynge-analyse av dataene ved hjelp av matrisen Ward metode kombinert med Hamming-avstand metrisk. Clustering av 2de gels av HLC prøvene ble visualisert som et dendrogram (Figur 6

en

). To store klynger var tydelig preget: den første (cluster nr.1.) Ble dannet av gels nos. 1-3, 5 og 7-13, mens den andre (cluster nr. 2) inkludert geler nos. 6 teknisk run # 3, og 14-19. Så ga Ward metode to grupper av leverprøver. Interessant, histogrammet i figur 3 preliminær pekt på eksistensen av to klyngene for HLC prøvene. Gjennomsnittlig antall manuelt oppdaget protein flekker på geleer fra klynger nos. 1 og 2 var 219 ± 72 og 342 ± 91 (gjennomsnitt ± SD), henholdsvis; Men forskjellen i antall plasser var statistisk ubetydelig (

p

0,05, n = 18)..

To store klynger kan ses

ifølge våre tidligere data, humanlevermikrosomer også segregert i to grupper [14]: den første inneholdt prøver nos. 1-3, 5-12 og 23, mens den andre inneholdt prøver nr. 13-22 (figur 1A). Dermed var det en sammenheng mellom prøve clustering kom fra to helt forskjellige eksperimentelle tilnærminger.

Rand indeksen var 0,58, noe som indikerer en betydelig kamp [27] mellom biokjemiske og proteomikk data. En liten forskjell mellom gruppe sammensetningen av HLC prøvene og den menneskelige levermikrosomal (legemiddel-metaboliserende) systemet ble funnet. Disse endringene var særlig HLC prøver nos. 6 og 13, overdratt til klynge nos.

Legg att eit svar