PLoS ONE: Integrative proteomikk og Tissue microarray Profilering Angi foreningen mellom overexpressed serumproteiner og ikke-småcellet lungekreft

Abstract

Lungekreft er den ledende årsak til kreft dødsfall på verdensbasis. Klinisk, kan behandling av ikke-småcellet lungekreft (NSCLC) forbedres ved tidlig oppdagelse og risiko screening blant befolkningen. For å møte dette behovet, her beskriver vi bruk av omfattende peptid nivå fraksjonering kombinert med etikett gratis kvantitative proteomikk for oppdagelsen av potensielle serum biomarkører for lungekreft, og bruken av Tissue microarray analyse (TMA) og Multiple reaksjon overvåking (MRM) analyser for følgende opp valideringer i verifiseringsfasen. Ved hjelp av disse state-of-art, tilgjengelige kliniske proteomikk tilnærminger, i discovery fasen vi trygt identifisert 647 serumproteiner, og 101 proteiner viste en statistisk signifikant sammenheng med NSCLC i våre 18 funnprøver. Dette serum proteomikk datasettet tillot oss å skjelne differensial mønstre og unormale biologiske prosesser i lungekreft blod. Av disse proteiner, Alpha-1B-glykoprotein (A1BG) og Leucine-rik alfa-2-glykoprotein (LRG1), ble to plasma glykoproteiner med tidligere ukjent funksjon valgt som eksempler hvor TMA og MRM verifisering ble utført i et stort prøvesett bestående ca 100 pasienter. Vi har vist at A1BG og LRG1 ble overuttrykt i både blodkonsentrasjonen og tumorseksjoner, som kan bli henvist til å skille lungekreftpasienter fra friske tilfeller

relasjon:. Liu Y, X Luo, Hu H, Wang R, Sun Y, Zeng R, et al. (2012) Integrative proteomikk og Tissue microarray Profilering Angi foreningen mellom overexpressed serumproteiner og ikke-småcellet lungekreft. PLoS ONE 7 (12): e51748. doi: 10,1371 /journal.pone.0051748

Redaktør: Giuseppe Viglietto, Universitetet Magna Graecia, Italia

mottatt: 25 juni 2012; Godkjent: 05.11.2012; Publisert: 19.12.2012

Copyright: © 2012 Liu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette prosjektet ble støttet med tilskudd fra departementet for vitenskap og teknologi (2010CB912100, 2011CB910200), National Natural Science Foundation of China (91029301, 30821065, 81101760, 81172218, 81101761), Science and Technology Commission av Shanghai kommune (09JC1416302), Chinese Academy of Science Project (KSCX2-YW-R-106, KSCX1-YW-02), Fudan University (09FQ78) og Fudan University Cancer Hospital (YJ200804, YJ200701). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Lungekreft er den hyppigste kreft i verden, både når det gjelder forekomst og dødelighet. Ikke-småcellet lungekreft (NSCLC) står for 80-85% av lungekreft med en samlet 5-års overlevelse mindre enn 14% [1]. Spesielt er det 5-års overlevelse knapt 3% til 7% for stadium IIIB, og er mindre enn 1% for stadium IV sykdom [2]. Imidlertid pasienter diagnostisert på et tidlig stadium og har kirurgi erfaring et 86% totalt fem-års overlevelses [3]. Derfor er nye diagnostiske nødvendig for å påvise tidlig stadium lungekreft fordi det kan herdes med kirurgi. Flere potensielle protein signaturer som carcinoembryonic antigen, CYFRA21-1, plasmakallikrein B1 og neuron-spesifikk enolase har blitt oppdaget og klinisk brukes som biomarkører kandidater for lungekreft. Ikke desto mindre, ingen av dem viste tilstrekkelig følsomhet, spesifisitet eller reproduserbarhet [4]. Derfor er biomarkører for tidlig diagnostisering av lungekreft presserende behov.

Molekylære biomarkører for tidlig deteksjon av lungekreft kan ta mange former. Histologiske biomarkører er viktig fordi de kan være direkte knyttet til patologiske forandringer, risikoen for sammentrekning, tilstedeværelse eller stadium av sykdommen. De antas å ha potensiale til å skille de forskjellige molekylære mekanismer for sykdoms NSCLC. På den annen side, serum biomarkører for lungekreft er enda mer attraktivt, fordi blod er lett tilgjengelig og er antatt å erverve proteiner utskilt, skur, eller på annen måte frigjort fra vevene gjennom hvilken blodet sirkulerer. Selv noen moderate rikelig plasmaproteiner kan være indikatorer på spesielle kropps status og har blitt rapportert å svinge i takt med visse typer sykdommer [5].

Foreløpig sykdoms drevet proteomikk basert på massespektrometri har blitt introdusert til oppdagelsen av både histologiske og serologiske biomarkører. Til tross for betydningen av serum biomarkør oppdagelse, har en av de store tekniske utfordringer vært det faktum at blod proteom- er ekstremt komplisert, som spenner over et konsentrasjonsområde på minst ti størrelsesordener. Det er forventet at effektive uttømming metoder og multi-dimensjonale fraksjoneringssystemer kan være nyttig for å skille lav overflod proteiner og som strekker seg over deteksjonsgrensen [6]. Heri, brukte vi et omfattende fraksjonering på peptid nivå for å profilere albumin utarmet serum proteom-, med et unikt integrert flerdimensjonale væskekromatografi (IMDL) system utviklet i vårt laboratorium [7]. En annen teknikk hinderet er hvordan du raskt og effektivt sammenligne proteinnivået i ulike vev eller plasmaprøver. Vanligvis er disse prøvene er ikke kompatible med in vivo stabil isotop-merking formasjonen MS-baserte kvantifisering. Sekvensielt, blir in vitro merking strategier som iTRAQ [8] og akrylamid-isotoper [9] fremstår som alternativer. Likevel, disse teknikkene har begrensninger knyttet til kostnader, vanligvis mindre proteom dekning på grunn av merking selektivitet, anvendelighet og forskjeller i merking effektivitet. I denne studien har vi benyttet derfor en enkel og robust label-free kvantifisering (LFQ) strategi ved spektral telling i discovery fasen. Dessuten har det presserende behovet for reproduserbar MS analyse førte til utviklingen av flere reaksjon overvåking (MRM) teknikk. Denne teknikken kan brukes til å måle proteinkonsentrasjoner i kliniske plasmaprøver når de integreres med syntetiserte peptid standarder og absolutt kvantifisering analyse (AQUA). Bedre selektivitet, sensitivitet og dynamisk område kan oppnås ved MRM, som er avgjørende for klinisk validering [10].

Formålet med denne studien er først og fremst å bruke hagle proteomikk til direkte skjelne differensial serum proteomet mønstre forbundet med NSCLC sykdommer, for å forstå de regulerte serumproteiner i form av deres biologiske relevans, slik som molekylære aktiviteter, og å etablere en database med serum indikatorer for NSCLC. For det andre, å validere våre funn innsats, valgte vi to nye biomarkører kandidater -A1BG og LRG1-, ved hjelp av tradisjonelle verifikasjons tilnærminger, for eksempel vanlig western blotting og /eller vev microarray (TMA), samt MRM målinger i større utvalg kohorter.

Metoder

Etikk og innkreving av serumprøver

Blodprøver prøver~~POS=HEADCOMP fra nydiagnostiserte pasienter ble innhentet før noen behandling ved Institutt for Thoracic Surgery i Shanghai Cancer Hospital. Inklusjonskriteriene fag besto av bekreftet diagnose av NSCLC, ingen fjernmetastaser eller andre kirurgiske kontraindikasjoner. De skriftlige informert samtykke ble gitt av alle personene som er involvert i denne studien. Anonyme prøver fra pasienter ble tilfeldig valgt. Denne studien er godkjent av Institutional Review Board of Fudan University i Shanghai Cancer Center.

Serumprøver ble samlet inn og behandlet ved hjelp av den samme standardiserte protokollen. I korthet ble blodprøver igjen å koagulere ved romtemperatur i 30 minutter, sentrifugert ved 3000 g i 20 minutter (4 ° C), og supernatantene ble samlet opp, gjort til aliquoter og lagret i -80 ° C inntil analyse. Tidsintervall mellom behandling og frysing var ikke mer enn 2 timer for hver prøve. Ingen av prøvene ble tint mer enn to ganger før analyse.

delipidering og albumin reduksjon i serumprøver

delipidering og albumin uttømming i discovery fasen ble endret i henhold til tidligere rapporterte protokoller [11] , [12]. I korthet, for hver prøve, ble 50 ul uren serum fortynnet med 250 pl buffer (100 mM NaCl, 10 mM HEPES, pH 7,4) og sentrifugert ved 10.000 g i 30 minutter gjennom et 0,22 um filter (Millipore) for å fjerne lipider. Deretter ble 260 ul delipidert serum utfelt med 180 ul pre-avkjølt etanol (Sigma), inkubert i en time ved 4 ° C med forsiktig blanding, og sentrifugert ved 16000 g i 45 min. Albumin-fjernede pellets ble oppsamlet, frysetørket og resuspendert i 100 ul lyseringsbuffer inneholdende 8 M urea og 4% CHAPS, 40 mM Tris-base, 65 mM DTT og protease-inhibitor cocktail (Roche, Ltd.).

i-løsning fordøyelsen protein

protein~~POS=TRUNC blandingene ble inkubert med 10 mM ditiotreitol (DTT) ved 37 ° C i 2,5 timer, og carbamidomethylated med 20 mM jodacetamid (IAA) i 45 minutter ved romtemperatur i mørke. De alkylerte proteinløsninger ble utfelt ved fem volumer av pre-kald aceton /etanol (01:01, volum /volum) med 0,1% eddiksyre ved -20 ° C i 12 timer [13]. Proteinpelletene ble resuspendert i 50 mM ammoniumklorid-buffer (pH 8,3), og inkubert med trypsin (25:1, Promega) i 20 timer ved 37 ° C. Digerert peptider ble lyofilisert og lagret ved -80 ° C i massespektrometrianalyse.

Online todimensjonalt MS /MS-analyse av integrerte flerdimensjonal væskekromatografi

omfattende fraksjonering av serum peptider ble utført på vår Integrert flerdimensjonale væskekromatografi (IMDL) system som tidligere beskrevet [7]. I utgangspunktet ble en bi-fase integrerte kolonnen anvendt for å oppnå on-line todimensjonale HPLC-separasjon. Denne integrerte kolonnen inkluderte en sterk kation-kolonne (SCX, 320-um id, 50 mm lengde, Kolonne Technology Inc., California) og en revers fase (RP) kromatografikolonne (150-um id, 100 mm lengde, Kolonne Technology Inc.). Peptidet Blandingen ble først injisert med måler autosampler (ThermoFinnigan, San Jose, CA) og deretter fraksjonert ved 11 pH-trinnene (pH 2,5, 3,0, 3,5, 4,0, 4,5, 5,0, 5,5, 6,0, 7,0, 8,0, 8,5) ved hjelp en serie av pH-buffere (konfigurert av 5 mM sitronsyre justeres av NH

4OH). Forskjellige pH-buffere ble anvendt i den integrerte kolonnen ved anvendelse av en full løkke injeksjon av 100 ul ved 3 ul /min før det on-line RP-HPLC-gradienten. RP-HPLC-oppløsningsmidler som ble brukt var 0,1% maursyre (v /v) vandig (A) og 0,1% maursyre (v /v) acetonitril (B), med gradient fra 2 til 40% mobil fase B i 115 minutter ved 2 mL /min etter splitt. Massespektrometer ble benyttet var en lineær ionefelle LTQ (Thermo). En spenning på 3,0 kV ble påført på ESI nålen, og den normaliserte kollisjonsenergien var 35,0. Antallet av ioner som er lagret i ionefelle ble regulert av den automatiske forsterkningsregulering. Spektrene ble kjøpt i dataavhengig modus, med det alternativet som 10 mest intense ioner av hvert MS spekteret for MS /MS-analyse. Den dynamiske utelukkelse funksjonen ble satt som følger; gjenta teller tre, gjenta varighet 0,5 min, og utstøting varighet 1,5 min.

Protein identifikasjon

BioWorks ™ 3.2-programvarepakke ble brukt til å generere topp lister over alle kjøpt MS /MS spektra ( standardparametere), som så ble automatisk søkt mot humant International protein Index protein sekvens database (versjon 3.22, som inneholder 57,867 proteiner), ved hjelp av SEQUEST versjon 2.7 (University of Washington, lisensiert til Thermo Finnigan) søker programmet. For å estimere frekvensen av feil identifikasjoner (falske positiver), ble alle de filtrerte spektra utsatt for database søker mot et sammensatt database som inneholder humane proteinsekvenser i både forover (riktig) og revers (feil) retning [14]. I alle databasesøk, ble trypsin betegnet som protease, og bare en savnet spaltning ble tillatt. Maksimal massen toleranse ble angitt som 3 Da for forløperen ion og 1,0 Da for fragmentioner. Carbamidomethylation (57,0125 Da) ble søkt som en fast modifikasjon på cystein, og oksidasjon (15,99492 Da) ble satt som en variabel modifikasjon på metionin. En hjemmelaget programvare Buildsummary ble brukt til å slette de overflødige data som tidligere definert [15].

Proteiner ble identifisert med strenge kriterier. Spesielt benyttet vi den konservative naive target-lokkedue strategi, som anslår protein identifikasjon falske funnrate (FDR) analogt peptid-spektrum kamp (PSM) FDR, dvs. ved tilnærmet forventet antall falske positive protein identifikasjon med antall decoy protein identifikasjon [16]. Terskler for Xcorr Ifølge foreløpige PSM FDR lavere enn 1% og den ultimate Protein FDR lavere enn 5% ble brukt. All akseptert SEQUEST resultat må ha en ΔCn score på minst 0,1, uavhengig av ladetilstand [17].

Etikett gratis kvantifisering av spektral telling og statistikk

En enkel etikett gratis kvantifisering tilnærming ved hjelp av spektral telling ble brukt til å profilere serum proteom- mellom NSCLC og kontrollsaker [18]. Peptid-sekvens fyrstikker som er tilordnet hver gruppe protein ble summert sammen og tatt som grunnlag av den relative mengde [13], [17]. Saker i hver årsklasse ble behandlet som NSCLC relaterte biologiske replikat. Vi beregnet den relative berikelse faktor, R

e, definert som R

e = (n

f /n) /(N

f /N) for å prioritere overuttrykte og under-uttrykte proteiner [19 ]. I denne likningen er n

f er antallet peptid treff av et protein i en prøve, n er det totale antall av peptid treff i denne prøven, N

f er det totale treff antallet av dette proteinet i alle prøver , og N er det totale antall av peptid treff av alle proteinene i alle prøver. På grunnlag av R

e, utført vi ANOVA og student T test, ved hjelp av en permutasjon test på 200.000 ganger i Pomelo II [20]. Den Receiver Operating Characteristic (ROC) analyse ble utført av Proc pakken i R [21]. I ROC analyse av en biomarkør panel, vi brukte logistisk regresjonsmodell for å vurdere utfallet av panelet, som innlemmet kandidatene vi ønsker å inkludere i panelet (det vil si ved hjelp av blokk oppføring av variabler) sammen med sannsynligheter. Denne modelleringen ble utført i SPSS (v13.0). De predikerte sannsynlighetene for forekomst av hendelsen (for eksempel kreft eller normal) ble innlemmet som predikator i ROC tomten; og Areal under ROC-kurven (AUC) ble beregnet for å beregne kraften av panelet [22]. Hierarkisk clustering analyse (HCA) og hovedkomponentanalyse (PCA) ble utført ved R programvare (https://www.r-project.org/), ved hjelp av quantile normaliserte verdier av logaritmisk transform spektrale teller, er at, ved transformasjon av log

2 (spektrale teller +1) for hver serum protein i hver prøve.

Tissue microarray analyse (TMA)

Immunhistokjemisk (IHC) farging ble utført ved hjelp av microarray kjøpt fra Shanghai overgå Biotech Co .. i korte, formalinfikserte, parafininnstøpte seksjoner fra 90 NSCLC pasienter, som består av 44 lunge adenokarsinom (AD), 38 plateepitelkarsinom (SCC), og 8 tilfeller av andre undertyper, ble deparaffinized og vannes ut. Endogen peroksidase ble stanset med 3% H

2o

2 (v /v). Etter antigen gjenfinning og blokkering ble snittene inkubert med kanin polyklonale anti-A1BG (1:100, Life Biosiences), kanin polyklonale anti-USP1 (01:25, Abgent), mus monoklonalt anti-Mucin5B (01:25, Millipore) og mus monoklonalt anti-LRG1 (fortynning 1:200, Abonva) ved 4 ° C over natten. Etter en skylling med PBST løsning, ble delene inkubert sekvensielt med biotinylert sekundært antistoff og ABC-reagens (Vectastain), etterfulgt av behandling med DAB-løsning (Shanghai Sangon Biological Engineering Technology Service Co). Endelig seksjonene ble kontra med Hematoxylin QS (Vectastain). Blant de 90 tilfellene ble bare én sektor tapt under behandlingen, noe som resulterer i 89 NSCLC seksjoner gyldig med sine sammenkoblede røyk svulst kontroller.

IHC lysbilder ble revidert av to patologer (XL, og HC), blinde for alle clinicopathologic data. Resultatene ble beregnet ved deres uavhengige evalueringer, og bedømt ved beregning av prosent (P) av celler som viser karakteristiske farging (fra upåviselig nivå eller 0%, til homogen farging eller 100%) og ved å beregne intensiteten (I) for farging (0, ingen visuell flekker, en, svak farging, 2, moderat farging, eller tre, sterk farging). Prosentandelen ble bestemt av hvor stor andel av alle de positive celler, uten intuitive dom celletyper. De prosentvise verdier ble deretter slått sammen til en P score fra 0 til 9, som svarer til de i området fra 0-5%, 5-15%, 15-25%, 25-35% og 85-100% endelig. Som vi foreslått i en tidligere studie [13], ble den relative protein uttrykk i histologisk nivå scoret ved å multiplisere P poengsum av intensiteten verdien jeg, dvs. ved den såkalte raske score (Q) (Q = P × I; minimum = 0 og maksimum = 27).

Western blotting

Vi utførte western blot analyse i 12 tilfeldig utvalgte trillinger av normal, AD og SCC sera. Proteinprøver ble løst på en 12% polyakrylamidgel og overført til PVDF-membran (Pall Inc.). Kanin polyklonale anti-A1BG (Life Biosiences) ble fortynnet som produsentens anvisninger og brukes til å sondere blot. Immunodection ble realisert ved hjelp av ECL pluss reagenser (Amersham Biosciences) og ble utsatt for røntgenfilm (Kodak). Etter slutt WB bilder ervervet, heter et bilde programvare Multi Gauge (v3.0, FUJI FILM CO. LTD) ble brukt til å trekke ut de protein expression data fra IOD verdi.

LC-MRM måling

Fire isotopiske peptider tildelt A1BG og LRG1 (to per hvert protein) ble syntetisert ved hjelp av standard Fmoc kjemi innarbeidet med ren, tung [

13C

6] leucin (Sigma-Aldrich). Umerkede [

12C] former for hvert peptid ble også syntetisert (GL Biochem, Kina). Alle syntetiske peptider ble renset til . 95% renhet med mengden rapportert fra leverandør

Peptider fordøyd fra 0,1 mL råolje serum (for 70 NSCLC prøven og 30 alders matchet kontroller, se tabell S1) ble oppløst i 0,1% maursyre, tilsatt intern standard peptider, og separert ved reversfase mikro væskekromatografi på en 1200 HPLC-system sammen med en 6410 QQQ massespektrometer (Agilent Technologies). Separasjon ble utført ved mobil fase strømningshastighet på 1,5 mL /min med buffer A (0,1% maursyre) og buffer B (90% acetonitril i 0,1% maursyre), på en C18-felle kolonne (300 um x 5 mm, Agilent Technologies ) etterfulgt av en analytisk C18-kolonne (150 pm x 100 mm, kolonne Technology Inc., CA). Den binære gradient bestod av 3-17% B i 2.5 min, 17-23% B i 25 min, 23-40% B i 5 minutter, 40-100% B i 5 minutter og ved 100% B i 2,5 min. Data ble ervervet med en kapillær spenning på 4000 V, tørking av gass på 300 ° C ved 3,0 L /min, og forstøveren gass på 18 psi. Fragmentor spenning og kollisjonsenergi (CE) var optimalisert med infusjon av hvert peptid. I MRM eksperimenter, gjorde syklustider ikke overstige 1,2 sek og minst 20 datapunkter ble samlet per peak.

Absolute kvantifisering av A1BG og LRG1 serumnivåer

MRM dataanalyse ble utført ved hjelp Masshunter kvalitativ programvare (Agilent). [

12C] /[

13C] topparealene ble registrert ved manuell inspeksjon av strenge co avgi oppførsel, tar alle [

13C] overganger som referanse. For A1BG og LRG1 ble verifikasjoner av sine hopetall i ulike kohorter oppnådd av alle overgangs par, men bare de beste overgangene som næret beste linearitet respons ble brukt for absolutt kvantifisering. Analysen linearitet ble karakterisert ved fortynning av en tryptisk sammendrag av en serumprøve som ble innlemmet med lys peptider for å generere en rekke endogene analyttkonsentrasjoner som spenner over 3

7 og 3

8-ganger konsentrasjonsområde (fremgangsmåte modifisert fra Michael et al., [23]) for henholdsvis LRG1 og A1BG referanse peptider. Mengden av [

12C] peptid ble målt ved konsentrasjonen punkt hvor arealforhold av [

12C] /[

13C] var nærmest en (1,029 for A1BG og 0,922 for LRG1). Arealforhold ble anvendt for å beregne endogene konsentrasjoner av target-proteiner i sera, med formel montert linearitet kurve. Inter-assay variasjonskoeffisient (CV) ble evaluert ved fem separert behandling og MRM replikerer av en blandet prøve, og deteksjonsgrense (LOD) ble definert som konsentrasjonen ved hvilken S /N av analytten er lik 3 [24 ]. Den kvantifiseringsgrensen (LOQ) ble empirisk bestemt som den laveste analyttkonsentrasjon som kan holde akseptabelt linearitet (Pearson korrelasjon, R 0,99) og kan måles med. 20% CV [23]

Resultater

En høy kvalitet database med NSCLC forbundet serumproteiner

Pre-terapi sera fra 13 NSCLC pasienter (8 annonser og 5 SCCS) og 5 friske kontroller ble behandlet for IMDL-MS /MS-analyse ( Figur 1). For å løse kompleksiteten i serum proteom-, bedres vi en tidligere nedbør metode for å fjerne humant serumalbumin og utnyttet todimensjonal HPLC fraksjonering. Fremgangsmåten med fjerning var hurtig og med lave kostnader, og var ganske reproduserbar og effektiv, som vist i fig S1. En ny serie av buffere av elleve forskjellige pH-verdier ble anvendt i IMDL, tatt i betraktning av kompleksiteten av humant serum proteom- (figur 1, midtre panel). Sammenlignet med en tradisjonell en-dimensjonal RP-LC-separasjonen ble det proteom- dekning forbedret, med tanke på at mer enn tre ganger så mange proteiner, ble identifisert ved IMDL under de samme PSM FDR kriterier (Data ikke vist).

Venstre panel , serumprøver oppsamling og uttømming for å fjerne humant serumalbumin (HSA); Midtre panelet IMDL fraksjonering som skiller serum peptider ved deres PIS (2.5~8.5) og hydrofobi, med et eksempel på HPLC-MS /MS kromatografi viste for hver pH trinn eluering; Høyre panel, antall NSCLC og antallet av alderstilpassede friske kontroller i verifiseringsfasen ved western blotting, TMA og MRM måling. SCX, sterk kationbytter, RP reversert-fase-kromatografi. AD: Adenocarcinoma; SCC: Plateepitelkarsinom; NSCLC. Ikke-småcellet lungekreft

Med hensyn til den økende bekymring over den tilliten spørsmålet om blodproteiner identifisert [25], brukte vi de strenge kriteriene, naiv target-lokkedue FDR på protein nivå for å kvalifisere serum proteom- [16]. Samlet ble 629,804 peptid treff av 4,456 unike peptider, tildele til 647 proteiner identifisert fra serum (protein FDR 4,6%) og innlemmet i etiketten gratis kvantifisering. Vi observerte XCorr fordeling av peptid identifikasjon i serum proteom. Som Figur S2 angitt, alle spektre hadde en XCorr høyere enn 2,25, og ble dominert av identifisering av mye høyere score for både ladning 2+ og lade 3 + ioner. For ytterligere å fastslå ytelsen til target-decoy strategi og avledet FDR, en annen utbredt protein identifikasjon arbeidsflyt, Trans-proteomikk Pipeline (TPP) [26], ble også brukt til all den rå spektra kommer fra en sunn serumprøve. Alle PSMS med PeptideProphet ≥0.75 ble beholdt og tildelt proteiner. Videre 89.7% proteiner i vår identifikasjon resultat hadde en ProteinProphet ≥0.9, og ca 65,1% proteiner hadde en ProteinProphet tangert 1. I motsetning, hvis vi beholdt decoy tag i TPP, serumproteiner med ProteinProphet ≥0.9 hadde en FDR høyere enn 10,7 %. Disse foreslo ganske høy tillit til vår serum proteomet.

Profilering og biomarkør screening i NSCLC serum proteom-

neste estimerte dynamiske område etiketten gratis profilering. En signifikant korrelasjon mellom protein spektral tellinger og deres tilsvarende kjente konsentrasjoner [27], [28] ble oppnådd (tabell S2). Dermed vår proteomikk tilnærmingen lov muligheter for identifikasjon og relativ kvantifisering av serumproteiner over seks størrelsesordener (så lavt som flere nanogram per milliliter).

For å etablere en NSCLC forbundet serum proteom-, vi startet med å utføre hierarkisk clustering analyse (HCA) og hovedkomponentanalyse (PCA) på den totale proteome for å løse det, hvis vesentlige serumproteiner var regulert på grunn av NSCLC forekomst. HCA og PCA ble begge utført på den spektrale informasjonen telling av alle 647 serumproteiner (se metode). HCA innebar at NSCLC og normale personer ble tatt inn to store klynger (Figur 2A). Tilsvarende, i PCA-analyse, NSCLC sera kunne bli separert fra 5 normale kontroller av bare en hovedkomponent, og variasjonen i den kreft gruppen var mye mer enn i normalgruppen (figur 2B). Fordi MS analyser av kontrollsaker ble satt tilfeldig inn i sekvense kjøringer av 13 NSCLC sera, bør de preanalytiske faktorer være usikre og mindre betydning enn kreften fenotype. Selv om de relative posisjonene til hver NSCLC saken i HCA og PCA var ikke det samme, observerte vi moderat divergens mellom AD og SCC pasienter. For å svare hvis avstanden mellom kohortene kom fra bare én eller to vesentlig endret rikelig proteiner, vi også ansatt PCA for alle protein identiteter (se de røde pilene i figur 2B). Denne «bi-plot» antydet at betydelige proteiner, snarere enn et lite antall proteiner, bidrar til separasjon.

(A) Hierarkisk klyngeanalyse og (B) Prinsipal komponent analyse av alle 647-proteiner kvantifiseres på tvers de 18 serumprøver. Slutter av røde piler i (B) representerer PCA resultatene for hvert protein.

Siden identifisert serum protein kan holde muligheter til å avgrense eller forutsi NSCLC, permutert ANOVA og student T test mellom kohortene ble ansatt. Totalt 101 proteiner ble filtrert som betydelig forskjells proteiner (p 0,01, se detaljer i tabell S3) og deres relative berikelse mønster som heatmap ble vist i figur 3A. Blant 101 proteiner filtrert, ble mer enn 25% tidligere indikert som NSCLC biomarkør kandidater. Denne betydelige konsistens validert sterkt vår eksperimentell tilnærming i discovery fasen. Av notatet, ble de fleste tidligere studier basert på 2D-gel og rapportert mye mindre differensial proteiner enn vår resultat [29], [30], [31]. Dessuten vår 101 protein satt hell dekket et betydelig forhold av kandidatene rapportert fra en tidligere møysommelig arbeid [32], som kombinert omfattende multi-dimensjonale væskekromatografi og to-dimensjonal gelelektroforese forskjell for hver kromatografiske fraksjon. Disse bevisene viser at vår online IMDL fraksjone var ikke bare praktisk, men også relativt følsom i screening potensielle blod biomarkører. Foruten de rapporterte NSCLC kandidat markører, fant vi betydelige merke proteiner nært knyttet til andre kreftformer, som for eksempel alfa-1B-glykoprotein [33], Komp C1q delkomponent subenhet A [34], fibrinogen alfa /gamma kjede [35], [36] , fibulin-1 [37], platefaktor 4 og sin variant [38]. Likevel var det flere proteiner som næret svært god statistikk, men manglet tidligere bevis for å knytte dem til kreft status, for eksempel Protein AMBP (alternativt navn, alfa-1-mikroglobulin), muitivesikulære kroppen subenhet 12B og V-type proton ATPase 116 kDa subenhet. Interessante proteiner som er direkte knyttet til en cancerous tilstand (enten NSCLC eller annen kreft hos mennesker) av litteratur gruvedrift ble oppført i Tabell 1.

(A) Hierarkisk clustering heatmap av 101 vesentlig endrede proteiner. Expression verdier er vist som en fargeskala med høyere verdier representert ved gul og lavere representert med blått. (B) Gene Ontologi biologiske prosesser betydelig anriket på 101 protein sett. Gene symboler i blå eller røde sirkler (kan bli referert i tabell S3) indikerer de tilsvarende proteiner i ned- eller opp-regulert i NSCLC sera.

biologiske prosesser beriket i differensial serum proteome av NSCLC

siden forsøkt å karakterisere 101 proteiner i sammenheng med deres biologiske funksjoner. Ved å sammenligne GO biologisk prosess kommentert av BINGO, fant vi flere prosesser ble betydelig anriket (justere p 0,05 etter BH korreksjon, figur 3B). Nærmere bestemt, prosesser av akutt-fase-responser (p = 5.26E-10) og cellulær homeostase kation (p = 1.31E-6) i sirkulasjonssystemet hadde en tendens til å være oppregulert i kreftsera. Prosesser knyttet til komplementaktivering (p = 1.28E-7), celledød (p = 1.15E-2) og apoptose (p = 1.27E-3) var også signifikant regulert. Dessuten har vi funnet en rekke protein aktiviteter som ikke tidligere er kjent for å ligge i lunge cancer, slik som protease inhibitor og G-proteinkoplet reseptor-bindingsaktivitet, hvis relevante proteiner var for det meste nedregulert (p = 1.56E-11 og 3.24E -6). Sammen er disse observasjonene implisere NSCLC ikke bare i den akutte fasen svar og immunitet, men også i bestemte signal transductions og dødsprosesser.

TMA og omsatte i validere histologiske uttrykk A1BG, USP1 og mucin 5B i NSCLC vev

for å vise at noen, om ikke alle, av proteiner av interesse er faktisk forbundet med NSCLC risiko, i verifiseringsfasen anvendes vi forskjellige validerings tilnærminger. Fordi høy konkordans ble tidligere observert mellom TMA måling og RT-PCR [39] eller proteomikk profilering [40], vi spurte om TMA kunne muliggjøre en rask, nøyaktig og semi-kvantitativt estimat av de histologiske biomarkører. I denne delen, i tillegg til alpha-1B-glykoprotein (A1BG) og leucine-rik alfa-2-glykoprotein (LRG1) som er av mellomtoner overflod i serum, valgte vi en lav rikt serum protein ubiquitin karboksyl-terminal hydrolase 1 ( USP1) som ble detektert i sera NSCLC. I tillegg, fordi cellelinje lysat kan være biologisk mer nær vevsprøve, valgt vi på kandidat mucin-5B som påvises i NSCLC cellenivået i henhold til et datasett i vårt tidligere studium [17]. Vår TMA mot disse fire proteiner gitt en homogen og synkron profilering av på 90 parvise NSCLC seksjoner. Alle testede proteiner demonstrert høyere ekspresjonsnivå i NSCLC-tumorsnitt (figur 4A). Slik tett tilgang til differensial nivå mellom NSCLC og deres tilstøtende ikke-tumorsnitt, IHC-fargeintensitet (I, 0-3) og prosentandelen (P 0-9) av positive fargede celler ble fordelt (figur 4B og figur S3) . De fleste tumorsnitt ble preget med høyere intensitet (I≥2) og mer positive celler (P 60%).

Legg att eit svar