Abstract
interstitiell lungesykdom (ILD) hendelser er rapportert i japansk ikke-småcellet lungekreft (NSCLC) pasienter som får EGFR-tyrosinkinase-inhibitorer. Vi undersøkte proteomikk biomarkører for mekanistiske innsikt og bedre prediksjon av ILD. Blodplasma ble samlet inn fra 43 gefitinib behandlet NSCLC pasienter som utvikler akutt ILD (bekreftet av blindet diagnostisk vurdering) og 123 tilfeldig utvalgte kontroller i en nestet case-control studie innen en farmakoepidemiologisk kohort studie i Japan. Vi genererte -7 millioner tandem massespektrometri (MS /MS) målinger med omfattende kvalitetskontroll og validering, som produserer en av de største proteomikk lungekreft datasett til dags dato, som omfatter grundige studier design, fenotype definisjon og evaluering av utvalgets behandling. Etter justering, skalering og måling batch justering, identifiserte vi 41 peptid toppene som representerer 29 proteiner beste forutsi ILD. Multivariate peptid, oppnådde protein, og veien modellering ILD prediksjon sammenlignes med tidligere identifiserte kliniske variabler; kombinere de to gitt noen forbedring. Akutt faserespons reaksjonsvei er sterkt representert (17 av 29 proteiner, p = 1,0 x 10
-25), indikerer en viktig rolle med potensiell anvendelse som en markør for økt risiko for akutt ILD arrangementer. Validering av Western blotting viste korrelasjon for identifiserte proteiner, noe som bekrefter at robuste resultater kan genereres fra et MS /MS-plattform implementering streng kvalitetskontroll
relasjon:. Nyberg F, Ogiwara A, Harbron CG, Kawakami T, K Nagasaka , Takami S, et al. (2011) proteomikk Biomarkører for Akutt interstitiell lungesykdom i Gefitinib behandlet japanske lungekreftpasienter. PLoS ONE 6 (7): e22062. doi: 10,1371 /journal.pone.0022062
Redaktør: Scott A. Coonrod, Cornell University, USA
mottatt: 28 mars 2011; Godkjent: 14 juni 2011; Publisert: 20.07.2011
Copyright: © 2011 Nyberg et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Denne studien ble finansiert av Astrazeneca og gjennomføres i samarbeid med forskere fra akademia, Astrazeneca og medisinsk Proteoscope Company. Alle samarbeidende partier deltok i studien design, datainnsamling og analyse, beslutning om å publisere, og utarbeidelse av manuskriptet
Konkurrerende interesser:. FN, CGH, ISP, MCS og IGC er ansatte i Astrazeneca og eier aksjer i firmaet. AO, TK, K. Nagasaka, ST, KW, HKT, MO, Y. Kyono, TD, Y. Komatsu, MK, SA, og TN er /var ansatte i Medical Proteoscope Co, Ltd TH ansatt i Chiesi Farmaceutici. TH og GMV er tidligere ansatte i Astrazeneca. MF har mottatt honorarer fra Astrazeneca. K. Nakata, kast, SK, og HK har erklært at ingen interessekonflikter eksisterer.
Innledning
interstitiell lungesykdom (ILD) påvirker lunge parenchyma eller alveolar region [1]. Når forbundet med behandling, kan det presentere bratt som akutt diffus alveolar skade (DAD), noen ganger med dødelig utfall [2]. Pasientene har ofte alvorlige kortpustethet og bryst radiologi viser «bakken glass «utseende. Ingen spesiell behandling er tilgjengelig, men støttende terapi inkluderer oksygen, kortikosteroider, eller assistert ventilasjon. Akutte ILD hendelser kan utvikle
de novo
, men en eksisterende kronisk ILD tilstanden øker risikoen betraktelig [3], som observert i nyere studier av pasienter med idiopatisk lungefibrose (IPF), den vanligste kroniske formen [4 ].
ILD, spesielt IPF, er et kjent komorbiditet hos pasienter med ikke-småcellet lungekreft (NSCLC) [5]. Akutte ILD hendelser har blitt rapportert med mange lungekreft terapier ved hastigheter opp til ~ 10% [6] – [11]. ILD er anerkjent som mer vanlig i Japan enn andre steder, både i befolkning og hos pasienter med NSCLC [5], [6], [12], [13], selv om det er uklart hvorfor.
EGFR tyrosin kinase hemmere (TKI) er en etablert behandling for avansert NSCLC. I motsetning til mye kjemoterapi, de er vanligvis godt tolerert og uten cytotoksiske bivirkninger. EGFR TKI gefitinib (Iressa) ble godkjent i 2002 i Japan for behandling av avansert NSCLC. Selv om noen ILS-hendelser ble observert i kliniske studier og medfølende klinisk bruk, bare etter godkjenning gjorde et økende antall spontanrapporter for ILD vises i Japan som stoffet ble mer allment tilgjengelig.
På dette punktet, bedre forståelse av ILD ble sterkt behov: baseline forekomst på ulike behandlinger, risikofaktorer, og potensialet sammenslutning av gefitinib med ILD risiko. En uavhengig faglig team sammen med Astrazeneca forskere derfor utformet og gjennomført en kohort og nestet case-control farmakoepidemiologisk studie av ILD i japanske NSCLC pasienter behandlet med enten gefitinib eller kjemoterapi, med kliniske resultater rapportert tidligere [3]. Som en utforskende sub-studie komponent, pasienter som får gefitinib (begge påfølgende ILD saker og kontrollpasienter) ble prøvetatt for plasma proteomikk, med to hovedmål: 1) å identifisere proteomikk prediktorer for ILD som kan til slutt bli utviklet seg til en personlig medisin diagnostisk til identifisere pasienter med økt risiko for ILD; 2) for å øke forståelsen av mekanismene bak utviklingen av akutte ILD hendelser.
Ved hjelp av en multippel biomarkør tilnærming som proteomikk (samtidig studiet av store deler av menneske proteomet å gi en global oversikt over differensial uttrykk for proteiner i blod eller vev), i stedet for bare en vanlig enkelt biomarkør, øker potensielt prediktiv kraft både gjennom økt robusthet som stammer fra flere målinger og muligheten til å kombinere informasjon fra flere biologiske prosesser. For å støtte høy kvalitet generasjon av slik informasjon, vi kombinert på en ny måte flere viktige studiekomponenter: robust studiedesign, veldefinerte fenotypiske definisjoner, forsiktig sample samling prosedyrer, stabil avansert væskekromatografi (LC) -tandem massespektrometri (MS /MS) -baserte peptid separasjons- og deteksjonsmetoder, statistisk analyse som omfatter proteomikk og klinisk informasjon, strenge metoder for database protein annotering av oppdagede peptid topper, og biologisk tolkning ved hjelp av litteratur mining programvare, pluss omfattende kvalitetskontroll og validering, rapporteres nedenfor.
Resultater
Kjennetegn på studiepopulasjonen
den ikke-randomisert kohorten inkluderte 3166 japanske pasienter med avansert /residiverende NSCLC som ble fulgt i 12 uker etter oppstart av gefitinib (n = 1,872 behandlingsperioder ) eller kjemoterapi (n = 2551). Fra gefitinib behandlede sub-kohort, 103 mistenkte ILD tilfeller (79 senere bekreftet og 24 avvist av Case Review Board [CRB]), samt 252 kontroller, ble registrert inn i case-control studie. Proteomikk prøver for dette sub-studien var tilgjengelig fra 43 bekreftede ILD tilfeller, 123 kontrollpersoner, og 15 CRB-avviste i utgangspunktet diagnosen ILD tilfeller (tabell 1). Kliniske kjennetegn ved sakene og kontroller er beskrevet i tabell S1.
Unders analyse av LC-MS /MS-data oppnådd under kvalitets kontrollerte forhold avslører stor batch variasjon som må kontrolleres i senere statistiske analyser
kvalitetsvurdering av utvalgets behandling og datagenerering
etter immunoaffinitetskolonnerensing utarming, gjenværende serum albumin var 8% for alle 181 baseline prøver (Tabell S2). Den etterfølgende tryptisk hydrolyse resulterte i et gjenværende ufordøyd proteindelen som strekker seg fra 3,0% til 32,3% (gjennomsnitt 15,3%) (Tabell S2). Variasjonen i disse bearbeidingstrinn var uavhengig av case /kontroll-status (data ikke vist).
LC-MS /MS-målinger for de 181 individuelle grunnlinjeprøver ble utført i 11 grupper, med 19 og 20 prøver fra batcher 1 og 3 gjentatt i grupper 10 og 11, henholdsvis (tabell 1), noe som resulterer i 220 diskrete proteomics målinger. Fire av de 11 grupper innledningharde kvalitetskontroll kriteriene (variasjonskoeffisient [CoV] 20% for et hvilket som helst av de seks kontroll peptidene hos de tre i-batch kontrollprøver) på den første målingen løp, men passerte de kriterier gjentatte målinger. En kvalitetskontroll oppsummering av aksepterbare satsvise forsøk er gitt i Figur 1A.
(A) Reproduserbarhet av 6 kontroll topper for de 3 standard kvaliteten kontrollprøver, avsatt som «+», i hver analyse parti (toppintensitet, venstre akse). Koeffisientene til variasjon (%, høyre akse) mellom de 3 kontrollprøver i hver sats er plottet som punkter sammen med en linje. (B) reproduserbarhet av peptid intensiteter for 39 prøver med duplikat analyser i forskjellige analyse grupper. Delvis korrelasjon, etter å ha fjernet mellom batch-forskjeller, plottet mot den gjennomsnittlige normaliserte intensiteten for hvert peptid. Høyere intensitet peptider viser høy reproduserbarhet i deres intensitet mellom gjentatte omganger.
Figur 1B viser et plott av partielle korrelasjoner mellom duplikatprøvene i grupper 1 og 10, 3 og 11, etter at en eller annen batch effekt , mot gjennomsnittet normalisert intensitet over hele prøvesett for hvert signal. Peptider med høyere gjennomsnitts intensiteter viser høyere reproduserbarhet mellom partier som gjenspeiles av generelt høye partielle korrelasjoner.
Unders data analyse av MS signalintensitet.
Vi brukte en prinsipal komponent analyse (PCA) for å utforske dataene for å identifisere de største kildene til variasjon. Figur 2A viser en plotting av denne analysen, med hver prøve farget i henhold til parti. Målinger fra samme parti har en tendens til å klynge sammen, atskilt fra andre partier, noe som tyder på at de største forskjellene mellom prøvene oppstå fra satsvis behandling.
(A) Plot av første to hovedkomponenter fra PCA analyse av fulle proteomikk data fra alle 11 analyse batcher (nummerert 1-11 i tidssekvens). Hver prøve er representert ved et enkelt punkt, med det område med punkter innenfor hver gruppe er vist ved en polygon som forbinder ytterpunktene i det batch. (B) plott av de første to hovedkomponenter for de gjentatte grupper av prøver (1 og 10, 3 og 11). Individuelle prøver er representert ved en linje, som forbinder de to replikatene i forskjellige partier. (C) Reproduserbarhet av et eksempel differensielt uttrykte peptid mellom to duplikate kjøringer av sats proteomikk analyse. Intensitetene for de første og andre bakker for hver replikerte prøve er plottet mot hverandre. Prøver farget av batch (batch 1 gjentas så batch 10 – blå, batch 3, gjentas så batch 11 – rød). Slik at for mellom-sekvensforskjeller det er en god korrelasjon mellom replikate kjøringer.
Figur 2B viser resultatene av PCA på parene av gjentatte grupper (1 og 10, 3 og 11), med duplikatprøvene sammen med en linje, plottet mot de første to hovedkomponenter. Linjene er hovedsakelig horisontal og parallell, igjen tyder på at den største kilden til variabilitet eller de største forskjeller i profiler mellom prøvene (første hovedkomponent) vedrører inter-batch-variabilitet, og at rekkefølgen av prøvene på den andre hovedkomponent, dvs i den nest største kilden til variasjon eller generelle forskjeller mellom prøvene, er i sterk enighet mellom de gjentatte grupper. Etter noe som åpner for konsistente forskjeller mellom grupper, disse resultatene dermed bekrefter at inter-prøve forskjellene er reproduserbare med den metoden som brukes.
Mens figur 2B sammen resultatene oppsummert i løpet av alle målte peptider viser figur 2C gjentatte kjøringsresultater for en eksempel peptid. Selv om det er store mellom-batch forskjeller innenfor hver gruppe er det høy korrelasjon mellom intensiteten for det samme motivet på replikere går. Av de 41 differensielt uttrykte peptid topper som brukes for å identifisere proteinene som er oppført i tabell 2, 25 (61%) viser en delvis korrelasjon etter fjerning av den satsvise virkning som er større enn 0,8, og alle viser en delvis korrelasjon som overstiger 0,35.
Klare forskjeller i peptid og protein mønsteret mellom ILD saker og kontroller
De senere analyser som mål å identifisere peptider og proteiner som effektivt diskriminert mellom saker og kontroller, så avviste sakene ble nå ekskludert. Gjentatte prøver i grupper 10 og 11 ble ekskludert, og gitt de store mellom-batch forskjeller identifisert i utforskende analysene, ble kontrollen emnet målt i batch 10 også utelukket, forlater 43 bekreftet ILD tilfeller og 122 kontroller med en prøvemåling hver.
Identifisering av diskriminerende peptider og proteiner.
Figur 3 viser resultatene av den univariate (enkelte peptid) analyser ved bruk av analyse av kovarians (ANCOVA), vist som histogrammer av p-verdiene for sammenlignings mellom saker og kontroller. Slik at for batch som en analyse kovariat, for å fjerne inter-batch variasjon, øker betydelig makt analyse, identifisere omtrent dobbelt så mange peptider som viser statistisk signifikant differensial uttrykk på 5% nivå. Fig S1 og S2 utforske og forklare dette forhold i mer detalj. Videre sto for den innen-gruppe for bare litt reduserer antall betydelige peptider, noe som tyder på at noen innen-gruppe for effekten er marginal og forsøker å modellere det vil ikke øke makten.
Figuren viser effekten på fordeling av p-verdier for ulike uttrykk fra blant annet analyse behandle informasjon og kliniske variabler.
på den annen side, noe som åpner for viktige kliniske variabler (WHO performance status [PS], røyking historie, grad av normal lunge dekning på CT scan, og alvorlighetsgraden av pre-eksisterende ILS) i analysen konsekvent redusert antall peptider bli oppdaget som uttrykt forskjellig, noe som reflekterer at mye av informasjonen som føres i de viktigste peptidene er duplisere informasjon båret av kliniske variabler ( figur 3). Figur S3 viser et eksempel på dette, hvor høyere nivåer av peptidet, høyere ytelse status stillingen og tilfelle status er alle forbundet med hverandre, og mye av den økte peptidet intensiteten av tilfellene sammenlignet med kontrollene kan forklares ved deres tilknytning høyere ytelse status score, så peptidet intensitet er å legge mye mindre informasjon når vurderes i kombinasjon med denne kliniske variable.
Basert på p-verdien, de 100 toppene fra begge analysene inkludert og uten kliniske variabler var identifisert. Disse topper ble deretter begrenset til 41 i henhold til de følgende kriterier: 1) normalisert LC retensjonstid på mellom 5 og 75 min, og 2) fullstendig skanning
m /z
verdi av forløperen ion mellom 450 og 1.500. Deretter ble peptid-identifikasjoner som inngår i de 41 peptid-toppene er valgt ved hjelp av følgende kriterier: 1) et ion Mascot score mer enn identiteten terskelverdi gis den enkelte aminosyresekvensen av peptidet; og 2) 3 prøver med tilsvarende peptid identifikasjon. Dette resulterte i 45 gyldige peptid identifikasjoner fra 28 av de 41 toppene, inkludert to peptider fra piggete lysozym (tabell S3). Plasmaavledet 43 peptider representert 27 forskjellige identifikasjoner med 2 doble identifikasjoner av nært beslektede proteiner, for en total av 29 proteiner. Disse er listet opp i tabell 2, med flere detaljer om deres identifikasjon gitt i tabell S3.
Akutt fase respons identifisert som en viktig vei sannsynlig å bli involvert i akutte ILD hendelser
Dette settet av proteiner ble deretter anvendt i den biologiske tolkning analyser, ved hjelp oppfinnsomhet Pathway Analysis (IPA) system. Den mest betydningsfulle pathway funnet når overliggende proteiner på oppfinnsomhet-kategoriserte kanoniske trasé var den akutte fase respons signalveien, med hvilken 17 av de 29 proteinene kan være forbundet (p = 1,0 x 10
-25). Andre veier som viser et høyt overlapp med listen av proteiner inkluderte komplement og koagulasjon trasé, men p-verdier var mindre betydning på grunn av mindre antall proteiner involvert (figur 4).
De viktigste trasé fra en analyse som forbinder de identifiserte 29 proteinene fra studien til de utvalgte baner i oppfinnsomhet pathway analyse-system er vist, organisert i henhold til forholdet mellom antall proteinmarkører som kan bli forbundet med reaksjonsvei og antall proteiner i reaksjonsveien.
Gå inn de 29 proteiner til IPA, 5 nettverkene ble dannet. Den mest betydningsfulle nettverk inneholder 24 av de 29 proteinene (figur 5). Proteiner lagt til nettverket av verktøyet til å koble markørproteinene inkluderer IL1 og NF-kB, noe som tyder på at disse proteinene kan også være involvert i å generere den observerte mønsteret. Ved å kombinere de to nettverkene med de høyeste poengsummene legger videre IL1-beta, HNF1A, HNF4A, HNF6 (ONECUT1), og CEBPB som sentrale komponenter (figur S4).
Høyeste score nettverk generert fra å komme inn de identifiserte 29 proteiner inn oppfinnsomhet Pathway Analysis system, med proteiner identifisert i studien skraverte grå og kobler proteiner identifisert av oppfinnsomhet Pathway Analysis ikke-skyggelagt. Mørk blå figurer og linjer = proteiner identifisert som predikator i denne studien og samspillet mellom dem. Grey former og linjer = proteiner identifisert av oppfinnsomhet for å generere nettverk og interaksjoner mellom dem. Lyseblå linjer = interaksjoner mellom proteiner identifisert av oppfinnsomhet for å generere nettverket og proteiner identifisert i studien. Figur S4A viser dette tallet med samhandlingsrelasjoner merket. Proteiner identifisert i studien og som inngår i nettverket: SERPINA1 = alfa-1-antitrypsin; SERPINA3 = alfa-1-antichymotrypsin; SERPINC1 = antitrombin-III; APOA1 = apolipoprotein A-I; ApoB = apolipoprotein B-100; APOC3 = apolipoprotein C-III; C3 = komplement C3; C4A, C4B = komplement C4-A; utfylle C4-B; C9 = komplement komponent C9; GSN = gelsolin; HBA2 = hemoglobin alfa; HBB, HBD = hemoglobin beta /delta; HP = haptoglobin; HPR = haptoglobin-relatert protein; HRG = histidin-rik glykoprotein; KLKB1 = plasmakallikrein; IGKC = Ig kappa kjede V-III-regionen Ti; RBP4, RBP = retinol bindende protein 4; APCS = serum amyloid P-komponent; TF = serotransferrin; TTR = transthyretin. Proteiner identifisert i studien og ikke inngår i nettverket: ORM1 = alfa-1-syre glykoprotein 1; A1BG = alpha-1B-glykoprotein; LRG1 = leucin-rik alfa-2-glykoprotein; ARMC2 = armadillo gjenta holdig protein 2; AHSG = a2-HS-glykoprotein; ITIH4 = inter-alpha-trypsin inhibitor tung kjede H4.
Validering av MS /MS data viser god reproduserbarhet og fornuftig avtale med Western blot
I MS /MS-plattform der var sterk enighet mellom duplikate kjøringer av de samme prøver etter slik at for batch-effekter, slik som beskrevet ovenfor (figur 2C).
å validere med en annen metode, Tabell 2 viser korrelasjonen i intensiteter avledet fra MS /MS og Western blotting (WB) for et utvalg av 9 proteiner. Tatt i betraktning at WB er rettet mot intakt protein, mens den nåværende MS /MS kan oppdage peptider som stammer fra de intakte proteiner, disse 9 proteiner viser en ganske sterk grad av enighet mellom de teknologiene, med 6 av de 9 proteiner utviser en sammenheng i overkant av 0,7 . Scatterplots sammenligner MS /MS og WB protein intensiteter er vist i figur S5 og WB bildene i figur S6.
Tips ILD bruker proteiner og kliniske data
Modeling fenotype basert på flere peptid markører .
Figur 6A viser prediktiv kraft basert på leave-one-out kryssvalidering for modeller bygget ved hjelp av en rekke forskjellige antall peptider i kombinasjon. Betydelige forbedringer på tilfeldig forutsigelse ble oppnådd fra noen få peptider, og å øke antallet peptider videre ikke vesentlig forbedre modellprediksjoner. Den prediktive kraft av modellen selv reduseres ved bruk av svært mange peptider.
(A) fra peptider, for forskjellige antall peptider som inngår i proteomikk prediksjon modellen, og (B) fra kliniske data, proteomic data, og en kombinasjon av både kliniske og proteomikk data.
for robusthet, ble alternative multivariate modellering tilnærminger i forhold. Ved hjelp av tilfeldige skoger i stedet for Partial Least Squares diskriminant analyse (PLS-DA) og logistisk regresjon innen modellering rammeverk ga omtrent samme prediktive nivå som gjenspeiles av arealet under kurven (detaljer ikke vist).
En undergruppe analysen begrenser sett tilfeller å de med DAD akutt ILD mønster (20 av 43 tilfeller) ble hemmet av liten utvalgsstørrelse og var ikke i stand til å forbedre den generelle prediktiv kraft.
Modeling fenotype basert på flere peptid markører og kliniske data.
Figur 6B sammen prediktiv kraft, basert på leave-one-out kryssvalidering, for modeller bygget på kliniske /radiologiske data alene ved hjelp av en logistisk regresjon, peptid data alene, og en kombinasjon. Begge datatyper alene gitt lignende anslag. En viss forbedring ble oppnådd ved å kombinere de to datatypene, men det var langt mindre enn additiv. Dette er i tråd med resultatene fra analysen av enkelte peptider, noe som tyder på at den kresne peptider delvis bære informasjon også fra de kliniske /radiologiske variabler.
Modellering fenotyper basert på proteiner og kliniske data.
Figur 7 viser p-verdiene for å skille tilfeller og kontroller erholdt fra proteiner (dvs. kombinert bestanddel peptid resultater), alle de utgjørende peptider, og den kombinerte akutte fasen pathway intensitet mål (dvs. den kombinerte resultatet av den 16 inkluderte bestanddeler proteiner) . For de fleste proteiner, er det antatt protein intensitet mer betydningsfull enn de fleste av de målte intensiteter peptid knyttet til den aktuelle protein, men bare forbedrer den betydning av de beste peptidet for noen proteiner. Da disse resultatene ble oppnådd innen samme datasettet som ble brukt til å identifisere og velge de konstituerende peptider, kan noen over sittende være forekommende, og protein uttrykk intensitet som omfatter informasjon fra mange peptider kan være en mer robust tiltak for å søke i en større sammenheng . Den kombinerte akutte fasen pathway intensitet målet viser en mer signifikant respons enn hvilken som helst av de inngående proteiner. Et lignende bilde er oppnådd når vi vurderer ytterligere informasjon gitt av peptid, protein og sti tiltak på toppen av de kjente kliniske variabler i å forutsi ILD status (figur S7).
p-verdier for proteiner er vist med røde stjerner, er p-verdier for individuelle peptider vist av poeng, og fordelingen av disse for hvert protein er vist med et boksplott. I hver boxplot, de øvre og nedre sider av boksen representerer de høyere og lavere kvartil verdier (Q3 og Q1), henholdsvis. Den svarte linjen i hver boks representerer medianverdien. P-verdien for den akutte fasen reaksjonsveien er representert ved den stiplede linje; boksplott for proteiner i den akutte fasen respons veien er skyggelagt. A1AG1 = alfa-1-syre glykoprotein 1; A1AT = alfa-1-antitrypsin; A1BG = alpha-1B-glykoprotein; A2GL = leucin-rik alfa-2-glykoprotein; AACT = alfa-1-antichymotrypsin; ANT3 = antitrombin-III; APOA1 = apolipoprotein A-I; ApoB = apolipoprotein B-100; APOC3 = apolipoprotein C-III; ARMC2 = armadillo gjenta holdig protein 2; CO3 = komplement C3; CO4 = utfylle C4-A; utfylle C4-B; CO9 = komplement komponent C9; FETUA = a2-HS-glykoprotein; GELS = gelsolin; HBA = hemoglobin alfa; HBB, HBD = hemoglobin beta /delta; HPT = haptoglobin; HPTR = haptoglobin-relatert protein; HRG = histidin-rik glykoprotein; ITIH4 = inter-alpha-trypsin inhibitor tung kjede H4; KLKB1 = plasmakallikrein; KV3 = Ig kappa kjede V-III-regionen Ti; RETBP = retinol bindende protein 4; SAMP = serum amyloid P-komponent; TrFE = serotransferrin; TTHY = transthyretin.
Figur 8A viser akutt fase respons pathway intensitet plottet mot et kombinert klinisk variabel poengsum måle sannsynligheten for et emne blir en sak beregnet ut fra et logistisk regresjon av case-control status mot kliniske variabler WHO PS, røyking historie, omfanget av normal lunge dekning på CT scan, og alvorlighetsgraden av pre-eksisterende ILS. Dette viser både informasjonskilder som bidrar til å forutsi ILD utfallet, selv om disse to tiltakene er nokså sterkt korrelert, slik at mye av informasjonen er duplisert. Figur 8B vurderer virkningene for å forutsi ILD ved å vise mottakeren operasjonelle egenskaper (ROC) kurver for de kliniske variabler, den akutte fasen veien intensitet, og kombinasjonen av de to kilder til informasjon. Dette viser sammenlignbare nivåer av prediktiv kraft fra de kliniske variabler og akuttfase-spredningsveier intensiteter, og noen mulige fordelen av å kombinere dem sammen, som imidlertid er begrenset, noe som reflekterer deres korrelasjon.
(A) Plot av den akutte fasen respons intensitet mot kombinert klinisk variabel poengsum måle sannsynligheten for et emne blir en sak beregnet ut fra en modell forutsi case-control status kun basert på kliniske variabler WHO PS, røyking historie, omfanget av normal lunge dekning på CT scan, og alvorlighetsgraden av pre-eksisterende ILS, med boksplott sammenligne fordelingen av disse tiltakene i saker og kontroller. I hvert boxplot, øvre /høyre og nedre /venstre side av boksen representerer de høyere og lavere kvartil verdier (Q3 og Q1), henholdsvis. Den svarte linjen i hver boks representerer medianverdien. (B) Mottaker opererer karakteristikk av tverr validert spådommer fra kliniske data, den akutte fasen respons intensitet og en kombinasjon av kliniske data og akuttfaserespons intensitet.
Diskusjoner
Vi presenterer her resulterer fra en proteomikk analyse anvendt i stor-skala farmakoepidemiologisk studie og viser at med betydelig oppmerksomhet for å studere utforming og eksperimentelle prosedyrer gjennom hele prosessen er nødvendig for å generere data av høy kvalitet, er det mulig å utlede verdifull kunnskap fra både vitenskapelig og et diagnostisk perspektiv. Imidlertid er det mange potensielle kilder for data variasjon og skjevhet i denne prosessen. Integriteten til alle trinnene i prosessen er avgjørende for å generere nyttige data og unnlatelse av å sikre høy kvalitet i ett av dem kan kompromittere gyldigheten og verdien av hele studiet.
Metodiske aspekter
Studiedesign og prøveopparbeidelse.
Vi søkte forsiktig fenotyping med blindet diagnostisk vurdering for å sikre en nøyaktig ILD diagnose, og innarbeidet tiltak for å sikre at alle tilfeller av ILD forekommer i kilden kullet skulle bli tatt. Kontrollene ble valgt ut fra den faktiske befolkningen generering av tilfellene, noe som sikrer sammenlignbarhet mellom saker og kontroller slik at kontraster sett kan tilskrives saksstatus. Deltakelsen var høy ( 90%) og lignende for saker og kontroller [3], noe som gjør utvalgsskjevhet usannsynlig. Proteomikk Prøver ble innhentet etter eget informert samtykke fra omtrent halvparten av alle gefitinib behandlede saker og kontroller. Tiltak for å sikre høy kvalitet på proteomikk data for vår storstilt epidemiologisk undersøkelse inkludert randomisering av de behandlede prøvene, forsiktig kvalitetsvurdering av prøveforberedelser og optimalisert forberedelse protokoller for å sikre stabilitet i alle prosedyrer for et stort antall prøver. Vi har tidligere beskrevet den generelle strategi som vi besluttet å bruke i studien basert på en rekke eksperimentelle pilot fase runder [14].
Eksperimentelle måle batch effekter.
To-dimensjonal polyakrylamid gel elektroforese er en vanlig konvensjonell teknologi som brukes for protein analyse i serum /plasma [15], [16]. Foreløpig har LC-MS /MS blitt allment akseptert for høyoppløselig proteom- bred profilering fra en kompleks peptid blanding [17]. Nylige fremskritt i denne metodikken inkludert forbedret stabilitet peptid separasjon og deteksjon har gjort det mulig å sammenligne ion intensitet mellom LC-MS /MS-profiler [18]. Vårt proteomforskning analysesystem anvendt LC-MS /MS etter immunoaffinitetskromatografi uttømming av de mest tallrike bestanddeler proteiner i blodplasma, og proteolytisk enzym behandling av det utarmede plasmaprøve.
Vi identifiserte at LC-MS /MS-målemetode har systematiske målefeil, som man kunne forvente, som vi tok skritt for å eliminere ved å innføre gruppebehandling med kvalitetskontroll, designe rekkefølgen på utvalgets behandling for å minimalisere virkningene av eventuelle systema feil, og deretter eliminere batch virkninger i statistisk analyse. Hensynet til batch effekter i den statistiske analysen viste seg å forbedre prosessen med å oppdage diskriminerende topper, og vi baserte derfor vår endelige protein identifikasjon skritt på denne analysen tilnærming
Justering algoritmer -. Intern standard-guidet Optimal Profil Alignment ( i-OPAL)
for å muliggjøre sammenlignende kvantifisering mellom prøvene, eksempel målingene må rettes -. dvs korrespondansen av ione-signaler må identifiseres. Forskjellige fremgangsmåter er blitt foreslått for dette, f.eks basert på stabil isotop-merking [19] – [21], ved å benytte sammenlignende identifikasjon [22], [23], eller med direkte sammenligning av de respektive peptid-ion-signaler [18]. I-OPAL metoden tilhører den siste kategorien. På tross av den forholdsvis lav nøyaktighet og masse oppløsning av
m /z
måling, MS instrument av ione-felle typen muliggjør en langvarig stabil måling uten noen kalibreringsoperasjon [24], [25]. Følgelig
m /z
verdier er direkte sammenlignbare i et stort sett med prøver uten ytterligere transformasjoner.
Biologiske funn og implikasjoner
Mulige biologiske mekanismene bak akutte ILD hendelser.
i vår IPA kartlegging for å kanoniske biologiske pathways, akuttfaseproteiner kom ut som det sterkeste signalet, etterfulgt av komplement og koagulasjon veier.