PLoS ONE: Prioritering av kreftmarkør Kandidater Basert på Immunohistochemistry Farging bilder deponert i Human Protein Atlas

Abstract

Kreft markør oppdagelsen er en voksende tema i high-throughput kvantitative proteomikk. Men omics teknologi genererer vanligvis en lang liste med markør kandidater som krever en arbeidskrevende filtreringsprosess for å skjerm for potensielt nyttige markører. Nærmere bestemt, forskjellige parametre, som for eksempel nivået på overekspresjon av markør i krefttype av interesse, som er knyttet til sensitivitet og spesifisitet av markøren mellom kreft-grupper, er de mest viktige hensyn. Protein expression profilering på grunnlag av immunhistokjemi (IHC) fargebilder er en teknikk som vanligvis brukes i slike filtreringsfremgangsmåter. Å systematisk undersøke protein uttrykk i ulike kreft versus normalt vev og celletyper, Human Protein Atlas er en mest omfattende ressurs fordi det inneholder millioner av høyoppløselige IHC bilder med utvalgt av eksperter merknader. For å lette filtrering av potensielle biomarkører kandidater fra store omics datasett, i denne studien har vi foreslått en scoring tilnærming for å kvantifisere IHC annotering av sammenkoblede kreft /normalt vev og kreft /normal celletyper. Vi har omfattende beregnet resultatet av alle de 17219 testede antistoffer deponert i Human Protein Atlas basert på sine akkumulerte IHC bilder og oppnådde 457110 score dekker 20 forskjellige typer kreft. Statistiske tester demonstrerer evnen av den foreslåtte scoring metode for å prioritere kreftspesifikke proteiner. Topp 100 potensielle markør kandidater ble prioritert for de 20 krefttyper med statistisk signifikans. I tillegg ble en modell studie utført av 1482 membranproteiner som er identifisert fra en kvantitativ sammenligning av parvise cancerøse og tilstøtende normale vev fra pasienter med kolorektal kreft (CRC). Den foreslåtte scoring tilnærming demonstrert vellykket prioritering og identifisert fire CRC markører, inkludert to av de mest brukte, nemlig CEACAM5 og CEACAM6. Disse resultatene viser potensialet i dette scoring tilnærming i form av markør kreft oppdagelse og utvikling. Alle de beregnede score er tilgjengelig på https://bal.ym.edu.tw/hpa/

Citation. Chiang SC, Han CL, Yu KH, Chen YJ, Wu KP (2013) Prioritering av kreft Marker Kandidater Basert på Immunohistochemistry Farging bilder deponert i human Protein Atlas. PLoS ONE 8 (11): e81079. doi: 10,1371 /journal.pone.0081079

Redaktør: Chien-Sheng Chen, National Central University, Taiwan

mottatt: 13 juli 2013; Godkjent: 08.10.2013; Publisert: 26.11.2013

Copyright: © 2013 Chiang et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av Yang Ming University, Academia Sinica (forskningsprosjekt på nanovitenskap og teknologi), og National Science Council of Taiwan. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kvantitative proteomikk har blitt brukt mye i markør kreft funn med en viss grad av suksess [1] – [7]. Denne typen studier genererer vanligvis en stor mengde data som må analyseres videre for å identifisere merke kandidater. Selv om det ikke finnes noen standard måte å skjerme kreftmarkører fra massive proteomikk datasett [8], har dette arbeidet levert en rekke potensielle kreftmarkører [9] – [11]. Selv om ulike tilnærminger har blitt utviklet, gruvedrift biomarkører fra high-throughput proteomikk data baserer seg i hovedsak på fold endringer i proteinuttrykk mellom normale og kreftgrupper [12]. En god kreftmarkør er forventet å være sterkt overuttrykt i den aktuelle kreft gruppe, og graden av overekspresjon må være både betydelig og spesifikk for kreft er av interesse.

En metode som er i stand til å definere kreften -specificity av et protein til kreft av interesse er derfor uunnværlig. For å lage en slik kreft-spesifisitet indeks, må vi ha uttrykk informasjon om de ulike proteiner i friske individer og hos pasienter med ulike typer kreft. Anskaffelse av slike proteomikk data, men er ressurs- og tidkrevende for småskala akademiske forskningsgrupper. Heldigvis Human Protein Atlas (HPA) er tilgjengelig; dette omfattende annotates et stort antall gener og proteiner som uttrykkes i forskjellige typer av normale og kreft vev [13] – [15]. HPA er et antistoff-basert database. Ved å bruke vev microarray og immunhistokjemi (IHC) fargeteknikker, har HPA omfattende akkumulert millioner av bilder med høy oppløsning med ekspert-kuratert merknader. IHC farging er ansett som en effektiv teknikk i proteomikk forskning [16], [17]. På grunnlag av disse bildene, spesielt de som bruker IHC-farging, har HPA blitt effektivt anvendt i en rekke studier for markeringen kreft oppdagelse [18] – [24]. Tilnærmingen brukes med HPA i disse studiene har imidlertid involvert manuelle søk. Siden annotering av IHC bildene er ordinal og merket med gradient barer, anskaffe protein uttrykk nivåer fra HPA er unintuitive og arbeidskrevende. Dessuten, når undersøke gradient barer av IHC merknader, kommer skjønn inn i bildet, og dette kan gjøre tolkningen av protein uttrykk nivå av forskerne inkonsekvent på tvers av ulike bilder. Følgelig kan en systematisk måte for å kvantifisere protein uttrykk data fra HPA, som ville tillate kreft spesifisiteten av proteiner som skal defineres på grunnlag av IHC merknader i HPA, blir avgjørende.

I denne studien ble foreslått vi en scoring tilnærming basert på annotering av IHC bildene fra HPA. Poeng tilnærmingen tar i betraktning et protein s ekspresjonsnivåer i normalt vev og /cancer betydningen /spesifisitet for hvilken som helst overekspresjon av protein i kreftvevet. På basis av den foreslåtte scoring mekanisme, vi omfattende prioritert alle de testede antistoffer i HPA (17219 antistoffer i HPA versjon 10.0) i 20 forskjellige typer kreft. En statistisk analyse av resultatene ble utført ved en-prøve

t

-test, og dette viste at det foreslåtte scoring metode er i stand til å identifisere proteiner som blir overuttrykt i kreftvev, og fastslå når en slik overekspresjon er betydelig og spesifikke for kreft av interesse. Vi brukte også en prøve kohort av 1482 proteiner [25] for å evaluere effekten av den foreslåtte scoring tilnærming. Scoringen tilnærming, i kombinasjon med protein fold endringer, var i stand til å identifisere fire markør kandidater for tykktarmskreft fra prøven kohort. De fire utvalgte markør kandidater inkludert CEACAM 5 og CEACAM6, som er de mest brukte markører for tykk- og endetarmskreft i dag; de er først og fremst brukes for prognostisk overvåkning [26]. De andre to valgte markør kandidater, CAMP og ANXA4, har også blitt rapportert å være potensielle markører for tykk- og endetarmskreft [27] – [29]. Evalueringsresultatene viser potensialet i den foreslåtte scoring tilnærming når det brukes til markør kreft oppdagelse. Alle de beregnede score er tilgjengelig for søk via en nettside, «HPA Skåring» på https://bal.ym.edu.tw/hpa/.

Materialer og metoder

IHC bilder av HPA

i denne studien, immunhistokjemi (IHC) farging bilder av HPA versjon 10.0 utgitt på 12 september 2012 (https://www.proteinatlas.org/) ble brukt til å prioritere gener eller proteiner representert av antistoffer. Data oppføringer i HPA er indeksert ved hjelp av sine genet navn. I HPA versjon 10.0, er det 14012 gener, de protein ekspresjonsprofiler som måles ved hjelp av 17219-antistoffer i 46 normale humane vevstyper, 20 typer kreft vev, og 47 humane cellelinjer. HPA versjon 10.0 har omfattende akkumulert millioner av høyoppløselige IHC bilder med ekspert-kuratert merknader, hvorav 5.108.055 ble brukt i denne studien.

Validering datasett

En kohort av 1482 membran proteiner uttrykt i paret svulst og nærliggende normalt vev fra 28 pasienter diagnostisert med tykktarmskreft ble brukt som vår validering datasett [25] (tabell S1). Klinisk informasjon om de 28 pasientene er presentert i tabell S2. Dette datasettet ble opprinnelig opprettet for å screene potensielle markører for tykk- og endetarmskreft.

Kartlegging av kreft og normalt vev

Den foreslåtte scoring tilnærming er primært basert på bruk av protein expression forskjeller mellom kreft og normalt vev. Derfor var det et behov for å kartlegge forholdet mellom de forskjellige typer av kreft og deres sammenkoblede normale vev. Disse kartlegginger, som ble hentet fra HPA, er oppført i Tabell 1. En krefttype kan defineres på en rekke ulike kartlegginger dersom det enten sammen med mer enn én celletype i et normalt vev (f.eks livmorhalskreft er sammenkoblet med kjertel celle og squamous epitelceller fra livmorhalsen, livmor) eller sammen med mer enn en normalt vev type (f.eks kolorektal kreft er sammenkoblet med vev fra tykktarm og endetarm). De ulike kartlegginger blir analysert uavhengig når vår tilnærming er brukt. Vær oppmerksom på at det ikke er noen tilordning definert for eggstokkreft på grunn av mangel på IHC fargingsresultater i HPA for normal ovarie vev. Videre, ettersom leverkreft og kolangiokarsinom er helt forskjellige krefttyper, ble de betraktet som ulike krefttyper i våre kartlegginger, selv om de var alle klassifisert som leverkreft i HPA. Til slutt ble 27 kartlegginger definert for 20 krefttyper ved hjelp av HPA. Vær oppmerksom på at vi ikke undersøke kreftundertyper, for eksempel lobular karsinom og duct carcinoma, som er brystkreft, fordi antall vevsprøver i HPA i slike tilfeller er ganske begrenset. Vår tilnærming er antistoff-orientert; hvert antistoff i HPA brukes til å evaluere ikke mer enn 12 pasienter med en viss type kreft. Hvis vi videre klassifisere de tilsvarende 12 IHC bilder til ulike kreft subtyper, ville det være svært vanskelig å trekke noen konklusjon fra statistisk signifikant bevis som er basert utelukkende på 10 IHC bilder. Vi ønsker å understreke at det å se til kreft subtyper er en svært viktig del av markør kreft funn. Vi vil gjøre vårt arbeid mot denne retningen når HPA eller en annen database er i stand til å gi et tilstrekkelig antall IHC bilder av forskjellige kreft subtyper.

Expression forskjeller som oppdages av antistoff i forhold til kartlagt kreft og normalt vev

for en gitt kartlegging og en gitt antistoff, vårt mål var å bestemme uttrykket forskjellen (

ED

) til målet protein mellom paret kreft og prøver normalt vev. Expression nivåer av et protein i vev er fastsatt basert på kommentarer levert av HPA. Hvert gen i HPA blir annotert; denne består av et gen og protein sammendrag, antistoff og antigen informasjon, og en rekke forskjellige typer av ekspresjonsprofiler. I denne studien merknadene

Intensitet Hotell og

Antall

for IHC farging brukes til å definere uttrykket nivået av et protein i vev. Merknaden

Intensitet

representerer nivået av antistoff farging. Merknaden

Antall

representerer brøkdel av positivt fargede celler. Siden et protein kan bli gjenkjent av mer enn ett antistoff på grunn av flere bindingsseter, blir visse gener i HPA evaluert ved hjelp av mer enn ett antistoff. Fordi antistoffer brukes til å lage den HPA er ikke alle av samme kvalitet, kan evalueringen av resultatene fra disse antistoffene bli ujevn. For å løse dette problemet, er vår foreslåtte tilnærmingen designet for å være antistoff-orientert for å overvinne eventuelle uoverensstemmelser i kvaliteten av antistoff. Ulike antistoffer for et gitt gen produkt regnes som distinkte dataoppføringer og behandlet separat.

For målet protein, er dens uttrykk i vev preget av merknadene

Intensitet Hotell og

Antall

. De to merknader er først forvandlet fra ordens skjema til numerisk form. De fire verdiene Sterke, moderat, svak, og negative som brukes til å beskrive

Intensitet

er forvandlet til tre, henholdsvis 2, 1 og 0,. Den forvandlet

Intensitet

er merket med

I

. Tilsvarende fem verdier 75%, 75% -25%, 25%, sjeldne, og negativ som brukes til å beskrive

Antall

er forvandlet til 75, 50, 25, 5 og 0 hhv. De transform

Antall

er merket med

Q

. Den grunnleggende faktor som definerer uttrykket av et protein i vev blir deretter beregnet ved hjelp av

I

×

Q

(figur 1A).

(A) I utgangspunktet er protein uttrykk nivåer og uttrykket forskjell (

ED

) mellom kreft vev og normalt vev for alle antistoffene som dekker alle kartlegginger beregnes. (B) Betydningen av målet

ED

med hensyn til kartlegging av interesse blir bestemt ved en kumulativ fordeling z. (C) Spesifisiteten til målet

ED

med hensyn til kartlegging av interesse blir bestemt ved en annen kumulativ z fordeling. (D) Sluttresultatet av antistoffet med hensyn til kartlegging av interesse bestemmes på grunnlag av sin protein uttrykk nivå i kreftvev og betydningen og spesifisitet av sin

ED

.

for normal celletype, uansett hvor mange ganger antistoff brukes til å utføre IHC flekker, HPA rapporterer kun ett par av

Intensitet Hotell og

Antall

score. Vi har derfor bare ett par

I

og

Q

verdier for normal celletype. Uttrykket av proteinet i normal celletype,

Ein product: (uttrykk i normal), er derfor definert som følger: For eksempel er det bare ett par

Intensitet Hotell og

Antall plakater (Moderat, 75%) når antistoffet HPA034966 brukes til IHC farging av kjertelceller fra normalt brystvev, vi har derfor

Ein

= 2 × 75 = 150. Totalt verdier av

Ein

vil ha en rekkevidde fra 0 til 225.

i motsetning til situasjonen for normalt vev, for en gitt type kreft, melder HPA et par av

Intensitet

og

Mengde hver gang antistoffet blir brukt til å utføre IHC-farging

. Derfor vi vanligvis har flere par av

I

og

Q

verdier for en gitt krefttype. Således kan ekspresjon av et protein i en gitt krefttype,

EIC plakater (ekspresjon i kreft), er definert som den gjennomsnittlige ekspresjon av proteinet i vev fra pasienter diagnostisert med kreft denne: hvor

n

er antall testede pasienter diagnostisert med denne kreft. For eksempel ble antistoff HPA034966 brukes til å utføre IHC flekker på 12 pasienter med brystkreft og som et resultat av HPA gir 12 par

Intensitet Hotell og

Antall

score; disse er: (Sterk, 75%), (Moderat, 75%), (Sterk, 75%), (Sterk, 75%), (Moderat, 75%), (Moderat 75%), (Moderat, 75%), (Moderat, 75%), (Moderat, 75%), (Moderat, 75%), (Moderat, 75% ), og (Moderat, 75%). Vi har derfor

EIC

= (3 x 75 + 2 × 75 + 3 × 75 + 3 × 75 + 2 × 75 + 2 × 75 + 2 × 75 + 2 × 75 + 2 × 75 + 2 × 75 + 2 × 75 + 2 × 75) /12 = 2025/12 = 168,75. Totalt sett verdiene av

EIC

vil også ha en rekkevidde fra 0 til 225.

Til slutt uttrykket forskjellen,

ED

, av en gitt antistoff for et gitt kartlegging er definert som

ED

=

EIC Anmeldelser -.

Ein plakater (figur 1A)

Antistoff score i forhold til vev kartlegging

for et gitt antistoff og et gitt kartlegging, er antistoffet forventet å motta en høy score hvis (1) målproteinet er overuttrykt i kreftvev, og (2) graden av overekspresjon er vesentlig og bestemt til kartlegging. Poengsummen av antistoffet til kartlegging er derfor bestemmes på følgende måte (figur 1):

Bestem protein uttrykk og ED av alle antistoffer. I det første trinnet, må vi først bestemme protein uttrykk nivåer

EIC Hotell og

Ein

for alle antistoffer i HPA for alle kartlegginger. Uttrykket forskjellen

ED

av antistoffer bestemmes ved hjelp av

EIC Anmeldelser –

Ein plakater (figur 1A). Legg merke til at dette første trinnet kan betraktes som «system initialisering» og blir utført bare en gang; den beregnede

EIC

«s,

Ein

« s, og

ED

«s forblir konstant for scoring av alle antistoffer.

Bestem betydning av målet ED. Vi vil gjerne vite om det

ED

av målet antistoff er betydelig i forhold til kartlegging av interesse.

ED

verdier av alle antistoffer mot denne kartleggingen er normalisert ved z-poeng transformasjon for å fjerne inter-eksperiment bias, hvor μ

g Hotell og σ

g

er gjennomsnitt og standardavvik for alle disse

ED

«s, henholdsvis.

betydning

av

ED

av målet antistoff til kartlegging,

SG

, er definert av den kumulative z distribusjon

SG

=

P product: (

Z

z

g product: (

ED

)) (figur 1B).

SG

kan betraktes som rang av målet antistoff blant alle antistoffer med hensyn til kartlegging av interesse. Verdien av en

SG

vil være i området fra 0 til 1.

Bestem spesifisitet av målet ED. Vi ønsker også å vite om målet

ED

er spesifikk for kartlegging av interesse.

ED

«s av målet antistoff til alle kartlegginger er normalisert ved z-poeng transformasjon for å fjerne inter-eksperiment bias, hvor μ

p Hotell og σ

p

er gjennomsnitt og standardavvik for alle disse

ED

«s, respektivt.

spesifisitet

av

ED

av målet antistoff til kartlegging,

SP

, er definert av den kumulative z distribusjon

SP

=

P product: (

Z

z

p product: (

ED

)) (figur 1C).

SP

kan betraktes som rang av målet kartlegging blant alle kartlegginger med respektive til målet antistoff. Verdien av en

SP

vil også være i området fra 0 til 1.

Bestem score målet antistoff. At resultatet av en gitt mål-antistoff i forhold til en gitt kartlegging av interesse er definert som (figur 1D). Verdien av en

Resultat

vil være innenfor området fra 0 til 225.

Diskusjon

Vi har omfattende beregnet resultatet for alle antistoffer som brukes

Resultater og i HPA for hver av de 27 kartlegginger og dette resulterte i 457110 score. I stedet for å sammenfatte disse i en stor flat supplerende fil, alle de beregnede score er tilgjengelig på en nettside som kan spørringer lages (https://bal.ym.edu.tw/hpa/) (figur 2). Nettstedet, HPA scoring, gir to spørre moduser: en spørring av genet navn og en spørring av krefttype. For et gitt gen navn, HPA Scoring viser score og rangering av de antistoffer som brukes for hver kartlegging (Figur 2A). For en gitt kartlegging av en krefttype, melder HPA poeng et gen liste, oppføringene som er sortert etter antistoff score (figur 2B). I den følgende del av studiet, utfører vi en verifikasjon av hvorvidt eller ikke den foreslåtte scoring metode er i stand til å identifisere antistoffer som tilfredsstiller de følgende kriterier. For det første, at det oppfangede protein er overuttrykt i målet kreftvev, og, for det andre, at graden av overekspresjon er betydelig og spesifikk for kreft. I den andre delen av denne bekreftelsen, har vi også brukt kolorektal kreft som modell sykdom og anvendt en metode for markør kreft oppdagelse spesielt ved hjelp av vårt forslag scoring tilnærming til tykktarmskreft datasett.

(A) Resultatet av spørring av genet navn. (B) Resultatet av spørring ved kartlegging av en krefttype.

Evnen til å score tilnærming til å identifisere rikelig proteiner i kreftvevet

For hver kartlegging, velger vi 100 beste antistoffer i henhold til deres

Scores

, og utføre en one-sample

t

-test for å verifisere om den gjennomsnittlige

EIC

av disse 100 antistoffer er eller ikke statistisk høyere enn for alle de testede antistoffer. Den en-prøve

t

-test blir ofte brukt for å måle den midlere forskjell mellom en prøve og en kjent populasjon. Vi bruker den en-utvalg

t

-test fordi vi kan bestemme den gjennomsnittlige

EIC

av alle de testede antistoffer, nemlig befolkningen mener. De statistiske betydninger av

EIC

bety forskjeller mellom Top100 antistoffer og alle de testede antistoffer for hver kartlegging er oppført i tabell 2. I henhold til

p

-verdier rapportert av en-utvalg

t

-test, hele 27

EIC

mener forskjellene er statistisk signifikante. Resultatene av disse testene vise evne til vår scoring tilnærming til å identifisere rikelig proteiner i kreftvevet.

Betydningen og kreft-spesifisiteten av

ED

av topprangerte antistoffer

for å sørge for at den foreslåtte scoring tilnærmingen er i stand til å identifisere proteiner som er betydelig overuttrykt i kreftvevet, vi utfører en one-sample

t

-test for å verifisere hvorvidt den gjennomsnittlige

ED

av de 100 antistoffene er statistisk høyere enn for alle de testede antistoffer. De statistiske betydninger av

ED

bety forskjeller mellom de 100 antistoffer og alle de testede antistoffer er oppført i tabell 3. I henhold til

p

-verdier rapportert av en-utvalg

t

-test, alle de 27

ED

mener forskjellene er statistisk signifikante. Analyseresultatene viser muligheten for vår scoring metode for å identifisere proteiner som er sterkt uttrykt i kreft av interesse. Vær oppmerksom på at de 100 antistoffene har en oppregulert trend (positiv

ED

utvalgsgjennomsnitt) for alle de 27 kartlegginger. Denne kontrasten med resultatene for de fleste av de testede antistoffer, som viser en nedregulert trend i kreftvevet (22 av de 27 kartlegginger har en negativ

ED

befolkningen mener).

Top100 antistoffer for hver kartlegging ble også brukt til å bekrefte hvorvidt den foreslåtte scoring tilnærmingen er i stand til å identifisere proteiner som overekspresjon er spesifikk for kreft av interesse. For de 100 antistoffer av en spesifikk kartlegging, er deres gjennomsnittlige

ED

bestemmes for hver av de 27 kartlegginger. De oppnådde 27

ED

midler ble så organisert i et kart varmen med stor

ED

verdier farget i mørk blå og små

ED

verdier farget i lys blå (figur 3) . Oppføringen (

i

,

j

) i kart varmen representerer den gjennomsnittlige

ED

av de 100 antistoffer av

j

-te kartlegging beregnet for

i

-te kartlegging. Kolonnen lengst til høyre, All, viser gjennomsnittet

ED

verdier av alle de testede antistoffer beregnet for hver av de 27 kartlegginger; nemlig bidragene ligger innenfor denne kolonnen er befolknings

ED

midler. Haugen Kartet har derfor dimensjonene 27 av 28. De mørkeblå oppføringer ligger langs diagonalen viser at den gjennomsnittlige

ED

av de valgte for en kartlegging antistoffene er spesifikke for den kartlegging. I motsetning til de fleste av oppføringene i kart haugen har gjennomsnittlig

ED

for antistoffene valgt av en kartlegging som ligner befolkningen

ED

mener om de er testet for en annen kartlegging. Hver rad i kart haugen bekrefter den observasjon at for en bestemt tilordning, den gjennomsnittlige

ED

verdiene til de som er valgt for denne kartleggingen antistoffer er høyere enn den til antistoffer som er valgt for andre tilordninger. Hver kolonne i kart varmen også enig med en annen observasjon, nemlig at for de 100 antistoffene som er valgt for en bestemt tilordning, er deres gjennomsnittlige

ED

bare betydning for den valgte kartlegging og er lik den populasjon for andre tilordninger. Resultatene av denne evalueringen viser at

ED

av topprangerte antistoffer er spesifikk for kreft av interesse.

I denne varmen kartet, stort

ED

verdier er farget mørk blå og små

ED

verdier er farget lys blå. Oppføringen (

i

,

j

) på kartet varmen representerer den gjennomsnittlige

ED

av de 100 antistoffer av

j

-te kartlegging beregnet for

i

-te kartlegging. Kolonnen lengst til høyre, All, viser gjennomsnittet

ED

av alle de testede antistoffer beregnet for hver av de 27 kartlegginger.

Oppsummert viser foreslått scoring tilnærming stort potensial som en metode for identifisering rikelig og kreftspesifikke proteiner i vev.

bruk av tilnærmingen til markør kreft oppdagelse

i dette avsnittet bruker vi en evaluering kohort for å demonstrere hvordan den foreslåtte scoring tilnærming kan brukes å screene mulige markører for kreft. Kohorten består av 1482 oppregulert membran proteiner fra 28 pasienter som hadde blitt diagnostisert med tykktarmskreft [25]. Vi bruker følgende tre filtreringsregler for å velge mulige kreftmarkører fra dette kullet. Regler som ligner på de to siste listet nedenfor har blitt mye brukt i biomarkører.

Regel 1. Et protein med antistoff scorer 100 i enten kolorektal-kolon kartlegging eller colorectal-rektum kartlegging er valgt.

Regel 2. oppregulert protein med en gjennomsnittlig ganger endring 2 er valgt.

Regel 3. oppregulert protein med en fold endring 2 i mer enn 14 pasienter er valgt.

proteinene valgt av disse kriteriene ble deretter videre analysert ved hjelp av

Biomarker Filtrer

levert av IPA (Oppfinnsomhet Systems, https://www.ingenuity.com). Hvert protein med potensiell biomarkør eller sykdom søknaden er kommentert av IPA i løpet av denne prosessen.

Åtte kombinasjoner av filtreringskriterier ble evaluert. Hver av de kombinasjonene tar hensyn til forskjellige kombinasjoner av de forskjellige filtreringsregler. Filtrerings Resultatene er vist i figur 4. Disse reglene som brukes til å screene genene er merket et plusstegn i figur 4A og ellers de er merket med et minustegn. For hver kombinasjon, er antallet filtrerte gener, gener med biomarkør merknad, og gener med sykdom merknaden også oppført i Figur 4A. Spesiell oppmerksomhet bør rettes mot Kombinasjon 1. I denne kombinasjonen vi bare matche alle 1482 proteiner mot HPA version10.0 å se hvor mange beslektede gener er indeksert i HPA; spesielt, er ikke eksplisitte filtreringsregler brukes til å velge mulige markører. Det er 1114 indekserte gener, hvorav 244 gener har biomarkør merknader og 914 gener har sykdom merknad fra IPA. Resultatet av Kombinasjon 1 danner vårt utvalg befolkningen. Andelene av de merkede biomarkører og sykdomsrelaterte gener til de filtrerte genene i hver kombinasjon er vist i figur 4B. Andelen av filtreringsresultatene til vår prøvepopulasjon er vist i figur 4C. Nemlig proporsjonene de filtrerte gener til alle de 1114 indekserte gener, de filtrerte biomarkører til 244 kommenterte markører, og de filtrerte sykdomsrelaterte gener til 914 kommenterte sykdomsrelaterte gener; disse er listet opp i figur 4C. Figur 4C er et panel diagram som har to paneler; den øvre man har en akse som dekker hele spekteret av data, mens den nederste har en akse som fokuserer på dataene innenfor området 0% -25%.

(A) Reglene som brukes til å skjerm gener er merket med et plusstegn, og ellers er det et minustegn. For hver kombinasjon, er antallet filtrerte gener, gener med biomarkør merknad, og gener med sykdom merknad oppført. (B) Andelen kommenterte biomarkører og sykdomsrelaterte gener til filtrerte gener av hver kombinasjon vises. (C) Andelen av filtreringsresultatene til vår prøvepopulasjon er vist. Dette tallet er et panel diagram som har to paneler; den øvre har en akse som dekker hele spekteret av data, mens den nederste har en akse som fokuserer på data innenfor området 0% -25%.

Vi deretter brukt Kombinasjoner 2, 3 og 4 for å evaluere effekten av Regel 1, regel 2, regel 3 og hhv. Kombinasjon 2, nemlig Regel 1 alene, tillot en viss grad av suksess i biomarkører; andelen av de merkede biomarkører til de filtrerte genene blir øket fra 21,9% til 29,8% (figur 4B). Videre, Bad 2 har evnen til å screene sykdomsrelaterte gener og andelen av de merkede sykdomsrelaterte gener til de filtrerte genene blir øket fra 82,0% til 87,5% (figur 4B). Påføring Kombinasjon 2 krymper størrelsen på utvalget til 15,1%, men holder 20,5% av de kommenterte biomarkører og 16,1% av de kommenterte sykdomsrelaterte gener (Figur 4C). Bruk av Kombinasjon 3, nemlig Regel 2 alene, jevnt krymper størrelsen på utvalget, kommenterte biomarkører, og kommenterte sykdomsrelaterte gener (4,3%, 4,1%, 4,2%, figur 4C). Andelen av de kommenterte biomarkører og sykdomsrelaterte gener til de filtrerte gener er også holdt på samme nivå som i prøven befolkningen (20,8%

vs

21,9%;. 79,2

vs

. 82,0%, figur 4B). Effekten av å bruke Kombinasjon tre er noe som stikkprøvekontroll. Kombinasjon fire, nemlig Regel 3 alene, har beste biomarkør screening evne blant de tre filtreringsregler; andelen av de merkede biomarkører til de filtrerte genene blir øket fra 21,9% til 35,3% (figur 4B). Påføring Kombinasjon fire jevnt krymper størrelsen på utvalget og kommenterte sykdomsrelaterte gener (3,1% og 3,0%), men holder 4,9% av de kommenterte biomarkører (Figur 4C). Det virker som søker Rules 1 og 3 er begge effektive strategier når du utfører biomarkører.

Vi vurderer også resultatene av kombinasjoner som bruker to filtrering regler sammen. Kombinasjon 5 gjelder reglene 1 og 2, Bad 6 gjelder reglene 1 og 3, og kombinasjonen 7 gjelder regler 2 og 3. Alle de tre kombinasjoner dramatisk krympe størrelsen på utvalget til en skala som er egnet for våt-lab validering; påføring Kombinasjoner 5, 6, og 7 genererer 13, 8, og 14 filtrert gener, respektivt (figur 4A). Kombinasjon 6 beholder den største delen av biomarkører. Andelen av annoterte biomarkører for å filtrerte gener er økt fra 21,9% til 75% (figur 4B). Kombinasjoner 5 og 7 produsere lignende resultater i forhold til å identifisere kommenterte biomarkører, mens kombinasjon 5 har en bedre sykdomsrelatert genet screening evne. Andelen av de merkede sykdomsrelaterte gener til de filtrerte genene er 92,3% ved anvendelse kombinasjon 5, men bare 64,3% når søknad Kombinasjon 7 (figur 4B). Evalueringen resultater enig med vår observasjon at Regel 1 i kombinasjon med Regel 3 er i stand til å effektivt skjermen potensielle biomarkører.

Legg att eit svar