Abstract
En universell kreft biomarkør kandidat for diagnose er ment å skille, innenfor et bredt spekter av svulster, mellom friske og syke pasienter. Nylig publiserte studier har utforsket den universelle nytten av enkelte biomarkører i menneskelige svulster. I denne studien presenterer vi en integrerende tilnærming for å søke etter mulige felles kreft biomarkører. Bruke TFactS web-verktøy med en katalog av eksperimentelt etablerte genet forskrifter, kan vi forutsi transkripsjonsfaktorer (TFS) regulert i 305 forskjellige menneskelige kreftcellelinjer som dekker et stort panel av tumortyper. Vi identifiserte også kromosomale regioner som har betydelig variasjon kopitall (CNV) i disse cellelinjene. Innenfor rammen av TFactS katalog, 88 TF’er hvis aktivitet status ble forklart ved deres genekspresjon og CNVs ble identifisert. Deres minimal tilkoblet nettverk (MCN) av protein-protein interaksjoner danner en betydelig modul i menneske kuratert TF proteom. Funksjonell analyse av proteinene som inngår i denne viste MCN anrikning i kreft veier samt betennelse. De ti mest sentrale proteiner i MCN er TFS at trans-regulerer 157 kjente gener som koder utskilt og transmembrane proteiner. I offentlig tilgjengelige samlinger av genuttrykk data fra 8,525 pasient vev, ble 86 gener forskjellig regulert i kreft i forhold til betennelsessykdommer og kontroller. Fra TCGA kreft genekspresjon datasettene ble 50 gener signifikant assosiert med pasientens overlevelse i det minste en tumortype. Berikelse analyse viser at disse genene mechanistically samhandle i vanlige kreft veier. Blant disse kreft biomarkør kandidater, er TFRC, MET og VEGFA ofte forsterket gener i tumorer og deres kodede proteiner farget positive i mer enn 80% av malignitet fra offentlige databaser. De er knyttet til angiogenese og hypoksi, noe som er vanlig i kreft. De kunne være interessant for videre undersøkelser hos kreft diagnostiske strategier
Citation. Essaghirs A, Demoulin J-B (2012) En Minimal Tilkoblet nettverk av transkripsjonsfaktorer regulert i menneske Svulster og sin søknad til Quest for Universal Cancer Biomarkers. PLoS ONE 7 (6): e39666. doi: 10,1371 /journal.pone.0039666
Redaktør: Paolo Provero, Universitetet i Torino, Italia
mottatt: 6 februar 2012; Godkjent: 25 mai 2012; Publisert: 25 juni 2012
Copyright: © 2012 Essaghir, Demoulin. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble finansiert av FSR Fellowship fra Université Catholique de Louvain. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Kreft er en multifaktoriell sykdom. Mange krefttyper og stadier har vært preget. Denne kompleksiteten gjør jakten på «universelle kreft biomarkører» en utfordrende oppgave. Imidlertid har mange studier utført separat på ulike krefttyper rapportert felles gener med potensiell biomarkør verdi i behandling eller diagnose [1].
På bakgrunn av litteraturen omtaler eller ved hjelp av high-throughput teknikker noen forfattere identifisert potensielle biomarkører felles for flere kreftformer og forsøkt å utvikle strategier for å identifisere dem fra pasientens biofluids enten direkte eller indirekte. Blant disse markørene har telomerase blitt rapportert som blir sterkt uttrykt i svulster [2]. En plattform for å ta sirkulerende tumorceller fra pasientens blod og måle deres telomeraseaktivitet har vært foreslått som et diagnostisk verktøy kreft [3]. I tillegg er ekstra-cellulær cAMP-avhengig proteinkinase A (EC-PKA) blitt rapportert å være en god markør for flere krefttyper [4]. Auto-antistoffer mot EC-PKA, målt ved hjelp av ELISA fra pasienter sera har vært funnet å være meget spesifikke for kreft [5]. Follikkelstimulerende hormon (FSH) reseptor ble også rapportert å være selektivt uttrykkes i en rekke forskjellige tumorer [6]. De samme observasjonene gjelder også for en cytokrom P450 (CYP1B1) [7]. Epigenetiske modifikasjoner, i tillegg kan ha en diagnostisk verdi i kreft. Faktisk har noen forfattere påpekt til kreftspesifikke DNA metylering mønstre som en markør for ondartede sykdommer [8]. De kan påvises på cellefrie sirkulerende DNA i blodet [9]. Auto-antistoffer mot leukocyttantigens F (HLA-F) ble også funnet hos pasienter med ulike krefttyper sammenlignet med friske individer [10].
Kreft biomarkør kandidat gener kunne identifiseres fra litteraturen. Tillit vekter kan knyttes til hvert gen ved hjelp av siteringshyppighet [11]. Selv om utgangspunktet brukes til å nummerere markører spesifikke for hver krefttype, kan disse veide listene hjelp til å velge vanlige biomarkører i kreft. Imidlertid har flere utarbeidet strategier blitt brukt til å identifisere felles kreft biomarkører, inkludert genekspresjon meta-analyse på tvers av ulike krefttyper [12], [13]. De kan være assosiert med funksjon og sti merknad berikelse filtrene til å velge vanlige biomarkører [14].
I denne studien har vi utarbeidet en integrerende strategi for å søke etter nyttige biomarkører vanlige krefttyper. Vår arbeidshypotese er basert på antagelsen om at nesten alle forstyrrelser som fører til malignitet transformasjon av normale celler, men kompleks og mangfoldig, deler felles samarbeids trasé [15]. Generelt kan disse banene ende ved å aktivere og /eller undertrykke noen sett av gener. Disse genene er mål for transkripsjonsfaktorer (TFS). Noen av disse TFS er redundante modulert mellom ulike celletrans hendelser [16] – [22]. De kunne bli sett på som forbindelser eller cross-talk noder av kreft ledende trasé [23] – [27]. Således bør det være et sett med minimal tilkoblede TF’er vanlig perturbert i tumorer som de deler modulerte veier [28]. Dette settet med TFS kan anses som en flaskehals av kreft veier. Hvis vanligste kreft biomarkører finnes, er det mer sannsynlig å være blant målene for disse vanligvis regulert TFS [29]. I denne studien tok vi nytte av TFactS, et verktøy som vi nylig utviklet for å forutsi TF forskrifter fra høy gjennomstrømming genuttrykk data [30].
Resultater
Identifikasjon av TFS regulert i Cancer Cell Lines
genekspresjon og SNP data var tilgjengelige for 305 cellelinjer, der resultatene ble videre analysert. Disse cellelinjene representerer et bredt panel av krefttyper som dekker 28 ulike histologiske nettsider.
Vi antok at viktig TFS vil være de som genekspresjon og CNV kunne forklare sin aktivitet status [31], [32]. De kan identifiseres ved hjelp av regresjonsmodellen vist i figur 1. For å beregne alle de parametrene som er nødvendige for denne modellen, identifiserte vi gener differensielt regulert i hver cellelinje i forhold til bassenget av alle andre cellelinjer. Median antall regulerte gener per cellelinje er 218 (min 15 og max: 721), kumulativt involverer 4,686 unike kjente gener. Deretter ble hver cellelinje-spesifikke genet liste legges TFactS og sammenlignet mot katalog av eksperimentelt validerte TF målgener ved hjelp av Fishers test [30]. Vi har vist at dette verktøyet effektivt forut TF regulering fra regulerte genet lister [33], [34]. På den annen side, SNP dataene ble normalisert og segmentert deretter sendt til GISTIC algoritme for å identifisere kromosomale regioner signifikant endret i alle disse cellelinjene [35]. Figur S1 viser at betydelige presiseringer og slettinger ble spredt i hele genomet. En begrenset analyse av TF-kodende gener viste at 2113 av 2335 gener som er kjent for å kode «DNA-bindende proteiner» (GO term) hadde sin loci signifikant endret, i det minste i en cellelinje. Slik velger transkripsjonsfaktorer som er relevante for kreft i en strengere måte, kombinert vi analysen på uttrykket, aktivitet og CNV (figur 1).
Se teksten for detaljer. Reg: regel; Exp: uttrykk; CNV: kopiantall variasjon; MCN: minimal tilkoblet nettverk; PPI: protein-protein interaksjoner; TF. Transkripsjon faktor
For hver TF, ble korrelasjons profiler med andre TFS beregnet basert på: regulering (utledes fra TFactS analyse), genekspresjon og genomiske endringer (CNV), henholdsvis. Modellen i figur 1 bruker disse korrelasjons score for å finne betydelig TFS, som genuttrykk knyttet til CNV kunne forklare den tilsvarende inferred regulering. 88 TFS ble identifisert (p-verdier = 0,05, Tabell S1). Støtte våre resultater, CNV påvirker noen av disse TFS i kreft har allerede blitt rapportert, inkludert:. TP53, BRCA1, RUNX1 og MYC [36]
Minimal Tilkoblet nettverk av transkripsjonsfaktorer regulert i Cancer Cell Lines
Vi brukte snø web verktøy for å identifisere minimal tilkoblede nettverket (MCN) av protein-protein interaksjoner som involverer de 88 TFS knyttet til kreft fra vår innledende analyse. Snø spådd dette MCN ved å beregne den korteste stier som knytter inngangs proteiner enten direkte eller med en tolerert middels protein, basert på en innebygd database av humane protein-protein interaksjoner [37], [38]. Begrense vår Snø-baserte analysen til humant protein interactome med minst to eksperimentelle bevis for interaksjon, identifiserte vi en subnett tilkobling 70 ut av 88 TFS enten direkte eller med en mellomliggende. Det er bemerkelsesverdig at de fleste av TFS identifisert i det første trinn kan være knyttet på denne enkelt protein-protein interaksjon subnettet. Atten TFS gikk tapt på grunn av våre begrensninger i analysen eller til deres fravær i snø-kommenterte interactome. Snø bruker Kolmogorov-Smirnov test for å vurdere betydningen av de identifiserte subnettet ved å sammenligne sine betweenness, tilkoblinger og clustering koeffisient utdelinger til de som genereres fra 1000 tilfeldige nettverk med samme antall proteiner. Vår identifisert subnettet hadde betydelige p-verdier for alle disse evaluerte parametere (betweenness: 2.06E-37, tilkoblinger: 1.68E-47, clustering COEF .: 4.07E-43). Dette subnettet inneholdt to forskjellige tilkoblede komponenter. Den første inneholdt nesten alle interaksjoner av den betydelige subnett og ble betraktet som kreftcellelinje-assosiert TF’er MCN for senere analyse (Figur 2). Den andre tilkoblede komponenten, som har bare to interaksjoner knytte tre proteiner ble forkastet.
The Snow web-verktøyet identifisert et betydelig menneskelig kuratert protein-protein interaksjon subnettet som involverer 70 av de 88 TFS Korrelativt regulert i kreftcellelinjer. Den første tilkoblet komponent som vises her er ansett som minimal tilkoblede nettverket (MCN) koble disse TFS. Hver node representerer et protein. Kantene er protein-protein interaksjoner validert av minst to eksperimentelle bevis. Noder i skyggen i fiolett representerer de ti mest sentrale TFS i MCN. Node-ranking var basert på betweenness sentralitetsnivåer score.
Vi spurte om falske positiver fra TFactS, GISTIC og forskjells uttrykk analyser kan påvirke MCN identifikasjon. For å kontrollere disse effektene, utførte vi en negativ kontroll, der vi analyserte 100 forskjellige tilfeldige lister med 88 TFS fra TFactS katalogen. Hver liste ble sendt til snø for å produsere en MCN med de samme parametrene som ovenfor. Ved å sammenligne fordelingen av betweenness score fra alle de tilfeldige Nettverkene til den etablerte MCN i vår modell, fant vi en signifikant forskjell (p-verdi ~0.01, KS test). Sammen med resultatene som er omtalt ovenfor fra den innebygde i sammenligning med 1000 tilfeldige nettverk utført i snø, dette antydet at vår identifisert MCN utgjør en betydelig modul som omfatter TF’er vanligvis regulert i cancercellelinjer.
Denne MCN kan sees som regulatorisk «rundkjøringen» for flertallet av regulerte veier i kreftcellelinjer. Faktisk, som vist i figur 3, er mange MCN proteiner involvert i mange krefttyper og kreftsignalveier. Likevel MCN proteiner er også betydelig involvert i immunrespons veier. Dette kan reflektere en involvering av noen MCN TFS som NFkB i både kreft og betennelser [16].
Alle proteiner (noder) i MCN ble sendt til DAVID web verktøy for KEGG vei berikelse analyse. Betydelige trasé er vist i kategorier i henhold til -log10 (p-verdi) og andelen av skjæringspunktet mellom den innleverte liste og spurte merknader.
målgener av MCN Central transkripsjonsfaktorer
transkripsjonsfaktorer i minimal tilkoblede nettverket identifisert ovenfor sannsynlig representerer de viktigste regulatoriske effektorer vanligvis trengt på de analyserte kreftcellelinjer. Vi fokuserte på de mest sentrale TFS i dette nettverket. Sentralitet av noder i et gitt nett kunne bli estimert ved hjelp av mange parametere. Blant dem, betweenness scorer frekvens der en viss node er innenfor de korteste banene knytter noen to andre noder. Det er antatt å være et godt estimat for sentralitet [39]. Av topp-ranking de 236 MCN nodene i henhold til deres betweenness score, identifiserte vi 59 sentrale proteiner med score over gjennomsnittet. Disse sentrale proteiner viser den samme funksjonelle berikelse som hele MCN.
Vi tilfeldig valgt de 10 sentrale MCN noder. Deres koder genet navn er: TP53, ESR1, CREBBP, MYC, AR, BRCA1, RELA, RARA, EP300 og NFKB2. Disse ti TFS konsentrere 41% av total betweenness kumulative score av de 236 MCN noder. De kan betraktes som huber eller samlere av disse nettverks interaksjoner. Dette er i tråd med «skala gratis» modell som ble foreslått til å styre de TF protein-protein interaksjoner, der huber ble bygget rundt TFS assosiert med malignitet [40]. Vi hevdet at vanlige kreft biomarkører er sannsynlig å finne blant målene for disse mest sentrale TFS. 874 unike målgener av disse ti TFS rapporteres på TFactS katalog. En berikelse analyse av disse genene, ved hjelp av «genetisk tilknytning db sykdom» i DAVID web-verktøyet, avdekket en overrepresentasjon av et stort panel av krefttyper samt ontologier knyttet til immunresponser og inflammatoriske sykdommer (File S1).
kreft-spesifikke gener fra Targets av MCN Central transkripsjonsfaktorer
Enrichment analyse utført på MCN proteiner samt målene for de sentrale TFS viste en sammenheng mellom kreft og betennelser. Denne foreningen er godt dokumentert i litteraturen [41]. Kreft-spesifikke biomarkører har å være forskjellig uttrykt i kreftpasienter sammenlignet med friske individer og pasienter med inflammatoriske sykdommer [42]. I tillegg bør en universell kreft biomarkør være cancer-spesifikk i et bredt panel av tumortyper. Siden vår interesse er å identifisere «tilgjengelig» kreft biomarkører, forsøkte vi å begrense videre analyse bare på gener som koder for utskilling og transmembrane proteiner. SP-PIR merknadsordene database, som anvendt i det DAVID verktøyet, inneholder 1,689 og 642 gener som er merket som koder for utskilt og transmembrane proteiner, respektivt. I de 874 målgener av de ti mest sentrale TFS i MCN, fant vi 57 gener som koder for utskilte proteiner (p-verdi: 1.1E-6) og 110 koding transmembrane proteiner (p-verdi: 4.3E-5). Dette representerer et unikt sett av 157 gener. Dermed identifisere TFS MCN og fokusere på målgener av de ti mest sentrale TFS tillatt oss å prioritere en kort liste over tilgjengelige proteiner som skal analyseres i pasientprøver for differensial uttrykk (figur 1).
Vi videre filtrert dette genet liste ved hjelp av tilgjengelige pasientdata. Vi utførte genekspresjonsanalyser på en samlet microarray store datasett av 8,525 ulike vev fra pasienter med kreft eller betennelse og friske individer (figur 4, File S2). Fra de prioriterte 157 gener, kan vi etablere en liste over 86 kreftspesifikke karakterutskrifter (figur 4). Blant dem, ble 3 gener godkjent av FDA for kreftdiagnostikk, inkludert: EGFR, KLK3 (Ptil) og AFP for diagnostisering av tykktarm, prostata og testis kreft, henholdsvis [43]. Videre HLA-F i denne listen har allerede blitt rapportert som påvises i serum av ulike kreftpasienter som bruker indirekte ELISA [10].
Microarray genuttrykk data som representerer 8,525 pasientprøver ble lastet ned fra GEO. A- 78% av pasientene hadde ulike krefttyper; 14% er sunt individ og ble samplet fra forskjellige vev; 8% av pasientene hadde betennelse /sepsis og ble undersøkt fra hele blodet og annet vev. B- differensial uttrykk for MCN topp ti sentrale TFS målet genet liste koding for utskilling og transmembrane proteiner ble analysert. Blant disse genene, som vist i Venn-diagrammet, ble 140-probe-sett (86 unike gener) funnet å være kreftspesifikke. GI:. Mage-tarm
Potential Biomarkører Vanlig i Cancer
For å styrke sannsynligheten for å finne potensielle felles biomarkører blant kreftspesifikke genet liste (Figur 5), vi filtrert disse genene basert på deres signifikant effekt på pasientens overlevelse i en hvilken som helst av de krefttypene fra TCGA database. De tilgjengelige genuttrykk datasett fra TCGA, dekker ni krefttyper, ble lastet ned og analysert separat for gen-overlevelse forening. For hvert gen, ble pasientene delt i tre grupper (tertiles) i henhold til uttrykket nivåer av den studerte genet. Grupper av pasienter med lav, middels og høy ekspresjon ble deretter oppnådd. Å gjøre bruk av de tilgjengelige pasientens overlevelse data: oppfølging varighet og død status, utstyrt vi Kaplan-Meier-kurver til disse gruppene. Gener forutsi pasientens overlevelse signifikant (log-rank p-verdi = 0,05), i minst en krefttype, er vist i tabell S2. Produktene av disse 50 gener som medierer mange samvirkende baner i kreft, som vist i figur S2 (KEGG pathway anrikning, p-verdi ~4.29E-4).
Cancer-spesifikk genekspresjon betydning og folde forandring. Betydning ble attestert av B-H p-verdi korreksjon, og alle vist gener har B-H p-verdi = 0,05. Bar-plott viser -log10 (ukorrigert p-verdi). Trekanter vise logget ganger endring av tilsvarende genet i kreft sammenlignet med friske og betennelser pasient fenotyper. FDA godkjent kreft biomarkører er merket med (*)
For hvert gen i Tabell S2, vi lagt følgende ressurser:. (I) CNV i vesentlig grad påvirker den tilsvarende genet loci i alle krefttyper som analyseres i Tumorscape databasen [44]; (Ii) prosentandelen av immunhistokjemisk (IHC) positiv farging i kreft som detektert i ProteinAtlas database [45]. Vi vurderte at gener positive for alle kriteriene i tabell S2 er mer sannsynlig å være felles kreft biomarkør kandidater. TFRC, VEGFA og MET er de beste potensielle kandidater. Disse genene er separat forbundet til mange krefttyper i litteratur (tabell S3).
Diskusjoner
krefttyper har blitt vist separat for biomarkør identifikasjon. I dag er det en voksende innsats for å søke etter universell kreftmarkører. De nylig tilgjengelige high-throughput data fra kreftpasientprøver gjør oppgaven mer overkommelig i sammenheng med integrerende analyse. Denne studien ble gjort innenfor en slik ramme.
Kreft er en flertrinns sykdom, der normale celler blir gradvis forvandlet til ondartede seg. Denne prosessen innebærer transkripsjonsfaktor (TF) regulering for å sikre den nødvendige transkripsjon av gener [46]. Vi antok at TFS regulert i kreft ville ha sin aktivitet forklares med deres koding genuttrykk nivå og genomiske forandringer. Vi antok at kreftassosiert TF’er kunne kommunisere sammen i en modulær måte, slik at kreftutløsende hendelser ende opp med å perturbere funksjonen til denne modulen. Biomarkører er felles for mange krefttyper kan være blant disse TF målgener. Vi fulgte arbeidsflyten avbildet i figur 1 til å målrette viktige gener som vanligvis regulert i kreft som koder tilgjengelige proteiner. Vi antok at fokus på TFS vil lede oss til å finne den mest verdifulle delen av kreft informasjon, som kan måles ved genekspresjon [47]. Legge CNV data til å filtrere viktig TFS vil styrke denne tilnærmingen. Mens analysere alle regulerte gener og betydelig endret kromosomale regioner uten kontekstualisering i form av regulatorer (TFS) vil utvanne den vanligste kreftformen biomarkør blant mange falske positive resultater.
Som et første skritt i vår søken etter vanlige kreft biomarkører , vi forsøkt å identifisere den minimale tilkoplede nettverk som involverer TFS, aktiviteten til hvilken er regulert i tumorer. Vi integrert genomikk og transcriptomics data fra et panel av kreftcellelinjer, sammen med inferred TF regulering fra genuttrykk bruker TFactS, som har vist seg tidligere å kunne antyde nøyaktig TF regulering eller aktivitetsstatusen fra en liste over uttrykte gener [30] . Bruken av cellelinjer i dette trinnet, er rettferdiggjort ved tilgjengeligheten av både genomisk og ekspresjonsdata. I tillegg til byggemeningsfylt MCN krever data fra homogene celler, noe som ikke er tilfellet med de fleste primære kreftprøvene, hvor genomiske forandringer og genekspresjon varierer mellom kreftceller og stromale celler, og til og med mellom forskjellige kreftcellekloner. Vi identifiserte 88 TFS, som kan være de viktigste regulatorer i kreftcellelinjer. Dette trinn er imidlertid begrenset av TFS representert i TFactS, selv om de sampler de mest studerte TF’er i litteraturen. Dette trinn kan også bedres ved å ta hensyn til andre genomiske modifikasjoner, så som mutasjoner. Men hele genomet endring data ikke var tilgjengelig ennå for alle de undersøkte cellelinjer.
Etter protein-protein interaksjonsanalyse, har MCN forbinder de fleste av de 88 TFS blitt identifisert fra kuratert menneskelige proteomet nettverk. Den MCN inneholder både TFS og andre proteiner. Berikelse analyse avdekket at denne MCN samler viktigste kjente stier kjører flere krefttyper. Påfallende, immunrespons trasé ble også beriket i MCN, som ble identifisert basert på celle linje, forkaster noen svulst mikromiljøeffekten på disse resultatene. Dette tyder på en dobbel rolle spilt av denne modulen tilkoblede TFS i både kreft og betennelser. Resultater fra vår negativ kontroll prosedyre antydet at kreft-assosiert MCN danner en betydelig modul. Denne modulen mest sentrale TFS er utsatt for å fungere som de viktigste «samlere» av marginale forstyrrelser.
I et andre trinn, vi vilkårlig begrenset vår analyse å målrette gener av de ti mest sentrale MCN TFS. Anrikning analyse av disse genene avslørte kreft kontekst trasé over-representasjon, som forventet. Siden vårt formål var å identifisere gener som kan være lett autosøk hos pasienter vi filtrert dette genet liste til 157 gener som koder for utskilling og transmembrane proteiner. Ved å sammenligne deres uttrykk i et panel av 8,525 pasienter, identifiserte vi et sett av 86 kreftspesifikke gener forskjellig uttrykt i kreft versus normale og betennelse fenotyper. De omfatter tre av seks proteiner som er godkjent av FDA i spesifikke kreftdiagnose: PSA /KLK3, EGFR og AFP. Uttrykk av disse tre genene kan bli kontrollert i andre krefttyper. PSA, prostataspesifikt antigen, for eksempel, selv om mye brukt i prostata kreftdiagnostikk, det ble også rapportert i nyre, mage og brystkreft [48] – [50]. Disse resultatene gir en intern validering av vår metode.
Vi har søkt å ytterligere begrense analyse ved å ta i betraktning den potensielle prognostisk verdi i det minste en krefttype. Dette ble utført ved å knytte genuttrykk til pasient overlevelse i TCGA datasett. 50 gener i betydelig grad forutsies å overleve i det minste i en krefttype. Hver av disse genene kan bli undersøkt separat i den tilsvarende krefttype for prognose. Disse genene er betydelig involvert og sammenhengende i mange kreft baner (Figur S2). Ikke desto mindre, immunmodulerende cytokiner og kjemokiner var også anriket på dette genet listen, noe som kan tyde på at noen av disse gener kan ikke fullt ut å skille pasienter med kreft fra de med inflammatoriske sykdommer.
Vi identifiserte tre potensielle biomarkører som er felles for kreft, dvs. TFRC, VEGFA og MET som dokumentert av: (i) gen over-uttrykk i kreft i forhold til normal og betennelser; (Ii) gen-ekspresjon betydelig koblet til pasientens overlevelse i minst to typer kreft; (Iii) svarende CNV fokalt betydelig forsterket i tumorer; (Iv) proteiner beis positive i mer enn 80% av kreft. VEGFA fremmer angiogenese. Dens diagnostisk potensiale ble undersøkt separat i mange krefttyper (Tabell S3). MET, er en kjent onkogen tyrosinkinase-reseptor for hepatocytt-vekstfaktor. Det er også forbundet med mange krefttyper (Tabell S3). I tillegg har det blitt rapportert som en markør for kreft stamceller i: prostata, hode og nakke, lever, hjerne og lunge-kreft [51] – [56]. VEGFA og MET synergi i angiogenese kan være målrettet for mer effektiv antitumorterapi [57]. TFRC, transferrin reseptor, er kjent for å bli uttrykt i mange tumortyper (Tabell S3). Uttrykk for VEGFA og TFRC er ofte regulert av HIF og MYC, som fremmer angiogenese og spredning, henholdsvis [58] – [60]. Forbindelsen mellom disse to TFS via deres målgener er kjent for å gi en metabolsk fordel å tumorer under hypoxi, som er en vanlig tilstand i ondartede sykdommer, [61], [62].
I sammendrag, strategien identifisert et nettverk av TFS som regulerer 50 mulige felles kreft biomarkører. For tiden tilgjengelige data i TCGA, Tumorscape og ProteinAtlas databaser pekte VEGFA, TFRC og MET gener som potensielle kandidater. Litteratur kunnskap knyttet til disse genene bekrefter vår tilnærming. Til sammen kan alle disse observasjonene foreslår å videre undersøke nytten av VEGFA, MET og TFRC som vanlige kreft biomarkører. Dette kan gjøres ved direkte påvisning av disse biomarkører eller ved å sjekke for tilstedeværelse av autoantistoffer rettet mot potensielle kreft proteiner i pasientens serum, en tilnærming som har fått mye interesse for kreftdiagnose feltet [4], [63].
Materialer og metoder
Microarray analyse
data fra 950 mikromatriser utført av GlaxoSmithKlein laboratorier (GSK) på ulike kreftcellelinjer ble lastet ned fra arrayExpress (E-mtab-37) . RMA normalisering metoden ble brukt ved hjelp xps pakken fra R /Bioconductor [64]. Genekspresjonen på hver cellelinje ble utført på duplikater eller triplikater. Kolmogorov-Smirnov test ble utført for å velge gener som uttrykkes differensielt i hver cellelinje sammenlignet med andre. En Bonferroni korreksjon terskel ble brukt på p-verdier. Gener med en e-verdi = 10 ble ansett som signifikant forskjellig uttrykt på den tilsvarende cellelinje.
transkripsjonsfaktor forordning Analyse
Hvert gen liste regulert i hver cellelinje ble oversendt TFactS å forutsi regulert TFS [30]. TFactS signere mindre katalogen (versjon 2) inneholder 6,823 forskrifter som knytter 345 unike TFS til sine 2,650 unike genet mål. For hver liste over regulerte gener, spår TFactS TFS hvis mål er anriket i de innsendte listene ved hjelp av Fishers test. I denne studien ble det større registrerings mindre katalog som brukes i stedet for den begrensede sign-sensitive ett. TFactS ble henrettet ved hjelp BatchTFactS standardparameterne (www.tfacts.org). TFS med en positiv e-verdi score (-log10 (e-verdi)) ble ansett som vesentlig. TFS som ikke var signifikant i alle cellelinjene ble forkastet før modellen montering.
Genomisk Kopier nummer Variation Analysis
genomikk data for de ovenfor nevnte cellelinjer ble også utgitt av GSK. SNP arrays datasett som er tilgjengelige på arrayExpress ble lastet ned (E-mtab-38). De ble analysert ved hjelp av aroma-Affymetrix pakken på R /Bioconductor [65]. I korthet vi brukt en quantile normalisering fulgt av CRMA samandrag og korrigert for chip og PCR fragment lengde effekter [66]. Så GLAD algoritme ble brukt til rå kopiantall for segmentering [67]. Den segmenterte data ble deretter sendt til GISTIC algoritme for å finne vesentlig endrede regioner i alle kromosomene unntatt X og Y. En standard q-verdi terskel på 0,25 ble brukt til å velge store områder [35]. Før CNV-baserte korrelasjonsmatrisen databehandling og modellen montering, ble CNV for hvert gen i betydelig grad endrede kromosomale regioner normalisert som følger: (i) for hver av de GISTIC-rapporterte betydelige områder, bestemt vi medianverdien av den betydelige CNV topper; (Ii) hvert gen i en betydelig kromosomale region er blitt tildelt verdien av denne median. Verdiene av CNV var i log2-forholdet som kommer som utgang fra GISTIC. Den kromosom plassering av gener ble oppnådd ved å bruke Ensembl gener 64 database med menneskelige «GRCH37.p5» utgivelse i Biomart web verktøy [68].
Identifikasjon av Minimal Connected TF regulert i Cancer Cell Lines
for å identifisere et sett av korrelerte TFS som ofte regulert i kreft, vurderte vi 305 cellelinjer, der både uttrykk og SNP data var tilgjengelige. Hver TF har tre mål i hver cellelinje: TF regulering scorer anslått av TFactS (-log10 (e-verdi)), TF-koding genekspresjon (fra mikromatriser) og TF-locus kopi nummer variasjoner (fra median normalisert GISTIC analyse). Tre matriser, med TFS i rader og cellelinjer i kolonner, kan bygges fra disse data: et TF regulering matrise, et TF-kodende gen-ekspresjon matriks og et TF-locus CNV matrise. I hver av disse matriser, beregnet vi korrelasjoner av hver TF med de andre TFS ved hjelp av Pearsons korrelasjonskoeffisient. Disse sammenhengene kan bli representert som TF-TF korrelasjons profiler. Da vi montert følgende modell for hver TF:
R = β
0+ β
1 * E + β
2 * C
, Hvor:
(R ) TF-TF korrelasjon profil basert på TFactS score, bare TF’er betydelig regulert i minst én cellelinje ble anvendt; (E) TF-TF korrelasjon profil basert på genekspresjon; (C) TF-TF korrelasjon profil fra viktige områder identifisert av GISTIC algoritmen, disse sammenhengene ble beregnet ved hjelp loci kopiere antall variasjons median-normalisert verdier.
Hver TF har sterk
β
1
(p-verdi = 0,05) og
β
2 plakater (p-verdi = 0,05) ble ansett som Korrelativt regulert i kreft.