PLoS ONE: Bruk av Genome-Wide Association Studies for Cancer Research and Drug Repositioning

Abstract

Selv om genom-wide association studier har identifisert mange risiko loci forbundet med kolorektal kreft, det molekylære grunnlaget for disse assosiasjonene er fortsatt uklar. Vi forsøkte å antyde biologiske innsikt og fremheve kandidat gener av interesse innenfor GWAS risiko loci. Vi brukte en

i silico

rørledning basert på funksjonell annotering, loci kvantitativ egenskap kartlegging av cis-virkende genet, PubMed tekst-mining, protein-protein interaksjonsstudier, genetiske overlapping med kreft somatiske mutasjoner og knockout mus fenotyper, og funksjonelle berikelse analyse for å prioritere kandidat gener ved tykktarmskreft loci. Basert på disse analysene, observerte vi at disse genene var målene for godkjent behandling for tykktarmskreft, og foreslo at legemidler godkjent for andre indikasjoner kan gjenbrukes for behandling av tykktarmskreft. Denne studien fremhever bruk av offentlig tilgjengelige data som en kostnadseffektiv løsning for å utlede biologiske innsikt, og gir en empirisk bevis for at det molekylære grunnlaget for tykktarmskreft kan gi viktige potensielle kunder for oppdagelsen av nye legemidler

Citation.: Zhang J, Jiang K, Lv L, Wang H, Shen Z, Gao Z, et al. (2015) Bruk av Genome-Wide Association Studies for Cancer Research and Drug reposisjonering. PLoS ONE 10 (3): e0116477. doi: 10,1371 /journal.pone.0116477

Academic Redaktør: Giuseppe Novelli, Tor Vergata University of Rome, ITALY

mottatt: 27 september 2014; Godkjent: 08.12.2014; Publisert: 24 mars 2015

Copyright: © 2015 Zhang et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer

Finansiering:. Dette arbeidet ble støttet av National Key Technology Support Program (Grant nummer~~POS=HEADCOMP: 2104000032), National Natural Science Foundation of China (Artikkelnummer nummer~~POS=HEADCOMP: 81372290) og National Natural Foundation Science of China (Artikkelnummer nummer~~POS=HEADCOMP: 81372291).

konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Siden advent av høy tetthet enkeltnukleotidpolymorfi (SNP) genotyping arrays, har forskerne brukt genom-wide assosiasjonsstudier (GWAS) for å identifisere utallig loci assosiert med en rekke sykdommer. De aller fleste av SNPs identifisert av GWAS er innenfor intergeniske eller intronic regioner (ca 88%) [1,2]. GWAS har også muliggjort oppdagelsen av mange genetiske varianter av kolorektal kreft (CRC). Neste skritt var å identifisere gener som ble berørt av årsaks varianter, noe som ville gjøre det mulig for oss å oversette risiko SNPs til meningsfulle innsikt i patogenesen.

De fleste rapportene har rett og slett innblandet nærmeste genet til et GWAS treffe så en målet på den funksjonelle varianten uten noen bevis [1]. Identifiseringen av ekspresjon kvantitativ egenskap loci (eQTL) er foreslått som en lovende metode for å finne de kandidat gener assosiert med en sykdomsrisiko [3] [4]. Det bør bemerkes at å identifisere en eQTL gir bare et indirekte bevis for en sammenheng mellom genotype og gentranskripsjon [1].

Så vidt vi vet, det er rett og slett ingen god måte å identifisere disse målgener, som er nøkkelen til å forstå mekanismen som GWAS varianter handling. Så vi foreslått en bioinformatikk rørledning til å prioritere de mest sannsynlige kandidat gener ved å bruke flere biologiske datasett. Syv kriterier ble vedtatt å prioritere kandidat gener. Den er mye brukt eQTL kriterium nevnt ovenfor er bare ett av syv kriterier i rørledningen.

En måte å akselerere oversettelse av data fra GWAS i kliniske fordeler, er å bruke resultatene til å identifisere nye indikasjoner for behandling med eksisterende molekyler. GWAS kan brukes til å konstruere legemiddelrelaterte nettverk, hjelpe medikament reposisjonering. Selv GWAS ikke direkte identifisere de fleste av de eksisterende narkotika mål, er det flere grunner til å anta at nye mål vil likevel bli oppdaget ved hjelp av disse dataene [5,6]. Første resultatene på legemiddel repurposing studier med nettverksanalyse er oppmuntrende og foreslår retninger for fremtidig utvikling [7]. Ved å integrere revmatoid artritt genetiske funnene med katalog over godkjente legemidler mot leddgikt og andre sykdommer, Okada Y et al gitt en empirisk data for å indikere at genetiske metoder kan være nyttig for å støtte genetikk drevet genomiske drug discovery innsats i komplekse menneskelige trekk [8 ].

i denne studien brukte vi

i silico

rørledning til systematisk integrere data på risiko loci for CRC biologi og medisiner fra en rekke databaser.

materialer og metoder

en oversikt over studiedesign er vist i fig. 1. Biologiske kandidat gener ble hentet fra GWAS-identifisert CRC risiko loci. Deretter ble de genetiske dataene integrert med resultatene av statistiske analyser, beregnings tilnærminger, og offentlig tilgjengelige store datasett for å prioritere de oppnådde gener, og foreslå nye mål for medikamentelle behandlinger.

Ett hundre og førtisju kandidat -gener ble oppnådd fra 50 CRC risiko loci. En bioinformatikk rørledning ble utviklet for prioritering av disse kandidat gener. Syv kriterier ble brukt å score genene: (1) CRC risiko missense variant; (2)

cis

-eQTL; (3) PubMed tekst gruvedrift; (4) PPI; (5) kreft somatisk mutasjon; (6) knockout mus fenotype; og (7) funksjonell berikelse. Grad av overlapping med målgener for godkjente CRC narkotika ble også vurdert.

CRC risiko loci fra GWAS

Vi har lastet ned CRC risiko SNPs fra National Human Genome Research Institute (NHGRI) GWAS catalog database på 31 januar 2014 [2]

Biologiske kandidat gener fra CRC risiko loci

det er et velkjent faktum at risikoen SNPs indikerer haplotyper som de funksjonelle varianter bor.; Derfor, neste trinn var å identifisere sine mål gener. Ved å vedta multi-merknader mellom risiko SNPs og deres omkringliggende genene,

snp2gene

tillatt konvensjonell merknad på grunn av sin nærhet, samt koblingsulikevekt [9].

For hver av de GWAS SNPs involvert, brukte vi

snp2gene

å identifisere kandidatgener. For hvert gen i risiko loci, vi evaluert dersom genet var det nærmeste genet til CRC risiko SNP innenfor den risiko locus.

Prioritering av kandidatgener

Ved å bruke flere biologiske datasett, vi utviklet en bioinformatikk rørledning til å prioritere de mest sannsynlige kandidat gener.

for det første, funksjonelle kommentarer for CRC risiko SNPs ble identifisert ved

ANNOVAR product: [10]. Egenskap assosierte varianter ble beriket innenfor kromatin karakterer, spesielt i H3K4me3 [11]. H3K4me3 data for 34 celletypene kunne gi den fine kartlegging av tilhørende SNPs for å identifisere årsaks variasjon i de tidligere studier [12]. Så vi vurdert om risiko SNPs CRC og SNPs i koblingsulikevekt (r

2 0,80) ble overlappende med H3K4me3 toppene i 34 celletyper. De H3K4me3 data ble hentet fra National Institutes of Health Roadmap Epigenomics Mapping Consortium, med en permutasjon prosedyre med 10

5 iterasjoner [12]. Vi identifiserte gener for CRC risiko SNPs eller SNPs fra koblingsulikevekt (r

2 0,80) som ble kommentert som missense varianter

For det andre, vi vurderte

cis

ekspresjon kvantitativ. egenskap loci (

cis

-eQTL) effekter ved hjelp av data fra 5,311 europeiske temaer fra studien på perifere mononukleære blodceller (PBMC) [13]. Westra HJ et al. hadde gjort en nettleser tilgjengelig for alle vesentlige

cis

-eQTLs, oppdaget ved en falsk-funnrate på 0,50. (https://genenetwork.nl/bloodeqtlbrowser/) i sin studie, eQTLs ble ansett

cis

-eQTLs når avstanden mellom SNP kromosomale posisjon og sonden punktet var mindre enn 250 kb. De eQTLs ble kartlagt ved hjelp av Spearmans rank korrelasjon på kalkulatoriske genotype doser. Resulterende korrelasjoner ble deretter konvertert til P-verdier, og deres respektive z score ble vektet med kvadratroten av utvalgsstørrelsen.

For å evaluere

cis

-eQTL gener av risiko SNPs, var det bare nødvendig å gi all risiko SNP. Når CRC risiko SNP var ikke tilgjengelig i eQTL datasett, vi alternativt brukes resultatene av beste proxy SNPs i koblingsulikevekt med høyest r

2 verdi (r

2 0,80).

for det tredje, ved hjelp av Gene Relasjoner mellom innblandet Loci (

GRAIL

), vurderte vi graden av slektskap mellom gener innenfor sykdoms regioner.

GRAIL

er et verktøy for å undersøke sammenhenger mellom gener i forskjellig sykdom forbundet loci. Gitt mange genomiske regioner eller SNPs assosiert med CRC,

GRAIL

søk etter likheter i den publiserte vitenskapelige teksten blant de tilhørende genene [14]. En p-verdi på 0,05 ble betraktet som signifikant. For å unngå publikasjoner som rapporterte om eller var påvirket av sykdommen regioner oppdaget i de siste skanner, bruker vi bare de PubMed abstracts publisert før desember 2006 før den siste stormløp GWA papirer som identifiserer nye foreninger, unngå sterk bias mot genene nærmeste til de tilhørende SNPs. Denne tilnærmingen unngår effektivt dette problemet. [14].

Deretter brukte vi Disease Association Protein-Protein Link Evaluator

(Brun)

for å vurdere tilstedeværelsen av betydelig fysisk tilkobling mellom proteiner kodet av kandidat gener av protein-protein interaksjoner (PPI), er rapportert i litteraturen.

Eples

tar en liste over frø SNPs som konverterer dem til gener basert på overlappingen. Hypotesen bak Eples er at en genetisk variasjon påvirker et begrenset sett av underliggende mekanismer som er påviselig av PPI [15]. En p-verdi på 0,05 ble betraktet som signifikant

Nest, fikk vi kreftsomatiske mutasjoner gener fra Katalog av somatiske mutasjoner i Cancer (

COSMIC

) database [16], og lastet ned knockout. mus fenotype etiketter og genet informasjon fra databasen Mouse Genome informatikk (MGI) [17] 8. april 2014. Vi definerte alle CRC risikogener som inngår i CRC risiko loci, og evaluert overlapping med kreft fenotyper med registrerte somatiske mutasjoner, og fenotype etikettene på knockout mus gener med menneskelige ortologe. Hypergeometrisk fordeling test ble brukt for overlapping statistiske analyser med betydning på en p-verdi på. 0,05

Til slutt, vi utførte funksjon berikelse analyse for å undersøke om gener påvirkes av SNPs ble beriket for spesifikke funksjonelle kategorier eller veier. David Bioinformatikk Resources som inkluderte Gene ontologi (GO), Kyoto Encyclopedia of gener og genomer (KEGG) og omim (OMIM) ble brukt for analyser. [18] Resultatene ble vurdert signifikant på

p

verdi av 0,05

Vi scoret hvert av gener ved hjelp av følgende kriterier, og beregnet antall fornøyde kriterier:. (1) gener med missense varianter; (2)

cis

-eQTL gener av risiko SNPs; (3) gener prioritert av PubMed tekst gruvedrift; (4) gener prioritert av PPI nettverk; (5) kreft somatisk mutasjon gener; (6) gener prioritert av forbundet knockout mus fenotyper; og (7) gener prioritert av funksjonelle berikelse analyse.

Korrelasjoner av kandidat genet prioriteringskriteriene ble evaluert av Pearson korrelasjonsanalyse. Hvert gen ble scoret basert på antall kriterier som ble møtt (score varierte 0-7 for hvert gen) i tilfelle av svake sammenhenger. Gener med en score på ⩾2 ble definert som «biologiske risikogener».

Drug validering og funn

Hvis human genetikk kan validere narkotika mål, så den kan brukes til å identifisere om godkjent medikamenter som for tiden anvendes for behandling av andre indikasjoner kan anvendes for behandling av CRC. Vi presenterer her en analyse av potensialet anvendelsen av GWAS data, narkotika reposisjonering.

Vi har fått stoffet målgener og tilhørende legemiddelinformasjon fra Drug Bank [19] og terapeutiske mål Database (TTD) [20] på okt 18 2013. Vi valgte medikamentet målgener som hadde farmakologiske aktiviteter og var effektive i menneskelige ortologe modeller, og de som annotert med noen av godkjent, klinisk studie eller eksperimentelle medikamenter.

de narkotika målgener kommenterte til CRC narkotika ble manuelt hentet av profesjonelle onkologer. For å redusere satsene for de falske positive, bare de legemidler i henhold til gjeldende klinisk bruk var involvert i studien, som kan bli funnet i NCCN klinisk praksis retningslinjer i kolorektal kreft. [21]

Vi hentet gener fra direkte PPI med biologiske CRC risikogener ved å bruke protein interaksjon nettverksanalyse-2 (

PINA2)

, som integrerer seks kjente manuelt kuratert PPI databaser [22].

Vi har evaluert muligheten for å utforske proteinprodukter fra de identifiserte biologiske risikogener, eller noen gener fra en direkte PPI nettverk som mål for godkjente CRC narkotika eller legemidler for andre indikasjoner. La x være mengden av de biologiske CRC risiko gener og gener i direkte PPI med dem (n

x gener), y være mengden av gener med protein produkter som er direkte mål for godkjente CRC legemidler (n

y gener) og z være mengden av gener med protein produkter som er direkte mål for alle godkjente legemidler (n

z gener). Vi definerte n

x∩y og n

x∩z som antall gener overlappende mellom x og y og mellom x og z, hhv. Hypergeometrisk fordeling tester ble brukt for overlapping statistiske analyser, og ap verdien av 0,05 ble ansett som statistisk signifikant

Resultater

I denne studien ble 50 CRC-forbundet SNPs hentet fra NHGRI (. Tabell 1), og 140 gener ble innhentet basert på nærhet og koblingsulikevekt med

snp2gene plakater (S1 tabell).

Funksjonell merknader av CRC risiko SNPs

de fleste SNP’er (62%) ble plassert i det intergeniske regionene (S2 Table). To SNPs ble identifisert i koblingsulikevekt med missense SNPs (r

2 0,80; S3 tabell). Deretter vurderes vi 50 CRC risiko loci for beriket epigenetiske kromatin merkene [12]. Av de 34 celletyper undersøkt, observerte vi en betydelig berikelse av CRC risiko alleler med H3K4me3 toppene i endetarmsslimhinnen celler (

p

= 0.00014 og 0.00023, henholdsvis) (S4 tabell).

Cis ekspresjon kvantitativ egenskap loci (

cis

-eQTL)

Bruke

cis

-eQTL data innhentet fra PBMC studie [13], fant vi at 13 risiko SNPs viste

cis

-eQTL effekter (p 0,0016 og FDR 0,5). (S5 Table)

PubMed tekst-mining

Tjuefire genene ble prioritert basert på data innhentet av PubMed tekst gruvedrift ved hjelp av

GRAIL

med gen-basert p 0.05 [14] (S6 Table)

Protein-protein interaksjon (PPI)

To gener ble prioritert av PPI nettverk ved hjelp av gen-basert

Eples

med p 0.05 [15] (S7 tabell).

Kreft somatisk mutasjon

Blant de 522 genene med registrerte somatiske mutasjoner hentet fra den kosmiske databasen [16], en betydelig overlapping ble observert i gener assosiert i ikke-hematologisk kreft (5/6, p = 2.41E -05) (S8 tabell).

Knockout musen fenotype

Vi har evaluert lapper med gener involvert i knockout mus fenotyper [17]. Blant de 30 kategoriene av fenotyper, observerte vi ni kategorier betydelig beriket med CRC risikogener (p 0,05)., Ledet av kraniofaciale fenotype (S9 Table)

Funksjonell berikelse analyse

GÅ analyse indikerte at noen få gener ble beriket i tre kategorier (S10 Table); to med KEGG trasé observert i kreft (p = 0,002), og en med småcellet lungekreft (p = 0,011) var funksjonelt relatert (S11 tabell). Funksjonell analyse av OMIM demonstrerte beriket gensettene i kolorektal sykdommer (S12 tabell)

Basert på disse nye funnene, vi innført følgende syv kriterier for å prioritere hver av de 140 genene fra 50 CRC risiko loci. (1 ) gener med CRC risiko missense variant (n = 2); (2)

cis

-eQTL gener (n = 13); (3) gener prioritert av PubMed tekst gruvedrift (n = 24); (4) gener prioritert av PPI (n = 2); (5) kreft somatisk mutasjon gener (n = 6); (6) gener prioritert av forbundet knockout mus fenotyper (n = 40); og (7) gener prioritert av funksjonelle berikelse analyse (n = 31)

Fordi disse kriteriene viste svake korrelasjoner med hverandre (R

2 0,48; S13 tabell)., hvert gen ble scoret basert på rekke kriterier som ble møtt (score varierte 0-7 for hvert gen)

Trettifem gener (25,2%) hadde en poengsum . 2, som ble definert som «biologiske risikogener» ( S1 fig.). Tre loci inkludert flere biologiske CRC risikogener, (for eksempel ROS1 og GOPC av rs2057314) (tabell 2).

Å gi empirisk bevis på rørledningen, analyserte vi genet score. Gener med høyere biologisk score var mer sannsynlig å være nærmest risiko SNP (62,8% for genet scorer ⩾ 2, 24% for genet poengsum 2; p 0,001). I mellomtiden, endetarms slimhinner celler viste betydelige overlappende proporsjoner med H3K4me3 topper sammenlignet med andre celletyper.

Til slutt, vi evaluerte potensielle rolle genetikk i forhold til medisiner for behandling av CRC. Hypergeometrisk fordeling tester ble brukt for overlapping statistiske analyser. Vi fikk 11303 gener parene fra kuratert PPI databaser. Vi fikk 871 narkotika målgener tilsvarende godkjent, i kliniske studier eller eksperimentelle medikamenter for menneskelige sykdommer (S14 Table). For å få til beregning pålitelighet, ble bare CRC legemidler i førstelinjeterapi er involvert i studien. Åtte målgener av godkjente CRC narkotika ble inkludert (S15 tabell).

Tretti-en biologisk CRC risikogener overlappet med 533 gener fra den utvidede PPI nettverk (S2 Fig. Og S3 Fig.). Vi fant en overlapping på 5/8 narkotika målgener av godkjente CRC legemidler (5/8 vs 70/781, 12.09-fold berikelse, P = 0,00013). Alle 871 legemiddel målgener (uavhengig av sykdomsindikasjon) overlappet med 70 genene fra PPI-nettverket, noe som antydet at anrikning var 1,55 ganger høyere enn det som forventes ved en tilfeldighet alene (p = 0,00012), men mindre ved 7,78 ganger sammenlignet med tiden godkjente CRC legemidler (p = 1,78 × 10

-5). Eksempler på godkjente CRC terapier identifisert av denne analysen inngår irinotecan, regorafenib, og cetuximab (fig. 2).

Svarte linjer viser tilkoblinger.

Korrelasjonen av godkjente legemidler for andre sykdommer med biologisk CRC risiko genet ble også vurdert. Et eksempel på legemiddel reposisjonering (Fig. 3) er bruken av crizotinib, et godkjent legemiddel for ikke-småcellet lungekreft for behandling av CRC [16]. Arsenikk vrinostat, dasatinib, estramustin, og tamibarotene er alle lovende legemidler for behandling av CRC (Fig. 4).

Diskusjoner

GWAS har identifisert utallige sykdoms tilhørende genetiske varianter. Imidlertid har betydelige hindringer hemmet vår evne til å identifisere gener som påvirkes av årsaks varianter og å belyse den mekanismen som genotype påvirkninger fenotype.

De fleste rapportene har rett og slett innblandet nærmeste genet til et GWAS treffe uten betydelige bevis [1] . Denne studien prioritert de mest sannsynlige målet gener. Hele 31 biologiske CRC risiko gener ble identifisert. Selv om biologiske CRC risikogener er mer sannsynlig å være årsaks gener, fortsatt må dette bekreftes av grunnleggende molekylære studier ved hjelp av avansert teknologi. Edwards et al gitt en rørledning for oppfølgingsstudier, som inkluderer fin kartlegging av risiko SNPs, prioritering av antatte funksjonelle SNPs, og in vitro og in vivo eksperimentell verifikasjon av anslåtte molekylære mekanismer for å identifisere de målrettede gener [1].

GWAS kritiseres for deres mangel på klinisk oversettelse på grunn av størrelsen på effekten. Men, enkelte små effektstørrelser ikke nødvendigvis utelukker klinisk nytte. Sanseau et al foreslått bruk av GWAS for narkotika reposisjonering, som regnes som en lovende strategi i translasjonell medisin. I en studie som undersøker 3-hydroksy-3-metyl-glutaryl koenzym A, et velkjent kolesterolsenkende medikamenter, ble SNP’er innenfor dette genet entydig forbundet med lav tetthet lipopolysakkarid kolesterolnivåer i GWAS dataene. [6] Deres studie inkluderte alle GWAS-assosierte gener som ble valgt fra GWAS katalogen, uten prestasjon om CRC narkotika.

I denne studien har vi fokusert på gjenbruk narkotika for CRC basert på prioritering av kandidatgener i de GWAS-identifiserte loci. For eksempel er crizotinib, arsenikk, vrinostat, dasatinib, estramustin, og tamibarotene lover også repurposed legemidler for CRC. Selv om ytterligere undersøkelser er nødvendig for å bekrefte resultatene av denne studien, opine vi at de nevnte medisiner valgt kan være lovende legemiddelkandidater i behandlingen av CRC.

GWAS data er nyttig for å gi innsikt i biologien til sykdommer, men kan også oversette disse fører til lønnsomme muligheter i utvikling av legemidler. Men GWAS data ikke gi detaljert patofysiologisk informasjon; følgelig kan de nylig identifiserte anvendelser av gamle medisiner muligens være bivirkninger [23]. Vellykket gjenbruk av et legemiddel innebærer en kombinasjon av resultater fra publisert litteratur og klinisk forskning.

Selv om det var en rekke positive sider fra denne studien, var det noen begrensninger også. For det første data av PBMC-undersøkelsen ble brukt for

cis

-eQTL analyse. Selv om eQTLs identifisert fra en vevstype kan være et nyttig surrogat for å studere genetikk av genekspresjon i et annet vev [24], er bruken av vevs-spesifikke eQTLs sannsynligvis mer nyttig for å forstå patogenesen av CRC [25]. For det andre, av de 34 celletyper undersøkt, vi bare observert en betydelig berikelse av risiko SNP med H3K4me3 toppene i endetarmsslimhinnen celler. Likevel berikelse var ikke signifikant for tykktarmsslimhinnen celler.

I denne studien har vi integrert genetiske data og statistisk analyse, beregnings tilnærminger, og offentlig tilgjengelige store datasett for å prioritere kandidat gener, og foreslå nye mål for CRC medikamentell behandling. Vi mener at målet gener og narkotika valgt av denne tilnærmingen kan være lovende fører i utviklingen av kandidat legemidler for behandling av CRC, selv om videre undersøkelser er garantert for bekreftelse av disse resultatene.

Hjelpemiddel Informasjon

S1 fig. . Histogram fordeling av genet score

Trettifem gener med en score på 2 ble definert som «biologiske risikogener «

doi: 10,1371 /journal.pone.0116477.s001 plakater (TIF)

S2 fig. Overlapping av 31 biologiske gener pluss 553 gener i direkte PPI med dem og narkotika målgener.

Vi fant overlapping av 5 gener fra de åtte narkotika målgener av godkjente CRC legemidler (12.09-fold berikelse, p = 1,78 × 10

-5). Alle 871 narkotika målgener (uavhengig av sykdom indikasjon) overlappet med 70 gener fra PPI nettverk, noe som indikerer en 1,55 ganger høyere berikelse enn forventet ved en tilfeldighet alene (p = 1,20 × 10

4); men mindre enn 7,78 ganger berikelse sammenlignet med CRC legemidler (p = 1,30 × 10

-4)

doi:. 10,1371 /journal.pone.0116477.s002 plakater (TIF)

S3 Fig. PPI nettverk av biologiske CRC risikogener og narkotika målgener product: Pink. Narkotika mål gener; Oransje: CRC risikogener; Cyan:. Direkte PPI gener i PINA2 database

doi: 10,1371 /journal.pone.0116477.s003 plakater (TIF)

S1 Table. Oppsummering av 140 kandidat gener basert på nærhet og koblingsulikevekt

doi:. 10,1371 /journal.pone.0116477.s004 plakater (XLSX)

S2 Table. Risiko SNPs kommenterte etter

annovar

doi:. 10,1371 /journal.pone.0116477.s005 plakater (XLSX)

S3 Table. Missense variant i koblingsulikevekt (r

2 0,8) med risiko enkeltnukleotidpolymorfi kommentert av

ANNOVAR

doi:. 10,1371 /journal.pone.0116477.s006 plakater (XLSX)

S4 Table. Overlapping av tykktarmskreft risiko enkeltnukleotidpolymorfi med H3K4me3 topper i cellene

doi:. 10,1371 /journal.pone.0116477.s007 plakater (docx)

S5 Table.

cis

ekspresjon kvantitativ egenskap loci av tykktarmskreft risiko enkeltnukleotidpolymorfi

doi:. 10,1371 /journal.pone.0116477.s008 plakater (XLSX)

S6 Table. Gener prioritert av PubMed tekst mining

doi:. 10,1371 /journal.pone.0116477.s009 plakater (XLSX)

S7 Table. . Gener prioritert av protein-protein interaksjon nettverk

doi: 10,1371 /journal.pone.0116477.s010 plakater (XLSX)

S8 Table. Overlapping av kolorektal kreft risikogener med kreftsomatiske mutasjoner gener

doi:. 10,1371 /journal.pone.0116477.s011 plakater (XLSX)

S9 Table. Gener prioritert av knockout mus fenotype ved hjelp av hypergeometrisk fordeling test

doi:. 10,1371 /journal.pone.0116477.s012 plakater (docx)

S10 Table. Gener prioriterte gå berikelse analyse

doi:. 10,1371 /journal.pone.0116477.s013 plakater (XLSX)

S11 Table. Gener prioritert av KEGG berikelse analyse

doi:. 10,1371 /journal.pone.0116477.s014 plakater (XLSX)

S12 Table. Gener prioritert av OMIM berikelse analyse

doi:. 10,1371 /journal.pone.0116477.s015 plakater (XLSX)

S13 Table. Korrelasjoner av biologiske kandidat genet prioriteringskriterier

doi:. 10,1371 /journal.pone.0116477.s016 plakater (XLSX)

S14 Table. En liste over medikament målgener

doi:. 10,1371 /journal.pone.0116477.s017 plakater (docx)

S15 Table. Oversikt over godkjente legemidler for tykktarmskreft og målgener

doi:. 10,1371 /journal.pone.0116477.s018 plakater (docx)

bekreftelser

Takk for hjelpen av data analyse fra Suzhou BioNovo Gene Co, LTD:

Finansieringskilde:.

Dette arbeidet ble støttet av National Key Technology Support Program (Grant nummer~~POS=HEADCOMP: 2104000032), National Natural Science Foundation of China (Sak Foundation 81372290) og National Natural Science of China (Artikkelnummer nummer~~POS=HEADCOMP:: antall 81372291)

.

Legg att eit svar