Abstract
En
i silico
kjemiske genomikk tilnærming er utviklet for å forutsi narkotika reposisjonering (DR) kandidater for tre typer kreft: glioblastom, lungekreft og brystkreft. Den er basert på en nylig stor-skala datasett av ~ 20000 medikament-indusert ekspresjon profiler i flere cancercellelinjer, som gir i) en global innvirkning av transkripsjonen forstyrrelse av både kjente mål og ukjent off-mål, og ii) fyldig informasjon om stoffets mode-of-action. Først blir legemiddelindusert uttrykk profil vist mer effektiv enn annen informasjon, som for eksempel stoffet struktur eller kjent mål, bruker flere HTS datasett som objektive benchmarks. Spesielt nytten av vår metode ble robust demonstrert i å identifisere nye DR kandidater. For det andre, spådde vi 14 high-scoring DR kandidater utelukkende basert på uttrykk signaturer. Åtte av de fjorten stoffene viste signifikant anti-proliferativ aktivitet mot glioblastom;
i
.
e
., Ivermectin, trifluridine, astemizol, amlodipin, maprotilin, apomorfin, Mometasone, og nortriptylin. Vår DR stillingen sterkt korrelert med den for cellebaserte forsøksresultatene; de beste syv DR kandidater var positive, svarende til en omtrent 20 gangers anrikning, sammenlignet med konvensjonelle HTS. Til tross for diverse originale indikasjoner og kjente mål, støyfulle veier av aktive DR kandidater viser fem forskjellige mønstre som danner tette klynger sammen med en eller flere kjente kreftlegemidler, noe som tyder på vanlig transkriptomet nivå mekanismer for anti-proliferativ aktivitet.
Citation: Lee H, Kang S, Kim W (2016) Drug reposisjonering for kreft terapi basert på store narkotika-indusert Transkripsjonell signaturer. PLoS ONE 11 (3): e0150460. doi: 10,1371 /journal.pone.0150460
Redaktør: Enrique Hernandez-Lemus, National Institute of Genomic Medicine, MEXICO
mottatt: 10 november 2015; Godkjent: 15 februar 2016; Publisert: 08.03.2016
Copyright: © 2016 Lee et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet:. All relevant data er i avisen og dens saksdokumenter filer
Finansiering:. WK ble støttet av National Research Foundation (NRF) stipend (NRF-2014R1A2A2A01007166) and Technology Innovation Program (10050154) finansiert av departementet for handel, industri Energi fra Korea
Konkurrerende interesser:. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Drug reposisjonering (DR) refererer til identifisering av nye indikasjoner for eksisterende. narkotika [1] og er ansett som en effektiv rute for legemiddelutvikling fordi det reduserer kostnadene og omgår sikkerhetsproblemer. Imidlertid å finne nye indikasjoner med DR er svært vanskelig, selv med veletablerte high-throughput screening (HTS), på grunn av de tallrike kombinasjoner av begge analysene og legemidler [2]. På grunn av disse begrensninger har de omplasserte medikamenter blitt utviklet lykketreff.
I silico
DR er ansett som et alternativ og effektiv rute til å etablere nye forbindelser mellom sykdommer og eksisterende legemidler [3,4]. Fremskritt i systemer farmakologi tilnærminger og vekst av narkotika-target informasjon har økt suksess for
i silico
DR [5,6]. Et bredt spekter av datasett har blitt utnyttet, for eksempel sett knyttet til kjemisk struktur [7,8], narkotika-target forhold [9], og fenotypiske informasjon, inkludert bivirkninger [10-14]. For eksempel Cheng
et al
. identifisert simvastatin og ketokonazol som potente anti-proliferative midler i brystkreft ved å analysere en narkotika-målet nettverket [15]. Spesielt har store kjemiske genomikk data, for eksempel tilkoblingskart eller CMAP [16], gitt fyldig informasjon om moduser-of-handling av narkotika som er reflektert i transcriptomic reaksjoner på grunn av kjemisk forstyrrelse. Men de relative verktøy i ulike datasett ble ikke strengt evaluert fordi det sammensatte sett CMAP var ikke stor nok for integrerende statistisk analyse.
Den nyeste versjonen av CMAP består av genuttrykk profiler av fem cellelinjer som ble behandlet med ~ 1300 forbindelser, hvorfra mange
i silico
DR metoder ble utviklet ved hjelp av dette datasettet, enten alene eller i kombinasjon med annen informasjon [17-25]. Den negative korrelasjonen av genekspresjon med en sykdom som har ført til identifisering av topiramat for behandling av inflammatorisk tarmsykdom (IBD) og cimetidin for behandling av lunge adenokarsinom [19,20]. Iskar
et al
. ytterligere avslørte virkningsmåter for flere medikamenter ved hjelp av narkotikainduserte uttrykk moduler bevart mellom mennesker og rotter. Nylig har en lignende, men svært utvidet versjon av en kjemisk genomikk datasett ble offentliggjort av NIH LINCS program (Library of Integrated Network-baserte Cellular signaturer). Dette datasettet består av genekspresjon signaturer og proteinbinding, mobilnettet fenotypiske og phosphoproteomic profiler på grunn av kjemisk eller genetisk forstyrrelse. Spesielt det produserte genuttrykk profiler av ~ 1000 landemerke gener (L1000) i respons til 20.000 kjemiske forstyrrelser på tvers av mange cellelinjer. I tillegg utledes de transkriptomet nivå uttrykk profiler av ~ 20.000 gener beregnings bruker de 1000 landemerke gener [26].
I denne studien har vi vedtatt en integrerende tilnærming for
i silico
DR bruker uttrykk signatur (E) avledet fra den siste store, kjemiske genomikk datasett (LINCS) samt kjemiske struktur (S) og målet signaturer (T). Deretter søkte vi vår metode for å slutte DR kandidat anti-kreft narkotika for glioblastom, lungekreft og brystkreft. Vi fokusert på muligheten til å identifisere nye DR kandidater som ikke er strukturelt beslektet med kjente anti-kreft legemidler på grunn strukturelle analoger kan lett utledes av andre strukturbaserte metoder [27,28]. Den LINCS datasettet omfatter et tilstrekkelig stort antall forbindelser som tillot den objektive evaluering av den prediktive kraften i hver signatur. Vi spådde nye DR kandidater for glioblastom. Den høye-scoring kandidat narkotika ble eksperimentelt validert ved hjelp av kreftcellelinjer og pasient avledet primære celler. Den LINCS datasettet også gjort oss i stand til å tolke virknings av validerte DR kandidatene.
Materialer og metoder
kjent medikament satt og sammensatte-target informasjon
Den kjente stoffet sett (KD sett eller
gullstandarden
) ble hentet fra flere offentlige databaser av DrugBank [29], CTD [30], pubchem [7], og KEGG DRUG [31] for glioblastom, lungekreft og brystkreft kreft. I tillegg har vi manuelt kuratert aktive forbindelser og narkotika fra PubMed ved å søke abstracts som eksplisitt beskrevet anti-kreft aktiviteter for disse tre typer av kreft (S1 Table). En typisk spørring inkluderte flere termer, for eksempel «apoptose», «spredning», «cellevekst «,» cytotoksisitet «,» anti-kreft», «cytotoksisitet», og «økt overlevelse» etter behandling. Forbindelsen-target informasjonen ble samlet inn fra 10 offentlige datakilder: DrugBank [32], KEGG [31], MATADOR [33], TTD [34], KiDB [35], BindingDB [36], ChEMBL [37], WOMBAT [ ,,,0],38], CTD [30], og DCDB [39]. Vi inkluderte bare de sammensatte målgruppen interaksjoner støttet av rettet bevis, for eksempel sammensatte-target bindende, aktivering, hemming, og reaksjon på en rimelig høy affinitet (
e
.
g
., Ki 10 nM). Gjennom analysen ble forbindelser og protein mål kartlagt til NCBI pubchem Sammensatte identifikatorer (CID) og Entrez Gene ID som standard identifikatorer, henholdsvis.
Expression signaturer for målet sykdommer
Uttrykket profiler for målet sykdommer ble lastet ned fra enten TCGA data portal (https://tcga-data.nci.nih.gov) eller NCBI GEO [40] som inkluderte både normale og sykdomstilstander. De glioblastom datasett av 200 pasienter ble hentet fra TCGA som ble delt inn i fire kanoniske subtyper-klassisk, mesenchymale, proneural, og nevrale. Fire distinkte uttrykk signaturer ble hentet for de tilsvarende subtyper. For lunge og bryst kreft, 11 og 16 mikromatrisedatasettene ble oppnådd, henholdsvis. De 11 lungekreft datasett besto av GDS1761, GDS1312, GDS2771, GSE5364, GSE7670, GSE10072, GSE10799, GSE1987, GSE2088, GSE1037, og GSE11969. De 16 brystkreft datasett besto av GDS817, GDS820, GDS823, GDS1761, GDS1925, GDS2250, GDS2617, GDS2618, GDS2635, GDS2739, GSE5364, GSE10780, GSE15852, GSE16443, GSE17072, og GSE20266. Alle microarray datasett ble behandlet og normalisert ved hjelp av SAM pakken [41]. De degs ble hentet som uttrykk signaturer ved hjelp av FDR. 0,05 som en cutoff
Expression underskrifter fra LINCS datasettet
LINCS datasettet inkludert en omfattende katalog av gen-uttrykk profiler generert av Biblioteket Integrated Network-baserte Cellular Signatures (LINCS) prosjekt fra 59 humane kreftceller som svar på ~ 20 000 kjemiske forstyrrelser. Den LINCS teamet har produsert uttrykket profiler av 1000 landemerke gener ved hjelp av en høy gjennomstrømming Luminex basert analyse [42]. Hele transcriptomic profiler for ~ 20.000 gener ble utledet fra de målte uttrykk verdiene av de 1000 landemerke gener. Uttrykket signaturer for forbindelsene ble lastet ned fra LINCS prosjektsiden (www.lincsproject.org) som besto av de 100 mest opp- og ned-regulert gener i respons til hver forbindelse.
celleviabilitet Assay
de forbindelser som brukes for cellen levedyktighet analysen ble kjøpt fra Sigma-Aldrich og Enzo Life Science. Både glioblastoma cellelinjer (A172, T98G, U251, og U87) og primære celler (GBL-celler) ble dyrket i DMEM høy-glukose cellekulturmedium (HyClone, SH30243.01) supplert med 10% føtalt bovint serum, 1% penicillin /streptomycin løsning, og 30 mikrogram /ml Plasmocure (InvivoGen, maur-pc) reagens for å hindre mycoplasma forurensning.
for å måle den cytotoksiske aktiviteten til kandidat narkotika, ble den metabolske aktiviteten av levedyktige celler målt ved hjelp WST reagens (EZ-Cytox, Dogen) i 96-brønners plater. Antall celler utsådd ble justert i henhold til veksthastigheten av hver celletype (100-500 celler /brønn). Tjuefire timer etter utsåing ble cellene behandlet med medikamenter ved en konsentrasjon på 10 uM og ytterligere dyrket i 72 timer ved 37 ° C. En tiendedel av mediet volumet av WST-reagens ble tilsatt til cellene, og absorbansen ble målt ved 450 nm etter 2 timer ved anvendelse av en SpectraMax 190 mikroplateleser (Molecular Devices). Eksperimentene ble gjentatt fem ganger.
hovedbane anrikning analyse
KEGG banene ble lastet ned fra MSigDB database (https://www.broadinstitute.org/gsea/msigdb), som består av 186 gensettene representerer ulike biologiske prosesser. Siden mange sykdomsrelaterte trasé er overflødig med andre signalveier (f.eks
KO05200
:
Pathways i kreft
inkluderer
KO04310
:
Wnt
,
KO04210
:
apoptose
,
KO04115
:
p53 signal
, etc.), ekskludert vi slike 28 trasé og de resterende 158 trasé ble brukt. Betydningen av anrikning ble beregnet ved hjelp av hypergeometriske test. Den LINCS datasettet inneholder flere signaturer for det samme stoffet fra ulike celler og betingelser, hvor det harmoniske gjennomsnittet av de tilsvarende p-verdier ble tatt som sin representant p-verdi. Den justerte q-verdien ble deretter beregnet ved anvendelse av Benjamini-Hochberg metode. Avstandene mellom legemidler ble beregnet som cosinus avstand-log p-verdi.
Resultater
Datainnsamling og bearbeiding
Først vi utarbeidet en liste over kjente legemidler ( KD sett) som målestokk for de tre typer kreft (glioblastom, lungekreft og brystkreft) fra fire offentlige databaser, samt ved manuelt kuratering 243 publikasjoner (S1 Table). Vi vurderte bare forbindelser som ble eksplisitt uttalt som å være aktiv mot målet sykdoms
e
.
g
., Narkotika X induserer apoptose, hemmer spredning, eller viser cytotoksisk aktivitet. KD sett besto av 132, 216, og 256-forbindelser for behandling av glioblastom, lungekreft, brystkreft og, henholdsvis (figur A på S1-fil). I tillegg samlet vi en omfattende liste over 1,155 forbindelser (kreft narkotika angi eller CD sett) som ble rapportert å vise anti-proliferativ aktivitet mot andre typer kreft, inkludert alle legemidler i KD settet.
Neste den strukturelle signaturen ble hentet som 1024 biter av FP2 kjemiske fingeravtrykk implementert i Åpen Babel [43] for forbindelser (S
CPD) eller kjente legemidler (S
KD). Målet informasjonen ble samlet inn fra 10 offentlige databaser som omfatter 342,311 sammensatte målgruppen samspill mellom 205,570 unike forbindelser (figur A i S1 File). Settene av gener assosiert med hver forbindelse eller narkotika ble deretter generert og fungerte som målet signaturer (T
CPD, T
KD). Uttrykket signatur (E
CPD, E
KD) ble lastet ned fra LINCS og besto av forskjellig uttrykt gener (degs) ved kjemisk forstyrrelse [26]. Flere underskrifter for en enkelt forbindelse var vanlig fordi uttrykk underskrifter ble samlet inn i ulike cellelinjer av ulik opprinnelse. I tillegg er det LINCS datasettet inkluderte en betydelig andel av redundante sammensatte ID-er og en del generelle sammensatte navn, 2D strukturer, og /eller stereoisomerer av de samme molekylformler var ikke skjelnes mellom forskjellige datakilder. Derfor ble underskriftene til disse lignende forbindelser flettes sammen etter å konvertere dem til den kanoniske smiler format, selv om stereoisomerer kan vise forskjellige farmakologiske aktiviteter og noen ble opprinnelig tildelt ulike sammensatte IDer av LINCS. Vi merker oss at ID kartlegging av en stereoisomer var veldig sjelden mellom to forskjellige stereoisomere, men ble gjort det meste med generisk navn eller smil uten 3D-informasjon. Den resulterende antallet unike forbindelser ble redusert til 8860. Vi har definert en
kjernesett
av 2,250 forbindelser hvor alle tre typer av signaturer (S, T, og E) var tilgjengelige. Skjæringspunktet mellom kjernesett og CD-apparatet var 304 legemidler (figur A i S1 File). Tilsvarende har vi også genererte sykdoms uttrykk signaturer (E
DIS) for glioblastom (4 sett), lungekreft (11 sett), og brystkreft (16 sett) fra TCGA [44] eller offentlige microarray datasett fra GEO. Den nærmere fremgangsmåten er beskrevet i Materialer og metoder.
Oversikt over analysen
Vi har utviklet en serie av klassifikasjonsapparater å forutsi DR kandidat legemidler for behandling av glioblastom, lungekreft og brystkreft kreft. Vår metode benytter tre typer signaturer som er avledet fra kjemiske struktur (S), medikament-target-relasjon (T), og genekspresjonsdata (E). DR kandidater ble forutsagt basert på likheten av disse signaturene mellom forbindelsene og sykdom (eller dets kjente legemidler). Prediksjon ytelse ble grundig inspisert på en objektiv måte å bruke i) en konvensjonell kryssvalidering ordning som utnytter kjente legemidler (KD sett) som en målestokk, ii) 29 anti-kreft HTS datasett for 11,000-41,000 forbindelser, og iii) analyser . basert på glioblastom kreftcellelinjer og pasient avledet primære celler
arbeidet beskrevet her bestod av tre faser: 1) bygge foreningen signaturer, 2) konstruere en rekke klassifikasjonsapparater, og 3) evaluering prediksjon ytelse. Målet for det første trinn var å knytte forbindelser og en mål-sykdom (eller dets kjente anti-kreft legemidler), basert på likheten av de tre signatur typer (figur 1A). Totalt ble det etablert sju forskjellige typer foreninger som var uavhengige av hverandre. Først ble en forbindelse forutsagt som en kandidat DR basert på strukturell likhet med de kjente legemidler (S
CPD-S
KD). Uttrykket (E) og mål (T) signaturer i det vesentlige er en liste av gener som kan være forbundet med en hvilken som helst metode for gen sett anrikning analyse. Derfor kan vi generere seks andre typer assosiasjoner mellom forbindelsene (T
CPD, E
CPD) og sykdom (T
KD, E
KD, E
DIS). Vi brukte
Tanimoto koeffisient
som et mål på signaturen likhet fordi alle signaturer kan representeres som en binær vektor av 0’er og 1 S-
i
.
e
., Den tilstedeværelse eller fravær av gener eller strukturelle fingeravtrykk. Ettersom flere signaturer er tillatt for en enkelt forbindelse, og sykdom, vi beregnet gjennomsnittet av de Tanimoto koeffisientverdier for en gitt forbindelse-sykdom par.
(A) Den strukturelle (S), målet (T), og uttrykk (E) signaturer for hver forbindelse (sirkler til venstre) og sykdom (firkanter til høyre) ble sammenlignet. Foreningene er angitt med stiplede linjer i tre kategorier (S: gul, T: grønn, E: rød) avhengig av typen forbindelse signatur. (B) I alt ble syv forskjellige classifiers konstruert basert på likheten mellom det sammensatte og målet signatur eller deres kombinasjoner (S, T, E, ST, SE, TE, og STE). Dr score ble beregnet ved hjelp av en rekke klassifikasjonsapparater basert på en logistisk regresjon med kjent stoff, sett (KD sett) brukes som en målestokk. (C) Ytelsen ble bedømt ved hjelp av tre uavhengige datasett: I) gjennomsnittlig AUC av 100 runder med 3-ganger kryssvalidering, II) sammenlignet med de 29 sett av NCI-60 DTP human tumorcellelinje HTS data, og III) eksperimentell validering av anti-proliferative aktiviteter ved hjelp av kreftcellelinjer og primære celler. En vei-nivå tolkning av medikamentet virkningsmåte ble utført for aktive DR kandidater for glioblastoma (IV).
Det andre trinn innbefattet konstruksjonen av en serie av klassifiserere å forutsi DR kandidater (fig 1B ). For å sammenligne resultatene for hver signatur, ble sju classifiers konstruert ved hjelp av en logistisk regresjon. De resulterende klassifiserere anvendes en enkelt (S, T, E), kombinasjon av de to (ST, SE, TE), eller alle tre typer (STE) av forbindelse signaturer. Endelig prediksjon ytelse ble grundig inspisert på en objektiv måte å bruke i) en konvensjonell kryssvalidering ordning som utnytter kjente legemidler som
gullstandarden
, ii) 29 storskala HTS datasett for anti-proliferativ aktivitet og iii) analyser som bruker både etablerte glioblastom cellelinjer og pasient avledet glioblastom primære celler. Vi videre tolket mulige former for handling av narkotika ved hjelp av veien berikelse analyse etterfulgt av sammenligninger med andre kreftlegemidler.
Ytelse evaluering hjelp av kjent stoff, (KD) datasett
For å sikre objektiv vurdering, vi begrenset vår analyse til kjernen sett av 2,250 forbindelser slik at ulike classifiers kan sammenlignes med nøyaktig det samme benchmark. Kjernen sett inkludert 79, 100, og 132 kjente anti-kreft narkotika (KD sett) som standarder for glioblastom, lungekreft og brystkreft, henholdsvis. Den negative settet (1946 forbindelser) ble fremstilt ved å utelukke CD satt fra kjernen sett.
Som nevnt i forrige avsnitt, bygget vi syv ulike classifiers basert på en enkelt signatur (S-, T-, og E-klassifikator) eller kombinasjon av flere signaturer (ST, SE-, undervis- ning, og STE-klassifikator). Deres relative forestillinger ble evaluert ved hjelp av 100 runder med tre-fold kryssvalidering ordninger. De classifiers var basert på en logistisk regresjon som automatisk veier komponent funksjoner for å gi en enhetlig prediksjon score-
DR scorer
-scaled fra null til en. Målet baserte classifiers (T) yter bedre enn de andre classifiers (S, E) i å identifisere kjente legemidler (KD kjerne sett) i alle tre typer kreft (fig 2). Denne trenden ble konsekvent observert i kombinasjon med andre signaturer (ST, TE SE). Vi tenkte at målene for kjente legemidler (KD) har en tendens til å være bedre karakterisert enn andre forbindelser, og målet baserte classifiers kan derfor favorisere kjente legemidler. Derfor har vi evaluert videre klassifikatorer på en mer objektiv måte i de neste avsnittene.
classifiers ved hjelp av en enkelt type signatur (S, T og E) og deres kombinasjoner (,, ST, SE TE og STE) ble vurdert basert på AUC for ROC kurven for glioblastom, lungekreft og brystkreft. AUC-verdiene ble beregnet ved å ta gjennomsnittet 100 runder med tre-fold kryssvalidering.
Evaluering i forhold til offentlige anti-kreft HTS
For å unngå potensiell bias, samles vi dusinvis av store -skala anti-kreft HTS-analyser fra pubchem [45]. De bestod av åtte, tretten og åtte HTS-analyser for GBM, lungekreft og brystkreft cellelinjer, henholdsvis (Tabell A i S1 File). Disse analysene alle brukt ulike cellelinjer og var rimelig forskjellig fra hverandre når det gjelder både analysert og traff compounds-
e
.
g
., Ble kun observert en 20% hit overlapping mellom to analyser for GBM (AID57, AID59) (Figur B i S1-fil). Igjen, begrenset vi vår vurdering til de analyserte forbindelser som også tilhørte kjernen sett. Å fokusere på evnen til å forutse nye DR kandidater, ble kjente legemidler (KD) ekskludert fra treffet forbindelser. De resterende treff for hver analyse ble delt inn i to kategorier: i) anti-kreft hits som tilhørte CD sett eller hatt to eller flere strukturelle analoger i CD satt med en Tanimoto koeffisient 0,7, og ii) nye hits som ikke var inkludert i det tidligere settet. Derfor anti-kreft treff representerte de som lett kunne spådd basert på strukturelle likhet og nye hits, som var de vanskelige sakene, og er fokus for denne studien.
Det er interessant at resultatene for hver signatur var i motsetning til resultatet av den foregående vurdering basert på den KD settet. Uttrykket baserte klassifiserings (E) best predikert anti-kreft treff i alle tre kreft (figur 3A). I motsetning til dette målet baserte klassifiserings (T) utført verste. Denne trenden var mer opplagt i prediksjon av nye hits (Fig 3B). Sortererne basert på struktur (S) eller target signatur (T) var i det vesentlige ute av stand til å forutsi nye treff (median AUC = 0,41 ~ 0,62), mens uttrykket signatur (E) har gitt rimelig bra (median AUC = 0.73 ~ 0.79, fig 3B ). Denne trenden ble konsekvent observert i kombinasjon med andre signaturer (SE TE ST). Spesielt, den eneste signatur (E) konsekvent gir bedre resultat enn alene i kombinasjon med andre signaturer (SE, TE) for alle tre typer kreft. Totalt sett uttrykket signatur (E) var mer informativ enn struktur (S) eller target (T) underskrifter blant HTS datasett for de tre ulike kreftformer. Dataene også foreslått at tidligere evalueringer av alle
i silico
DR kunne være partisk hvis kjente legemidler ble brukt som eneste målestokk sett, spesielt hvis metoden var svært avhengig av målet informasjon. Spesielt, med fokus på kjernen sett beholder bare et lite sett av forbindelser for evaluering, men denne tilnærmingen forble tilstrekkelig for objektive statistiske tester ved å bruke samme sett av forbindelsene (tabell A i S1-fil). Evalueringsresultatene for alle forbindelsene i HTS datasettet viste i hovedsak samme trend (figur C i S1 File).
De sju classifiers (S, T, E, ST, SE, TE, og STE) var evaluert basert på AUC for ROC kurven for glioblastom, lungekreft og brystkreft. Kun forbindelser i kjernen innstilt ble evaluert. AUC-verdiene ble beregnet ved å ta gjennomsnittet 100 runder med tre-fold kryssvalidering. (A) Typiske eksempler på ytelse evaluering ved hjelp av HTS datasettet for glioblastom (AID45), lungekreft (AID5) og brystkreft (AID97). AUC ble uavhengig beregnet ved hjelp av to forskjellige sett med hit forbindelser som en målestokk (eller positive) -i) treffet forbindelser kjent anti-kreft aktivitet (røde linjer) og ii) de nye treff (grønne linjer). Fordelingen av AUC bruker (B) forbindelsene med kjente anti-kreft aktivitet som en målestokk, og (C) romanen treffer som en målestokk.
Eksperimentell validering av DR kandidat narkotika for glioblastom
glioblastoma multiforme (GBM) er den vanligste og aggressiv form for kreft i hjernen som viser en svært dårlig prognose til tross for samtidig eller sekvensiell kjemoterapi-strålebehandling [46]. Temozolomide (TMZ) er en første-linje kjemoterapeutisk middel for behandling av GBM. Som et alkyleringsmiddel, overfører TMZ metylgrupper til purin-baser i DNA og forårsaker enkelt- og dobbeltkjedet DNA pauser og påfølgende apoptotisk celledød. De fleste studier har rapportert at kjemoterapi tildeles en begrenset total overlevelse fordel for GBM pasienter. Median tid til tilbakefall var bare 6,9 måneder etter standard behandling [47]. Derfor er behovet for mer effektive legemidler klart og udekket.
Her har vi listet DR kandidater til GBM og eksperimentelt testet sine anti-tumor aktivitet utelukkende basert på uttrykket signatur. Først ble 8,860 forbindelser bestilt av DR score,
i
.
e
. persentil rang av prediksjonene av samme klassifikator (E) som beskrevet i forrige avsnitt. Deretter søkte vi flere filtre: a) FDA-godkjent; b) DR poengsum 0,9; og c) indikasjon for å passere hjerne-blod barrieren (BBB) enten ved litteratur eller
i silico
prediksjon på https://www.cbligand.org/BBB. En høy-scoring kandidat (ivermectin, DR poengsum = 0,98) ble også tatt til tross for at indikerte ikke å passere BBB. De endelige 14 DR-kandidater ble valgt, og deres anti-tumor aktivitet ble testet ved hjelp av fire GBM-cellelinjer og åtte pasient-avledet primære celler. Våre DR score korrelert godt med anti-tumor aktivitet blant de cellelinjene som ble testet både med hensyn til anti-proliferativ aktivitet og fraksjonen av vesentlig vekstinhibering (figur 4A og 4B). Åtte av de 14 kandidatene var signifikante treff i tre eller flere GBM celler på 10 mikrometer. Spesielt de syv øverste kandidatene viste sterk anti-tumor aktivitet, tilsvarende ca. 20 ganger hit berikelse fra ~ 5% hit rate på vanlig high-throughput screening.
(A) DR score, (B) fraksjon av celler signifikant inhibert oppsummerer resultatene av (C), (C) den anti-proliferative aktivitet (% veksthemming) for å få de fire glioblastoma cellelinjer (fire cellelinjer TG98, A172, U251MG, og U87MG) og åtte pasienten avledede primære celler (den GBLs) 10 mikrometer, (D) i silico prediksjon score for BBB transport basert på https://www.cbligand.org/BBB. Den røde stjerne indikerer eksperimentell støtte for bestått BBB i henhold til litteraturen. Totalt, anti-proliferative aktiviteter på tvers av glioblastom celler sterkt korrelert med rangeringen av DR poengsum. De fleste DR kandidater ble vist å være i stand til å passere BBB.
Vi undersøkte litteraturen for rapporter om den anti-kreft-aktivitet av de åtte aktive DR kandidater, som oppsummert i tabell 1. Vi har funnet at fire legemidler (ivermectin, astemizol, nortriptylin, og apomorfin) ble tidligere rapportert å vise anti-tumor aktivitet i hjernen kreft. Tre legemidler (trifluridine, amlodipin og maprotilin) viste anti-tumor aktivitet i andre krefttyper, men ikke i glioblastom. Mometason er et kortikosteroid og er betraktet som en ny medikament for kreft fordi det ikke har blitt rapportert å vise antitumoraktivitet i en hvilken som helst form for kreft. Kortikosteroider har blitt brukt for å redusere peritumoral ødem og kjemoterapi-assosierte bivirkninger, slik som smerte, kvalme, oppkast og [48]. Alle aktive DR kandidater unntatt ivermectin har vist seg å være i stand til å passere BBB i enten litteratur rapporter eller via
i silico
prediksjon.
Tolkning av narkotika virkningsmåter for den aktive DR kandidater
narkotika~~POS=TRUNC indusert transcriptomic profiler reflektere direkte og indirekte endringer av cellulær fysiologi i omics skalere og gi fyldig informasjon om den farmakologiske virkningsmekanismen av narkotika. For å tolke deres virkningsmekanismer, utførte vi pathway berikelse analyse av opp- og ned-regulerte gener ved hjelp KEGG veier. Kollektivt, 32 og 17 veier ble betydelig anriket på opp- og ned-regulert gener, henholdsvis på en cut-off q-verdi 0,1 (fig 5). Samlet sett tyder dataene plausible mekanismer for anti-tumor aktivitet som er delt blant DR kandidater. Oppregulert veier inkludert apoptose, aminosyre og lipidmetabolismen, og tumorundertrykkende P53 /MAPK /WNT signalering, noe som antydet at aktiviteten til anti-proliferative prosesser ble øket. Omvendt, celleproliferative veier, som for eksempel cellesyklus, DNA-replikasjon, DNA-reparasjon, og ribosom montering, ble nedregulert.
p-verdier og deres justerte q-verdier ble beregnet ved hypergeometriske test og den Benjamini-Hochberg metode, henholdsvis.
Fire narkotika (amlodipin, astemizol, maprotilin, og nortriptylin) sterkt økt fettmetabolismen (steroid, terpenoidsyntesesporet, og fettsyrer). Følgelig, amlodipin, en kalsiumkanalblokker, ble tidligere rapportert å indusere steroidogenesis [66]. Amlodipin og maprotilin moderat oppregulert apoptose veier som kan være forbundet med PKD1 overekspresjon og kaspase-3 aktivering, henholdsvis [67,68]. Spesielt, virket apomorfin for å virke via en klar mekanisme: gener assosiert med mitokondriell energiomsetningen var sterkt nedregulert uten merkbare endringer i apoptose, metabolisme, eller DNA-reparasjon. Disse mitokondrie metabolske gener inkludert gener som koder for ATP synthases (ATP5O, ATP5D), cytokrom oksidase (COX8A, COX7), og NADH dehydrogenase (NADUFS8, NADUFB2). Mitokondriell dysfunksjon har blitt godt etablert for å modulere apoptose og tumorigenesis [69]. De andre to DR kandidater (nortriptylin og maprotilin) også redusert mitokondrieenergiomsetningen. Nedregulering av cellesyklus gener ble ofte observert blant alle åtte DR kandidater. Fem medikamenter betydelig redusert ekspresjon av DNA-reparasjonsgener. Samlet er disse aktive DR kandidatene alt vesentlig opprørt flere tumorigent eller svulst undertrykkende veier, noe som kan lede kreftceller mot anti-proliferativ utfallet.
Vi utførte også en klynge analyse av de åtte DR kandidater sammen med de 69 kreftmedisiner inkludert i LINCS datasettet ved hjelp av berikelse mønster av den samme 32 opp- og 17 nedover regulerte reaksjonsveier (figur 6). Disse kreft narkotika ofte up-regulere P53, MAPK, apoptose og immunsignalisering. Mange kreftlegemidler samt våre DR kandidater ned-regulerer celle cycle-, DNA reparatør, og p53 signalveier. Syv av de åtte DR kandidatene viser en svært lik berikelse mønster med andre kreftlegemidler (cluster I-V i figur 6). Fire DR kandidater (amlodipin, astemizol, nortriptylin, og maprotilin) og åtte kreft narkotika tilhører to relaterte klynger (I og II).