PLoS ONE: konseptualisere kreftlegemidler som Classifiers

Abstract

Kreft og friske celler har forskjellige distribusjoner av molekylære egenskaper og dermed reagerer forskjellig på medikamenter. Kreft narkotika ideelt drepe kreftceller, mens begrense skade friske celler. Men den iboende variasjon blant cellene i både kreft og sunn celle populasjoner øker vanskelighetsgraden av selektive narkotika handling. Her formal vi en klassifisering rammeverk basert på ideen om at en ideell kreft narkotika bør maksimalt diskriminere mellom kreft og friske celler. Mer spesifikt bør denne diskrimineringen utføres på grunnlag av målbare celle markører. Vi deler problemet inn i tre deler som vi utforske med eksempler. Først molekylære markører bør skille kreftceller fra friske celler ved encellede nivå. For det andre bør de effekter av legemidler bli statistisk forutsagt av disse molekylære markører. For det tredje, bør medikamenter være optimalisert for klassifisering ytelse. Vi finner at uttrykket nivåer av en håndfull gener nok til å skille godt mellom individuelle celler i kreft og friskt vev. Vi finner også at genuttrykk spår effekten av enkelte kreftlegemidler, noe som tyder på at disse kreftlegemidler fungere som suboptimale classifiers bruker genet profiler. Til slutt, vi formulere et rammeverk som definerer en optimal narkotika, og spår narkotika cocktailer som kan målrette kreft mer nøyaktig enn de enkelte stoffene alene. Konseptualisere kreftlegemidler som å løse en diskriminering problem i high-dimensjonale rommet av molekylære markører lover å informere design av nye kreftlegemidler og legemiddel cocktails

Citation. Lawlor PN, Kalisky T, Rosner R, Rosner MR, Kording KP (2014) Konseptualisere kreftlegemidler som Classifiers. PLoS ONE ni (9): e106444. doi: 10,1371 /journal.pone.0106444

Redaktør: Sui Huang, Institute for Systems Biology, USA

mottatt: 06.01.2014; Godkjent: 04.08.2014; Publisert: 23.09.2014

Copyright: © 2014 Lawlor et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. PL var støttet av National Institutes of Health 5P01NS044393. KK ble støttet av National Institutes of Health R01NS063399. RR og MR ble støttet av University of Chicago kvinner styret. TK ble finansiert av Machiah Foundation. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Det sentrale målet for behandling av kreft er å drepe kreftvev mens forlate sunt vev intakt. Effektive kreftlegemidler, må derfor skille mellom kreftceller og friske celler. I tillegg bør en optimal kreftbehandling også være robust for biologisk variabilitet slik som tumorceller og friske heterogenitet [1]. Ved å kombinere disse ideene kan vi ramme kreft problemet på en måte som balanserer den potensielle overlapping av sunne og kreftcelleegenskaper med behovet for å drepe aggressive kreftcellevariantene (fig. 1). Mens behovet for å skille kreft fra friske celler ligger til grunn for dagens kreftbehandling, så vidt vi vet har det ikke blitt matematisk formalisert. Utvikling av en matematisk rammeverk åpner muligheten for å oversette innsikt fra beregningsvitenskap i nye tilnærminger for kreftbehandling

Ideelt kreftlegemidler utføre en beregning på celler. Drepe (hvis cancerous) eller no-kill (hvis sunn).

Kreft narkotika bør derfor tenkt som utfører en beregning på celler. For eksempel, for giftige stoffer, cellulære mål fører til en enkelt resultat (drepe eller dreper ikke) under behandlingen. Matematisk kan vi si at effekten av et medikament er en kartlegging fra et sett med egenskaper (mål i cellen) på en stokastisk, binær utfallet (celle lever eller dør) – dette er akkurat definisjonen av en klassifikator i feltene av statistikk og maskinlæring [2]. I så måte er noen kreftmedisin faktisk en klassifikator (fig. 2). Imidlertid er anvendelsen av ordet «klassifikator» til denne selektiv dreping ikke bare semantiske. I stedet gjelder en formell matematisk tilnærming og verktøykasse avledet fra maskinlæring, som kan bidra til utvikling av legemidler.

Dette illustrerer hvordan man kan kombinere informasjon fra to cellulære markører for å konstruere en klassifikator som skiller de to populasjoner (kreft og friske celler) bedre enn både markør.

Mange dataalgoritmer er utviklet for å løse klassifisering problemer, og en rik litteratur finnes innen statistikk og maskinlæring om effektive metoder for klassifisering [2 alene ]. Disse beregningsfelt tilbyr et bredt spekter av tilnærminger, inkludert kvantitative resultattall, effektive algoritmer for store datasett og metoder for å bedre classifiers. For eksempel, har mye forskning adressert hvordan du kan kombinere svake classifiers for å bygge bedre classifiers, noe som tyder på at disse metodene kan tilpasses til legemiddelkombinasjonen (fig. 2). Machine læring, i å definere søket etter classifiers som optimizer, og tilbyr en ren måte å beskrive et målrettet søk. Dette papiret er ment å avklare verdigheten av jakten på classifiers og søken etter kreftlegemidler.

Data fra nyutviklede omics nærmer muliggjøre anvendelse av klassifikator teori til narkotika optimalisering. Microarray og sekvenseringsteknologi, for eksempel, la oss samtidig samle inn informasjon om tusenvis av mobilnettet

markører Z – målinger som karakteriserer tilstanden eller fenotype av cellen som genuttrykk. Noen av disse markørene bør skille kreftceller fra friske celler, hjelpe til nøyaktig klassifisering og kreft målgruppe. Viktigere er imidlertid ikke alle merkene er molekylære narkotika mål. Molecular

mål

er molekyler som kreft narkotika faktisk bruker til å endre celler. Men begravet i tusenvis av målbare markører er en undergruppe av markører som

reflektere eller korrelerer med

de molekylære mål av narkotika. For eksempel kan ekspresjon av gener som er nedstrøms av et medikament mål korrelere godt med at stoffets effekt. Emerging bioteknologi tillater oss å måle disse cellulære markører og analysere dem ved hjelp av statistiske verktøy som maskinlæring til mer fullstendig forstå kreft.

Selv om kreftmedisiner ikke har blitt formelt karakterisert som classifiers, maskinlæring har blitt mye brukt til mange aspekter av kreft biologi. Den ene gruppen har anslått brystkreft resultat ved hjelp av maskinlæring for å skape et 70 gen forutsigelse algoritmen [3], mens vi og andre har brukt maskinlæring, i kombinasjon med diskrete signalveier, for å forutsi metastase-overlevelse [4]. Andre har forsøkt å skille mellom ulike typer kreft ved hjelp av mange typer algoritmer inkludert Support Vector Machines (SVM) [5], [6], Principal Component Analysis [7], [8] og nevralt nettverk [9]. Men andre forutsi kjemosensitivitet på grunnlag av genekspresjon [10], [11] og signaleringsnettverk [12]. Men mens alle disse tilnærmingene har gjort imponerende fremskritt og er nyttige i klinisk praksis, disse ideene har ikke blitt kombinert for å produsere en prinsipper basert tilnærming til kreft drug design.

Her foreslår vi et rammeverk for utforming av kreftbehandling som strekker eksisterende ideer ved hjelp klassifikator konseptualisering. Vi forklarer første tilnærming, og deretter, som et praktisk eksempel, for å utføre en analyse av eksperimentelle data som viser hvordan dette kan gjøres i prinsippet. Den generelle tilnærmingen er oppsummert nedenfor:

A Framework for behandling av kreft

formalisere kreftlegemidler som classifiers bør informere hvordan vi behandler kreft. Det er tre viktige deler av denne tilnærming som vi først sammenfatte på et høyt nivå, og deretter demonstrere ved hjelp av for tiden tilgjengelige eksperimentelle data: 1) spesifikt definere målet som skal oppnås ved klassifisering – nemlig, hvilke celler til å drepe, hvilke celler til å forlate, og hvordan du kan fortelle forskjellen mellom de to; 2) Forstå behandling verktøy til rådighet; og 3) Optimalt bruke disse behandlingsverktøy for å oppnå den definerte klassifiseringen objektiv. Vi har oppsummert definisjoner og forutsetninger knyttet til dette rammeverket i tabell 1.

Definere mål (del I)

Det første trinnet er å diskriminere mellom kreft og friske celler. Fordi dette er målet for kreftbehandling, er det viktig å konkret spesifisere dette målet. For å gjøre dette, bruker vi matematikk i klassifiserings algoritmer i forbindelse med målinger av cellemarkører. Klassifikator svarer på følgende spørsmål: Hvor mye kreftceller skiller seg fra friske celler, og som biologiske markører kan skille dem? Det spør dette spørsmålet mens eksplisitt vurderer heterogenitet av begge befolkninger. Markørene kan omfatte genekspresjon, overflateproteiner, etc. Fordi skille mellom kreft og friske celler krever å ta hensyn til heterogenitet i hver populasjon, har vi fokusert på markører for enkeltceller i stedet for populasjoner celle der det er mulig.

klassifisere algoritmer i denne sammenheng er utformet for å gi maksimal separasjon av kreftceller fra friske celler i form av disse sært markører. Dermed kan vi si at resultatene av klassifisering beskrive hva en hypotetisk «optimal» medikament som virker på disse markørene kunne oppnå. Del I av resultatene demonstrerer hvordan man kan definere dette optimalitet målet ved hjelp av genuttrykk i enkeltceller og utforsker hvor mange markører og celler er nødvendig for å oppnå dette målet.

Forstå behandling verktøy til rådighet (Part II)

Det neste trinnet er å forstå hvordan de tilgjengelige behandling verktøy tillate oss å utnytte sært markører for kreftceller. Vi bør bestrebe seg på å tilnærme den optimale stoffet ved å designe nye medisiner eller kombinere eksisterende legemidler. Her fokuserer vi på den andre.

Narkotika bør ideelt målrette skille egenskapene til kreft, men de fleste legemidler som brukes i klinikken ikke gjør dette perfekt. Videre deres virkningsmekanismer forskjellig. Det kan således være mulig å forutsi hvordan eksisterende legemidler bør kombineres for å produsere mer ønskelige resultater. Egentlig gjør denne spådommen ville hengsel på om stoffet handlinger til de karakteristiske egenskapene til kreft. For eksempel, hvis kreftcellene skiller seg fra friske celler primært via tre forskjellige markører, tre medikamenter

kjent

til separat utnytte hver eneste markør som en klassifikator kan teoretisk bli kombinert. Del II av resultater demonstrerer denne ideen ved å utforske forholdet mellom narkotika handling og molekylære egenskaper (genuttrykk).

Optimalt bruker behandlingsverktøy (del III)

Det siste trinnet er å bruke matematikk klassifisering for å spørre hvordan våre tilgjengelige verktøy (f.eks narkotika) tillater oss å oppnå våre mål. Fra den første delen, vet vi hvordan å skille kreftceller fra friske celler. Fra den andre, vet vi hvordan våre narkotika forholder seg til molekylære markører. Nå kan vi bruke disse to ideer for å optimalisere behandlingen ved å matche klassifisere evnene til våre legemidler til den angitte klassifiseringen målet.

Her vil vi igjen fokusere på å optimalisere medikamentkombinasjoner. En tilnærming ville være å forutsi medikamentkombinasjoner som diskriminerer mellom kreft og friske celler bedre enn både narkotika alene. Del III av resultater viser en tilnærming som, under ideelle forhold, kan nå dette målet.

En begrensning med denne studien er at dataene som er tilgjengelige for slike analyser er begrenset og ikke ideelt. Derfor, for å illustrere de tre delene av klassifiserings rammeverket ved hjelp av data fra reelle biologiske prøver, har vi erstattet eller omdefinert celle fenotyper når ønsket celle data mangler.

Resultater

Del I : Definere klassifisering objektiv med molekylære målinger

Hvis kreftlegemidler fungere som classifiers som bruker målbare markører som input, kan vi bruke standard klassifisering algoritmer for å utforske muligheten for å løse kreft versus sunn celle klassifisering problem. Det er teoretisk mulig at det er en optimal medikament (eller medikament kombinasjon) som oppnår dette målet i praksis. Dette skulle tilsi at et slikt medikament ville drepe kreftceller og samtidig la friske celler alene i størst mulig grad. Vi vil bruke dette begrepet om en optimal medikament som en guide til å analysere behandling. I praksis bør selve medikamenter eller medikamentkombinasjoner bli valgt til å ligne den optimale stoffet. Vi erkjenner at hver svulst er forskjellig, men målet her er å illustrere en tilnærming for å skille kreft fra ikke-kreftvev i en sammenheng. Denne tilnærmingen kan også brukes til andre krefttyper.

For å finne ut om det er teoretisk mulig å løse dette problemet, trenger vi et datasett av celler med både kjente kreft staten og målt markører. Vi brukte encellede transkripsjonelle data som er avledet fra tykktarmen [13]. Dette datasettet inkluderte både et begrenset antall markører (45 gener), og et begrenset antall kolon vev undergrupper og celler ( 200 celler). Derfor fokuserte vi på å skille mellom friske og kreftceller av en vev subtype: stilk-lignende celler. Fordi disse cellene er så like – som påpekt i den opprinnelige publikasjonen – dette valget servert for å gjøre klassifiseringen problemet mer utfordrende. Dette datasettet dermed mulig for oss å teste kraften i klassifiseringen tilnærming.

Kan denne klassifiseringen problemet løses? Med andre ord, kan de enkelt-celle transkripsjons data forutsi celle tilstand (kreft eller ikke)? For å besvare dette spørsmålet vi brukte en standard klassifikasjon algoritme, den regularisert GLM [14], [15]. Teste hvor godt slik klassifisering av algoritmer arbeid gjør at vi kan gi en øvre grense på hvor godt en faktisk stoffet kan fungere hvis det brukes genuttrykk alene.

Først ønsket vi å måle potensialet nøyaktigheten av denne klassifiseringen. I klassifiseringen er det forskjellige typer feil som man kan gjøre. For eksempel, er det lett å fremstille et stoff som dreper alle kreftceller, men også dreper alle friske celler. Dette stoffet vil ha 100% sanne positive (drept kreftceller), men også 100% falske positiver (drepte friske celler). Derfor, for å fullstendig karakterisering en klassifiserings strategi bør vi analysere forholdet mellom de to typer feil. Standarden mål på klassifisering nøyaktighet er mottakeren opererer karakteristikk (ROC) plot. I dette plottet andelen av sanne positiver er plottet som en funksjon av andelen av falske positiver (fig. 3) for å kvantifisere både sensitivitet og spesifisitet. Arealet under denne kurven (AUC) gir en generell måling av klassifiserings ytelse med en maksimalverdi på en en perfekt test. AUC for klassifiseringsalgoritme var ~0.9, noe som indikerer at friske og kreftceller kan også klassifiseres. Derfor er det teoretisk mulig å løse denne kreft versus sunt klassifisering problem for enkeltceller med høy nøyaktighet ved hjelp av uttrykk nivåer for bare et lite sett (~45) av gener.

Når målenøyaktighet av celle klassifisering som kreft eller sunt, bør man vurdere begge typer feil: falske positive og falske negative (eller mer konvensjonelt, sanne positive). Dette er illustrert ved den Receiver Operating Karakteristisk (ROC) kurve. Linjene indikerer middelverdier og feilfelt indikerer bootstrapped 95% konfidensintervall. Nøyaktighet ble målt ved hjelp av kryssvalidering; og sjansen verdi ble fastsatt ved hjelp shuffle kontroll.

Neste vi spurte

hvor mange

cellulære markører optimal stoffet ville trenge å klassifisere celler nøyaktig. Med andre ord, hva er det minste antall markører en optimal narkotika må vurdere å skille mellom friske celler og kreftceller? Vi har funnet at et forholdsvis lite antall gener – omtrent den beste 10 (rangert etter størrelsen av passe parameter) – strukket for å klassifisere en celle som kreft eller sunt med høy nøyaktighet (figurene 3, 4.). Den prediktive kraft sorter mettet snart etter de 10 beste genene ble inkludert. Dermed er det bare et lite antall av cellulære markører tilveiebringe det meste av den informasjon som brukes for å klassifisere en celle som kreft eller sunt.

Classification resultatene ble målt som arealet under kurven (AUC) av ROC-kurven. En perfekt klassifikator vil oppnå en AUC på 1, mens en tilfeldig klassifikator ville oppnå en AUC of.5. Hver farget linje representerer et forskjellig antall celler som brukes til å trene klassifikator, som viser at ytelsen blir bedre etter hvert som flere celler brukes. Linjene indikerer middelverdier, og skyggefulle områder indikerer bootstrapped 95% konfidensintervall. Nøyaktighet ble målt ved hjelp av kryssvalidering; og sjansen verdi ble fastsatt ved hjelp shuffle kontroll.

Evnen til å måle genuttrykk fra enkeltceller reiser spørsmålet om hvorvidt det er mer viktig å måle flere celler eller flere gener. For å svare på dette, kvantifisert vi den relative betydningen av å øke antall målte celler versus antall målte gener per celle. Vi trent klassifikator med antall celler som strekker seg fra to total (en sunn, en tumorcelle) til 180 celler totalt (95% av cellene). Som ovenfor, målte vi klassifikator ytelse, bortsett fra at vi gjorde det for hver trening scenario. Vi igjen fant at ytelsen mettet etter et lite antall gener for hver trening scenario. Viktigere, fant vi også at ytelsen fortsatte å øke med økende antall opplærings celler til cirka 80 ble brukt (Fig. 4). Dermed målinger fra minst titalls celler er nødvendig å ta hensyn til variasjon i en forenklet befolkning på svulsten og friske celler.

I denne delen har vi demonstrert hvordan man kan gjennomføre en analyse som vil definere hva optimal behandling – den «ideelle narkotika» – kunne utrette. Med en eksperimentell datasett vi vist at det er mulig å nøyaktig løse kreft klassifikasjon. Denne typen analyse kan også identifisere markører som skiller kreft fra friske celler. For den begrensede datasettet som vi valgte, det viste seg at løse klassifiseringen problemet var mulig med ca 10 markører og 80 celler. Imidlertid vil disse tallene varierer fra tumor cellepopulasjonen samt de spesielle markører analysert

Del II:. Klassifisering av virkelige kreftlegemidler

I den første delen av resultater har vi utforsket mulighetene for en optimal kreft narkotika som skiller mellom friske celler og kreftceller. I denne andre delen av studien, vil vi demonstrere

om Kjøpe og

hvordan

verktøy til rådighet (i dette eksempelet, faktiske narkotika) kan klassifisere celler. Dette vil hjelpe oss til å forstå hvordan du skal bruke selve narkotika å nærme ytelsen optimal stoffet.

Spesielt i følgende eksempel, spør vi hvordan kreftlegemidler

egentlig

forholde seg til molekylære markører. For å besvare dette spørsmålet, ville vi ideelt sett bruke enkeltceller. Dette er vanskelig med enkle celler, men fordi behandling og markeringen måling både potensielt ødelegge cellen. En mulig løsning er å muliggjøre begrenset replikasjon av enkeltceller for å analysere markør status for et sett av dattercellene samtidig bestemmelse av legemidlets effekt ved hjelp av andre datterceller. Imidlertid vil selv disse to settene utviser heterogenitet med tiden. Siden genuttrykk data for slike bestander som har blitt behandlet med legemidler er ikke tilgjengelig i dag, er det nærmeste erstatning etablerte cellelinjer som har en klonal opprinnelse og er i stor grad genetisk homogene. Derfor har vi brukt cellelinjer som stand-ins for enkeltceller til å spørre hvordan legemidler knyttet til molekylære markører.

Fordi våre tidligere resultater tyder på at vi trenger flere titalls celler for å løse klassifisering problem, valgte vi å analysere en type av vev med mange etablerte cellelinjer. Vi brukte derfor 45 luminal og basal-lignende brystkreft cellelinjer preget av Gray og kolleger [12]. De målte omtrent 19000 gener i disse brystkreft linjene ved hjelp av mikromatriser, så vel som de kjemoterapeutiske responsene fra disse linjer til hver av 74 legemidler. Disse linjene er en god representasjon av omfanget av celle fenotyper som finnes i brystkreft og dermed utgjøre mer varians enn en faktisk tumor. Likevel, disse cellelinjene tillater oss å spørre hvordan cellemarkører er relatert til medikamentsensitivitet.

å bruke en algoritme for å forutsi om kreftlegemidler vil drepe celler av en spesifikk cellelinje på grunnlag av sine markører. I særdeleshet, beregnet vi stoffet følsomheten til disse cellelinjene. Faktisk noen aspekter av narkotika svarene var forutsigbar. For eksempel, forutsagt vi det kjemoterapeutiske respons på medikamentet Lapatinib, en tyrosinkinase inhibitor som blokkerer signalering både av EGF-reseptor og HER2 /neu. Vi fikk en R

2 verdien av ~0.5. Viser imidlertid lav R

2 verdi at vår prediksjon av narkotika oppførsel var ikke sterk. Dette kan være på grunn av den lille størrelsen på datasettet, men kan også innebære at ikke alle relevante kriterier ble målt, eller alternativt at forholdet er ikke-lineær og ikke fanges opp av lineære maskinlæringsmetoder. Selv om molekylære markører slik som gen-ekspresjon ikke fange opp alle variasjoner, de ser ut til å spille en rolle i å forutsi den medikamentrespons. Derfor cellulære markører forutsi en viss grad av narkotika oppførsel når de ble behandlet som input til en klassifikator.

Vi ønsket også å vite hvor mange gener nok til å forutsi faktiske stoffet oppførsel. For å gjøre dette, målte vi stoffet atferd som en funksjon av antall gener. Lapatinib trengs bare et lite antall gener (~ 5) for å nå sitt høyeste nøyaktighet (fig. 5). Således, et lite antall cellulære markører forutsi hvorvidt aktuelle medikamenter drepe en celle. Dette er viktig fordi det viser at vi ikke nødvendigvis trenger å vurdere mange tusen gener ved utformingen behandlinger.

Drug respons ble spådd av molekylære markører (genuttrykk). Nøyaktighet av kjemosensitivitet prediksjon, målt som R

2, som representerer mengden variasjon forklart. Skraverte områdene indikerer bootstrapped 95% konfidensintervall. Nøyaktighet ble målt ved hjelp av kryssvalidering.

Hvis stoffene fungerer som classifiers ved hjelp av et lite antall egenskaper, deretter et stoff kan karakteriseres ved å plotte sin effekt som en funksjon av eiendommene. Vi valgte derfor de to gener (SLC5A8 og PERLD1) som var i fellesskap best på å forutsi Lapatinib effekt over cellelinjer. Ved hjelp av enkle grid interpolering og ekstrapolering rutiner vi plottet stoffets virkning som en heatmap (Fig. 6). Denne type visualisering viser at selv to gener kan fange den komplekse atferden til en kreft narkotika.

Drug aktivitet er til en viss grad forutsigbare valg av molekylære markører.

Vi analyserer narkotika aktivitet som det gjelder molekylære markører (dvs. fenotypiske egenskaper i en celle), men slike markører er ikke nødvendigvis molekylær

mål plakater (dvs. cellekomponenter som proteiner hvis funksjoner er endret av et medikament). Ideelt sett ville eksperimentelle data også omfatte målinger av markører mer sannsynlig å faktisk utgjøre narkotika mål slik som tyrosin kinase reseptorer som er rettet av Lapatinib. Selv om gentranskriptene vi analysere ikke er direkte mål for den klassifisere stoffet, vil de likevel forutsi legemiddelrespons og er derfor anvendelige. Dermed kan denne tilnærmingen brukes med

alle

type molekylær markør eller mål.

I denne delen har vi demonstrert hvordan å forstå oppførselen til faktiske narkotika innenfor våre rammer. I vårt eksempel, relatert vi legemidlets effekt til molekylære markører som i teorien gjør det interessant å spørre hvordan selve narkotika forholder seg til de karakteristiske markører for kreftceller. Dette vil være viktig for den neste kapittel hvor vi spør hvordan du optimalt kombinere narkotika. I dette datasettet, derimot, finner vi at de målte markører suboptimalt forutsi medikamentrespons. I fremtiden data samlet inn fra mange flere celle populasjoner og en rekke merketyper vil være nødvendig for å gjøre klinisk plausible spådommer

Del III:. Optimalisere kreftbehandling

I de to foregående delene vi har vist hvordan en optimal kreftmedikament kunne klassifisere celler som kreft eller ikke, og at det cellulære markører forutsi til en viss grad hvordan en faktisk stoffet oppfører seg. I denne delen, kombinerer vi disse to ideer for å skissere en mulig tilnærming til optimalisering av kreftbehandling. Vi ser etter

par av narkotika

som klassifiserer kreftceller bedre når den kombineres enn enten stoffet alene.

Vi viser denne tilnærmingen konseptuelt hjelp genuttrykk data og narkotika følsomhet målinger fra samme panel av brystkreft cellelinjer [12]. Dessverre var vi ikke i stand til å skaffe tilsvarende data for noncancerous cellelinjer. Derfor gjorde vi to justeringer for å vise at disse typer analyser er mulig i prinsippet: 1) vi igjen behandlet hver klonal cellelinje som en stand-in for en enkelt celle; og 2) brukte vi muligheten til å skille mellom to underklasser av vev som klassifiserings målet i stedet for å skille friske fra kreftceller. Spesielt brukte vi basal-lignende og luminal undergrupper av brystkreft, som

omtrent

tilsvarer aggressiv (mer metastatisk) og mindre aggressiv (mindre metastatisk) cancer. Vi er klar over at den reelle situasjonen er mer komplisert enn dette forenkling; men dette skillet er slutt vilkårlig og bare tjener til å demonstrere vår tilnærming ved hjelp av en ekte fenotypisk forskjell. Gitt denne definisjonen og disse dataene, vi spurte om det var mulig å finne to legemidler som diskriminerer mellom luminal og basal-lignende brystkreft subtyper bedre enn enten stoffet alene.

Ekte narkotika ikke helt skille mellom sunt og kreftceller. Men vi kan bruke maskinlæring for å beskrive hvordan du kan kombinere medikamenter for å bedre tilnærmet optimal stoffet. Dette er inspirert av den kjente tilnærming i maskinlæring kalt forsterke [16], hvor flere funksjoner er lagt til en klassifikator for å muliggjøre gradvis bedre ytelse. Mer spesifikt gitt klassifiseringen målet (optimal narkotika) fra del I og narkotika faktiske oppførsel fra Part II, kan vi bestemme hvilke par av narkotika beste tilnærmet optimal stoffet. For å gjøre dette, vi igjen bruke GLM rammeverk for å ramme den ønskede behandling som en kombinasjon av narkotika. Vi iterere gjennom mulige to-medikamentkombinasjoner for å finne ut hvilke par gir best resultater. Denne ideen tillater oss å finne den beste legemiddelkombinasjonen for klassifisering.

Vi fant flere medikamentkombinasjoner som rundet den optimale stoffet. En spesiell kombinasjon inkludert narkotika Lestaurtinib og GSK461364 (fig. 7, sammenligningen Fig. 2). Disse stoffene sammen tilveiebringer en bedre klassifisering enn noen av midlene alene (Fig. 8). Dermed vår metode gir en mekanisme for å velge flere rusmidler på en måte som skal gi oss mulighet til å målrette kreftceller mer effektivt. Disse resultatene anta at legemidler virker både uavhengig og forut for en adaptiv respons på behandlingen. Andre strategier for å håndtere dette problemet er presentert i diskusjonen.

Bedre diskriminering mellom celle populasjoner oppnås ved å inkludere en ekstra stoffet. Klassifiseringen terskel linje er vist, i virkeligheten representerer en gradient relatert til «sannsynligheten for celledød» som er antydet ved skravering. Se teksten for full beskrivelse.

Nøyaktighet (AUC) oppnås ved begge stoffene sammen er bedre enn både narkotika alene.

I denne delen har vi vist hvordan du kan optimalisere behandlingen bruker klassifiseringen rammeverket. Vi understreker igjen at vi bruker suboptimale biologiske data som eksempler for å avklare innholdet i vår tilnærming, for ikke å produsere klinisk relevante spådommer. Større og mer uttømmende datasett vil være nødvendig for å gjøre dette mulig. Videre har vi gjort forenklinger usannsynlig å generalisere til klinisk praksis. Således er disse resultatene bør ikke tas som en klinisk anbefaling. Likevel viser denne analysen at bruk av klassifisering rammeverk for å optimalisere behandlingen tar hensyn til den iboende variasjonen i fenotyper og kunne påvirke valg av behandling for å diskriminere mellom kreft og friske celler.

Diskusjoner

The tilnærming for behandling av kreft

i denne studien har vi argumentert for at bruk av kreftlegemidler som classifiers gir et konseptuelt rammeverk for å utforme optimale behandlingsstrategier for kreft. Optimale narkotika bruker molekylære mål å drepe kreftceller, mens minimere skade friske celler. Vi vurderte dette problemet som en som kunne løses med verktøy fra maskinlæring og vise hvordan dette kan informere en strategi for behandling av kreft. Vi viser at en klasse av molekylmarkører, genekspresjon, var tilstrekkelig til å løse dette optimaliseringsproblem ganske godt ved hjelp av de datasett som ble undersøkt. Vi viste også hvordan å innlemme egenverdi celle variasjon i analysen og gjenkjenne faktiske legemidler som suboptimale classifiers. Til slutt foreslo vi måter å bruke klassifiseringen rammeverk for å utlede narkotika utviklingsstrategier som utfører så tett som mulig til en optimal narkotika.

Optimalisere kreftbehandling ved å kombinere legemidler i henhold til klassifiseringsprinsipper er relativt grei hvis kombinert narkotika gjør ikke påvirke hverandre. For eksempel kan det være at en andre medikamentet ikke i betydelig grad forstyrrer den molekylære mekanisme av den første, og

vice versa

ved samtidig administrering. Hvis effekten av de individuelle medikamenter er additive, vil muligheten for et bestemt medikament for å klassifisere kreftceller ikke bli påvirket av et annet legemiddel. Således kan forbindelsen klassifiserings – medikamentkombinasjonen – vil klassifisere kreftcellene mer nøyaktig enn noen av medikamentene alene. Det er også mulig at svake ikke-lineære interaksjoner mellom stoffene kan likevel gi en overlegen forbindelse klassifikator enn noen av medikamentene alene. Forutsatt linearitet plasserer en

øvre grense

på hvor godt medikamentkombinasjoner kunne jobbe.

Hva om vi finner en annen medisin som skal forbedre klassifiseringen, men er ikke adderes med det første stoffet? Denne ikke-lineære avhengigheten er svært sannsynlig å være viktig. En løsning ville være å iterativt bruke neste-mest-optimal narkotika til vi finner en som ikke signifikant samhandle med det første stoffet. Dermed velger den beste ekstra stoff for en kombinasjon kan kreve teoretiske og empiriske betraktninger. Denne metoden kan ikke garantere at en gitt kombinasjon av medisiner vil fungere, men i stedet foreslår en mer effektiv måte å velge narkotika cocktails for testing.

Legg att eit svar