PLoS ONE: Systematisk Identifisering av Kombi Drivere og mål i Kreftcellelinjer

Abstract

Det er et presserende behov for å lokke fram og validere svært effektive mål for kombinatorisk intervensjon fra storskala pågående molekylære karakterisering innsats av svulster. Vi etablerte en in silico bioinformatiske plattform på konsert med høy gjennomstrømming screening plattform evaluere 37 nye målrettede agenter i 669 utstrakt preget kreftcellelinjer reflekterer genomisk og vevstype mangfold av kreft hos mennesker, å systematisk identifisere kombinatoriske biomarkører for respons og co-handlings mål i kreft. Genomisk biomarkører oppdaget i en 141 cellelinje treningssettet ble validert i en uavhengig 359 cellelinje testsett. Vi identifiserte co-forekommende og gjensidig utelukkende genomiske hendelser som representerer potensielle drivere og kombinatoriske mål i kreft. Vi viser flere samarbeid genomisk hendelser som forutsier følsomhet for stoffet intervensjon uavhengig av tumor avstamning. Koblingen av skalerbare i silico og biologiske høy gjennomstrømning kreftcellelinje plattformer for identifisering av co-hendelser i kreft leverer rasjonelle kombinatoriske mål for syntetiske dødelige tilnærminger med et stort potensial for å foregriper utvikling av resistens.

Citation: Tabchy A, Eltonsy N, Housman DE, Mills GB (2013) Systematisk Identifikasjon av Kombi Drivere og mål i kreft cellelinjer. PLoS ONE 8 (4): e60339. doi: 10,1371 /journal.pone.0060339

Redaktør: Mark Isalan, Senter for Genomisk forordning, Spania

mottatt: 25 oktober 2012; Godkjent: 25 februar 2013; Publisert: 05.04.2013

Copyright: © 2013 Tabchy et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av National Institutes of Health (NIH) U54 CA112970 til GBM (https://www.nih.gov/), en Komen Promise stipend (KG08109903) til GBM og Komen Proteomics Discovery tilskuddet (FAS0703849) til AT og GBM (http : //ww5.komen.org/), et program for Entertainment Industry Foundation SU2C-AACR-DT0209 01 stipend til GBM (https://www.standup2cancer.org/), og støtte fra GSK til GBM (http: //www.gsk.com/). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. GBM fått sponset forskning fra GSK til å bestemme molekylære markører forutsi respons på PI3K pathway hemmere. GBM har støtte fra Exelixis, Celgene, Wyeth og Astra Zeneca å avgjøre respons på legemidler som ikke er involvert i denne studien. GBM er på onkologi Advisory Board of Astra Zeneca. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer. De andre forfatterne erklærer ingen konkurrerende interesser.

Innledning

En stor voksende utfordring i kjølvannet av tsunamien av data generert av arbeidet med å karakterisere svulster på molekylært nivå (for eksempel Kreft Genome Atlas [ ,,,0],TCGA] (https://www.cancergenome.nih.gov) og International Cancer Genome Consortium [ICGC] (https://www.icgc.org)) er hvordan man skal utnytte data og oversette den til bedre kliniske resultater ved identifisere molekylære grunnlaget for kreft hos enkelte pasienter, og deretter bruke disse molekylære lesjoner som mål for effektiv intervensjon. Samtidig, blir reduksjonen i sekvenseringskostnadene fører til

demokratisering

med molekyl testing allerede resulterer i mange pasienter med deres tumorer skrevet inn på et molekylært nivå. Svulsten karakterisering innsats er ikke lenger hastighetsbegrensende; heller hvordan du skal tolke og «handle» på dataene er nå den viktigste begrensende faktor. Disse utfordringene må løses før nye teknologiske fremskritt i tumor karakterisering kan levere maksimal klinisk effekt. Et viktig steg i prosessen er å identifisere biomarkører som ville forutsi respons på behandlingen og analyseringen av handlings kjøring molekylære avvik fra støy. Disse utfordringene kan løses ved å implementere algoritmer som bidrar til å analysere dataene, i parallell for å etablere stor skala humanisert modellsystemer for høy gjennomstrømning target oppdagelse og validering som også vil informere en akselerert utvikling av legemidler og klinisk utprøving prosess. Robuste prediktive biomarkører for kombi molekylær medisin er sterkt behov for å endre den kliniske utprøvingen landskapet fra den nåværende tilstand av lav terapeutisk effekt i store kliniske studier og uselekterte populasjoner, høy effekt små kliniske studier beriket for målgruppene. Denne tilnærmingen har potensial til å gjøre kliniske studier mindre, raskere og billigere, samtidig øke fordelene for den enkelte pasient.

Så langt enkelt biomarkører drevet intervensjoner har hatt begrenset suksess i klinikken. Innledende suksess med målrettede behandlingsformer i «onkogen-avhengige» svulster [1] – [4] (f.eks Imatinib i CML, BRAF-hemmere i melanom) er herdet ved realisering av en rekke begrensninger: (1) utvikling av resistens på grunn kreft heterogenitet, med pre-eksisterende kloner som viser variasjonen i den molekylære mål som fører til klinisk resistens (klonal seleksjon); (2) initial motstand av tumorer på grunn av co-mutasjon i et motstands-parallellveien; og (3) motstand på grunn av homeostatic feedbacksløyfer som gjeninnsette den baseline steady state opprørt av målrettet intervensjon [2] – [6]. Dermed ser det ut til at enkelte biomarkører og /eller tiltak kan ha begrenset potensial for å lykkes i klinikken. På samme måte som vi leder livstruende bakterielle eller virale infeksjoner (for eksempel tuberkulose, humant immunsviktvirus) med flere samtidige antibiotika [7] – [9], vellykket behandling av kreft, som har alle de allsidighet og robustheten i eukaryote repertoar svar til rådighet, vil mest sannsynlig kreve flere samtidige målrettede tiltak for å forkjøpet fremveksten av motstand. Her foreslår vi et rammeverk for rasjonell identifikasjon av flere drivere som samarbeider for å produsere kreft fenotype, og kan deretter brukes som effektive mål for kombinert terapeutisk intervensjon.

Kreft cellelinjer tett rekapitulere kjent tumor-assosiert genetisk unormalt gir modeller for menneskelig sykdom. For eksempel har brystkreftcellelinjer utvunnet blitt vist å trofast rekapitulere de genomiske trekk av primære tumorer, med HER2 genamplifisering korrelere med trastuzumab følsomhet både in vitro og hos pasienter [10], noe som viser at klinisk observerte genotype-respons-korrelasjoner er konservert i kreftcellelinje-modeller. Her utfører vi et systematisk søk ​​etter genomiske co-hendelser som er valgt i løpet av kreft initiering eller progresjon, og hvis målrettet sammen kunne markert forbedre pasientens utfall. Vi demonstrerer en in silico plattform for identifisering av co-forekommende kreft drivere og biomarkører for respons, og dens anvendelse som bevis på konseptet i en svært preget 669 cellelinje sett behandlet med 37 nye målrettede midler. Prediktive biomarkører identifisert i en 141 cellelinje treningssettet ble validert i en uavhengig 359 cellelinje testsett. Vi foreslår at en rørledning består av en robust i silico bioinformatiske plattformen koblet til en høy gjennomstrømming kreftcellelinje plattform for funksjonell genomikk oppdagelse og validering kan fungere som en bro mellom karakterisering innsats som TCGA /ICGC den ene enden og klinikken /kliniske studier på den andre.

Metoder oppsummering

Drug respons gIC50 data for totalt 37 målrettede forbindelser testet på 669 cellelinjer som representerer den genomiske mangfoldet av menneskelige krefttyper, spesielt 23 forbindelser testet på 310 celle linjer (GSK sett), og 14 forbindelser som ble testet på 500 cellelinjer (McDermott sett) ble oppnådd fra offentlige databaser (fig. 1) [11] – [13]. Drug responskurver ble generert og vendepunkter ble matematisk fastsettes på bakgrunn av høyere ordens polynom kurve modeller og definert sensitive vs resistente cellelinjer for hvert medikament (fig. S1 i File S1). Cellelinjer var hovedsakelig SNP genotype tilpasset Sanger Institute Cancer Genome cellelinje database for å knytte stoffet følsomhet data på cellelinjer til genomisk karakterisering data tilgjengelig fra Sanger [14], inkludert mutasjonsstatus fra full koding eksoner sekvensering av 64 vanlige muterte kreftgener (inkludert kopiantall), og kopiere talldata fra Affymetrix SNP Array 6,0 på 419 gener [14]. Et genomisk tilfelle definert som enten en mutasjon og /eller et kopiantall aberrasjon i et bestemt gen. Forventet og observerte co-event frekvens ble generert i de følsomme og resistente cellelinjer og genomiske co-funksjoner som var i ubalanse fanget gjennom flere lag statistiske og biologiske betydningen testing og kryssvalidering dermed produsere signifikante co-valgt og gjensidig utelukkende hendelser, inkludert genomisk og avstamning funksjoner i cellelinje befolkningen og for hvert medikament (fig. 2). De genomiske biomarkører oppdaget i en 141 cellelinje treningssett ble uavhengig bekreftet i en uavhengig ikke-overlappende testsett med 359 cellelinjer screenet på 14 av forbindelsene.

GSK sett er 310 cellelinjer, genomiske informasjon som er tilgjengelig på 294. McDermott sett er 500 cellelinjer, genomisk informasjon tilgjengelig på 366. 141 cellelinjer som er felles for GSK og McDermott ble brukt som et treningssett, genomisk informasjon tilgjengelig på 139.

Plot av forskjellen mellom de frekvenser (

Observert – Forut)

for alle potensielle doble genomisk hendelser i 294 cellelinjer. Basert på 262 forskjellige gener berørt, var det totalt 34,191 potensielle genomisk hendelser som involverer to gener. Negative forskjeller lengst fra null (venstre hale) er gjensidig eksklusive arrangementer, positive forskjeller lengst fra null (høyre hale) er co-valgt hendelser. De betydelige hendelser fra venstre og høyre haler finnes i tabell 3 og tabell S5 i File S3

Metoder

Etikk erklæringen. N /A.

Cell linje Vekst Hemming Analyser

Data fra 23 GSK forbindelser testet på opptil 310 cellelinjer (range 187-273 cellelinjer screenet per narkotika, mener = 228 cellelinjer per medikament) ble lastet ned fra ressurser som tilbys fra Greshock og kolleger, og Kim og kolleger (GSK sett) [11], [13], og data fra 14 flere forbindelser testet på opptil 500 cellelinjer (range 244-500, mener = 460 cellelinjer) ble lastet ned fra ressurser som tilbys av McDermott og kolleger (McDermott sett) [12] (fig. 1). Både GSK og McDermott sett cellelinjer representerer mangfoldig spekter av krefttyper i kreft hos mennesker, med 23 og 21 kreft linjer henholdsvis av epitel, mesenchymale og blodkreft opprinnelse. For GSK sett, Wooster og kolleger fått totalt 311 unike kreftcellelinjer fra flere leverandører (American Type Culture Collection, Developmental Therapeutics Program, National Cancer Institute, tysk Resource Centre for biologisk materiale, og europeisk samling av dyr cellekulturer), da vokst til standard dyrkingsmedier anbefales av leverandøren; cellelinjer hvor autentisert av SNP fingerprinting på Affymetrix 500 K «SNP Chip «som beskrevet tidligere [11]. For McDermott settet, ble humane kreftcellelinjer erholdt fra American Type Culture Collection (ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ), den japanske Samling av Forsknings Bioressurser (JHSF), eller den europeiske samling av cellekulturer (ECACC) og dyrket i henhold til standard protokoller som tidligere beskrevet [12]. Cellelinje veksthemming analyser ble utført som beskrevet tidligere [11], [12]. I korthet, for GSK settet, midtpunktet av veksten vinduet (gIC50) faller midt mellom antall celler på tidspunktet for tilsetning forbindelsen (T = 0) og veksten av kontrollceller behandlet med DMSO ved 72 timer. Den gIC50 verdi (medikamentkonsentrasjon, nmol /L) er en beregning for å måle inhibering av proliferasjon i kreftceller. Tilsvarende, i McDermott settet,

celleviabilitet

av hver cellelinje til en gitt konsentrasjon av forbindelse ble beregnet som den fraksjon av levedyktige celler i ubehandlede celler er tilstede etter 72 timers behandling (forhold). Vi vil referere her for å gIC50 (GSK sett) og celleviabilitet (McDermott sett) som Growth Hemming (GI) verdier. I begge sett, jo lavere GI verdi desto mer følsom cellelinjen til et bestemt medikament.

Drug responskurver og bestemmelse av Resistant vs sensitive cellelinjer

systematisk identifisert følsom vs resistent celle linjer for hvert medikament. Sensitivitet og resistens ikke er iboende egenskaper av de cellelinjer, men er definert i forhold til et bestemt medikament. For hvert medikament, rangerer vi bestilte og plottet GI verdier for cellelinje befolkningen. Den GSK sett inkludert 310 cellelinjer. Den McDermott sett inkludert 500 cellelinjer testet på 14 forbindelser: de 141-cellelinjer som var felles for de McDermott og GSK sett ble brukt som et treningssett; de gjenværende ikke-overlappende 359 cellelinjer (500-141 = 359) ble anvendt som et testsett for å validere våre resultater på de 14 sammensatte data fra McDermott (fig. 1). Basert på bestemmelse av den første «vendepunkt» som tilsvarer det området hvor den kurve som avviker brått inn i det flate sentrale område av kurven (fig. S1 i File S1), ble cellelinjen populasjonen delt i to grupper, den tidlige del av kurven definert sensitive linjer med lav GI-verdier (før vendepunkt), og den flate delen av kurven og utover definerte resistente linjer med høyere GI-verdier (etter vendepunkt). Dette sikrer at cellelinjer som er definert som sensitive ha lav GI verdier og en annen følsomhet deretter resten av cellelinjene som ble testet for det stoffet. Den sentrale flate del av kurven inneholder cellelinjer med liknende GI-verdier, det tilsvarer toppfrekvensområder på en normalfordelingskurve når frekvens er plottet mot GI-verdier. Denne tilnærmingen sikrer også effektiv fangst av små undergrupper av uteliggercellelinjer med merkede responser på grunn av lav frekvens narkotika sensibiliserende genotyper. Stoffet responskurve ble modellert matematisk som en høyere ordens polynomisk kurve; den første «vendepunkt» ble bestemt grafisk som den første forekomst av den største endringen i hellingen (helling er den første deriverte) av medikamentet responskurven, det vil si den første forekomst av den største absoluttverdien for den andre deriverte av kurven ( først ytterpunkt). Vendepunkter ble bestemt uavhengig for hver forbindelse i GSK sett, og i opplæring og testsett for forbindelser i McDermott sett, henholdsvis. I GSK sett, median gIC50 verdi ved vendepunktet var 659 nM, med en rekke 16-3955 nM. I McDermott sett, brukte vi som en cutoff vendepunkt eller en GI verdi på 0,78, avhengig av hva som ga størst følsomhet (mindre GI-verdi): for treningssettet, median cutoff var 0,69, med en rekkevidde på 0,51 til 0,78; for testsettet, median cutoff var 0,74, med en rekkevidde på 0,50 til 0,78.

SNP-baserte fingerprinting brukt som Robust Adresse for cellelinje krysshenvisning

For å kunne utføre genotype- respons sammenhenger, vi knyttet genomisk informasjon (mutasjoner og kopi nummer brudd) på cellelinjer fra et eget datasett til sine svarprofiler (GI). For å unngå potensielle problemer med navngiving av cellelinjer og forurensning, brukte vi den unike SNP fingeravtrykk av hver cellelinje (GSK sett) for krysshenvisninger og matchende cellelinjer på tvers av databaser. Genotype analyse av GSK 310-cellelinjen settet ble utført ved SNP fingerprinting på Affymetrix 500 K «SNP Chip «, som beskrevet tidligere [11]. Kort sagt ble de SNP fingeravtrykk av cellelinjene i forhold til hverandre og til den SNP fingeravtrykk generert av Wellcome Trust Sanger Institute Cancer Genome cellelinje Prosjekt som beskrevet tidligere, med cellelinjer som har 80% identitet betraktes som en genetisk kamp. Det var 283/310 genetisk distinkte cellelinjer i GSK settet. Celleviabilitet-analyser for 25 av de 37 forbindelsene var begrenset til de genetisk distinkte cellelinjer. Totalt 256/310 cellelinjer ble funnet å ha en genotype kamp i Sanger-databasen. Av de genotypen kampene, 233/256 også matches av navn, og for de som ikke samsvarte med navn (n = 23) hadde genotype sammenheng mellom navnene er tidligere registrert (https://www.sanger.ac.uk /genetics/CGP/Genotyping/synlinestable.shtml). For de resterende 54 cellelinjer (310-256), 38 ble matchet av navn til Sanger database, og 16 forble uovertruffen (tabell S1 i File S3). Cell linjenavn ble manuelt gjennomgått. Ytterligere tiltak ble tatt for å sikre konsistens mellom celle linjenavn, og ingen duplisering i tilfeller var syntaks eller skille forskjellene skjedde mellom navn eller alias. For McDermott settet telle 500 cellelinjer, var de 141-cellelinjer som var felles for de McDermott og GSK-apparater som passet etter navnet anvendes som et treningssett, og de gjenværende ikke-overlappende 359 cellelinjer ble anvendt som et testsett. Cellelinjer i testsettet hvor en genotype tilknytning til en cellelinje i treningssettet tidligere var blitt tatt opp ble fjernet fra testsettet; Dessuten ble cellelinjer inne i testsettet hvor en genotype krets tidligere var blitt tatt opp (interne dubletter) fjernes med en representant av cellelinjen som gjenstår. Således 348 distinkte cellelinjer holdt i testsettet. Totalt 216/348 cellelinjer ble matchet til Sanger database, og 132 forble uovertruffen (tabell S2 i File S3). De genomiske egenskapene til de tilsvarende cellelinjer i Sanger Cancer Genome Project ble lastet ned (https://www.sanger.ac.uk/genetics/CGP/CellLines/) for GSK og McDermott setter henholdsvis; en kuratert database av genomisk hendelser i hver cellelinje ble utarbeidet (Tabell S3 i File S3 for GSK sett og treningssett, n = 310-16 = 294; Tabell S4 i File S3 for testsettet, n = 216) basert på sekvense data til basepar oppløsning av hele kodende eksoner av 64 vanlige muterte kreftgener, og genom-wide analyse av kopiantall gevinst og tap ved hjelp av Affymetrix SNP 6,0 mikromatriser og piknik algoritme for å forutsi kopitall segmenter på 419 gener (inkludert de 64 genene ovenfor), lastet ned fra Sanger Cancer Genome Project, Katalog av somatiske mutasjoner i Cancer (COSMIC V51 release) [14]. Et genomisk tilfelle definert som enten en mutasjon (kodende sekvens variant), og /eller et kopitall aberrasjon [en homozygot delesjon (total kopitall = 0), eller en forsterkning (total kopiantall = 8)] i et bestemt gen . Begrepene genomisk hendelses og mutasjons brukes om hverandre i teksten for å representere et avvik på et bestemt genomisk nettsted.

Identifisere Genomisk Co-hendelsene Relevans

Hvis genomiske hendelser (dvs. mutasjoner, kopiere nummer brudd) er tilfeldig distribuert i populasjonen av cellelinjer, og to begivenheter samtidig forekommer i en cellelinje uavhengig av hverandre og på grunn av tilfeldige faktorer alene, og deres samtidig forekomst ikke setter cellen ved en selektiv fordel eller ulempe, da den spådde co-mutasjonsraten i befolkningen er følgende:

Observert co-mutasjon priser ble sammenlignet med spådd co-mutasjon priser; Co-mutasjoner som oppstår

mer eller mindre enn

spådd ved en tilfeldighet ble bestemt på et signifikansnivå på P = 0.05 av Pearson Chi-kvadrat test. Disse avvikene fra tilfeldig er sannsynlig på grunn av selektive press. Spesielt å identifisere co-hendelser som var knyttet til legemiddelrespons sammenlignet vi spådd å observerte frekvensene for hvert stoff i sensitive og resistente subpopulasjoner henholdsvis (Chi-kvadrat test). I aktuelle tilfeller co-mutasjoner ble bestemt på sensitive og resistente subpopulasjoner, i tillegg til den Chi-kvadrat-test for statistisk signifikans, et forhold mellom de observerte frekvenser i sensitive vs resistente linjer ble beregnet (S /R) med en større enn 1,5 ganger endring [ ,,,0],0,667 til 1,5] blir brukt som en andre valgkriterium. Disse metodene ble brukt til trening og test setter henholdsvis.

Data Analysis og Clustering

Cluster programmet ble brukt til å justere GI data før hierarkisk clustering. For hver av de 37 forbindelsene, GI-verdier var de første median sentreres deretter normalisert; dette produserer en skalert veksthem stillingen som er en potens-uavhengige forsøk på å sammenligne responsprofiler på tvers av forbindelser. Dataene ble deretter hierarkisk gruppert ved hjelp av Pearsons korrelasjon som en beregning basert på den gjennomsnittlige avstanden mellom nodene. Treeview ble anvendt for visualisering av de resulterende klynger. Den Cluster og Utforsker programvare er tilgjengelig fra Eisen laboratorium (https://rana.lbl.gov/EisenSoftware.htm) [15].

Statistical Analysis

Pearsons Chi-kvadrat test ( for co-hendelser) og Fishers eksakte test (for enkelthendelser) ble brukt for å tildele tosidige P-verdier på 95% konfidensintervall for å beskrive sammenhenger mellom genmutasjoner /kopitall avvik og narkotika følsomhet. For fastsettelse av statistisk signifikante enkelt genomiske hendelser, med bare noen få tester kjøres, dette unngås behovet for å korrigere for multiple sammenligninger. (. Tabell S5 i File S3 og figur 2) Når løpet av to co-hendelser ble bestemt i de 310 cellelinjer, ble en Benjamini-Hochberg multippel testing korreksjon terskel med falske funnrate (FDR) på 5% brukt; mer enn 92% av resultatene forble signifikant etter korrigering. Selv om for teoretiske grunner vi bruke de streng multippel testing korreksjon, den svært konservative Bonferroni korreksjon, til den totale ufiltrert plass av alle observerte 6871 doble co-hendelser, med 6871 tester løp, 65% av resultatene forble signifikant etter korrigering ble brukt. Enda viktigere, våre biomarkør spådommer for single og co-hendelsene ble uavhengig bekreftet i en uavhengig non-overlappende testsett av 359 cellelinjer testet på 14 forbindelser utgjør McDermott satt.

Resultater

Unsupervised clustering av Drug Response i cellelinjer rekapitulerer Pathway Spesifikke narkotika mål og drivere

Vi først bestemt om unsupervised clustering av sensitiviteten av 310 humane kreftcellelinjer til 37 målrettede legemidler kan rekapitulere kjente stoffet virkningsmekanismer og også den molekylære basis av respons i høyt karakterisert cellelinjer. Dette er anskueliggjort på fig. 3 for en global oversikt over cellelinje-medikamentrespons (og fig. S2 i File S1). Fig. S3, S4 i File S1 visualisere clustering bildene for GSK (23 medikamenter) og McDermott sett (14 narkotika) for seg; den uavhengige analyser reduserer støyen som innføres av analysen av 37 forbindelsene og sammenslåing av to uavhengige datasett med ulike tilnærminger således å gi en tettere gruppering av funksjonelle mål-klasser. Faktisk medikamenter gruppert sammen på den vertikale aksen i henhold til deres viktigste kjente molekylære mål. For eksempel, et sett av strukturelt divergerende IGF1R målrettede medikamenter gruppert i umiddelbar nærhet på fig. 3 og fig. S3 i File S1, med en korrelasjonskoeffisient på 0,78 for IGF1R subcluster avbildet. Hierarkisk clustering også rekapitulert narkotika mål innen trasé, og dermed definerer pathway konkrete tiltak som effektivt kan modulerer avvikende onkogene veier. Dette var tydelig i tett gruppering av legemidler som er rettet mot den PI3K /AKT /mTOR vei, i fig. 3 og fig. S3 i File S1, som GSK2126458 [PI3K], GSK690693 [AKT], Temsirolimus [mTOR], TGX-221 [PI3K-beta], IC87114 [PI3K-delta], GSK2119563A [PI3K-alpha], GSK2080806A [PI3K], BEZ -235 [panPI3K og mTOR], og GSK1059615 [PI3K], gruppert sammen med en korrelasjonskoeffisient på 0,72 for PI3K /AKT /mTOR sti subcluster. På fig. 3 og fig. S4 i File S1, EGFR og HER2 målrettede medikamenter, Erlotinib [EGFR], CL387 [EGFR], HKI272 [EGFR, HER2], og Lapatinib [ERBB1 /2], gruppert sammen med en korrelasjonskoeffisient på 0,66 for EGFR subcluster. Mitotiske inhibitorer, Paclitaxel [Tubulin], GSK461364 [PLK1], GSK661637 [Pan-PLK], GSK923295 [CENPE], og GSK1070916 [AURKB] også gruppert tett sammen som vist på fig. 3 og fig. S3 i File S1. I denne analysen gjorde avstamning av opprinnelsen til cellene ikke signifikant påvirke organiseringen av klyngene, noe som tyder på at ikke-avstamning avhengige hendelser bidrar til responsen på ulike legemiddelklasser. De molekylære lesjoner som ligger til grunn for svar på spesifikke legemidler i disse subclusters er videre utforsket nedenfor.

Hver rad representerer en egen cellelinje, og hver kolonne representerer en separat forbindelse testet. Å øke sensitiviteten til en cellelinje som er angitt ved å øke intensiteten av grønt signal, og å øke motstanden av en cellelinje som er angitt ved å øke intensiteten av det røde signal; sorte firkanter betegner følsomhet i nærheten av median på tvers av cellelinjer. Cellelinjer ikke screenet med en spesiell forbindelse, er angitt i grått. Dataene fra fig. 3 er delt inn i to mindre komplekse tall (Fig.S3 og S4 i File S1) for å redusere støy og gi en bedre visning av funksjonelle relasjoner og aktivert onkogene pathway subclusters.

Enkelt Genomisk Arrangementer Skille Sensitive fra resistente Lines

Vi ønsket å identifisere det molekylære grunnlaget for forskjellen i respons til narkotika intervensjon. Vi korrelert den underliggende molekylære forskjeller i cellelinjer med forskjeller i legemiddelrespons. For å identifisere hvilken molekylære forandringer var assosiert med sensitivitet eller resistens mot et bestemt medikament, ble frekvensen av en genomisk arrangement sammenlignet hos følsomme vs resistente linjer og et forhold mellom (frekvens i sensitive /frekvens i resistant), S /R var beregnet for genspredning aberrasjon til stede i mer enn 12% av de sensitive eller resistente linjer. Hvilket som helst gen frekvens som ble endret på mer enn 1,5 ganger i sensitive vs resistente linjer ble ansett for å være assosiert med sensitivitet overfor medikamentet (S /R 1,5) eller resistens mot medikamentet (S /R 0,67), respektivt. Dette identifisert genomiske hendelser assosiert med følsomhet eller resistens mot spesifikke stoffet intervensjon; de statistisk signifikante hendelser finnes i tabell S6 i File S3.

Som et eksempel linjer som var følsomme for MEK hemmer GSK1120212 var 2,93 ganger, 2,35, 1,92 og 1,67 ganger mer sannsynlig til båtplass en BRAF, KRAS, APC mutasjon eller CDKN2A (P14) mutasjon, henholdsvis (P = 0,0009, P = 0,0021, P = 0,0243, P = 0,0105), mens resistente linjene var 2,57 mer sannsynlig å huse en hendelse i RB1 (P = 0,0024) (tabell 1). BRAF og RAS lesjoner er kjent for å øke MEK aktivitet i tumorer [3], [16], og derfor intervensjoner som inhiberer MEK-aktiviteten vil redusere /normal nedstrøms signalisering gjennom konstitutivt aktivert MEK-ERK-kinase-kaskaden og derfor er forventet disse linkene. Men foreningen av følsomhet med APC eller CDKN2A mutasjoner var ikke forventet, og foreslå ytterligere biomarkører for respons på MEK hemming.

Lines sensitive til AKT inhibitor GSK690693 Sprak næret mutasjoner i PI3K veien, inkludert PIK3CA , PTEN, ErbB2, og også FBXW7, TET2, og BRCA2 endringer (P = 0,0140, P = 0,0197, P = 0,0053, P = 0,0273, P = 0,0346, P = 0,0208, henholdsvis) igjen tyder på uventede genomiske biomarkører for respons til AKT hemmere som kan øke antall pasienter sannsynlig har nytte; det var ingen enkelthendelser signifikant assosiert med resistens (tabell S6 i File S3).

PIK3CA avvik dratt motstand mot BRAF hemmer AZ628 (P = 0,042) en observasjon som ble bekreftet i testsettet (P = 0,05 ), sannsynligvis gjennom bypass aktivering av den parallelle PI3K vei, rekapitulere resultatene fra eksperimentelle intervensjon [17], [18]. På den annen side, BRAF, NRAS, som forventet [3], [16], og MLTT3 og MET avvik overdratt følsomhet overfor AZ628 i treningssettet (P = 0,003 P = 0,036 P = 0,034 P = 0,003); Dette ble bekreftet i test sett for BRAF og NRAS (P = 2,4 × 10

-10, P = 0,001) (tabell 2).

Selv om det var en sterk sammenheng med enkelt genetisk avvik med respons på terapeutiske midler, dette krets var ikke absolutte med et antall cellelinjer inneholdende en bestemt hendelse som dømmes som enten sensitiv eller resistent. Dermed må det være flere hendelser som samarbeider med mutasjonsstatus for å bestemme følsomhet og resistens mot målrettede behandlingsformer. Annet enn foreningene nevnt ovenfor og avvik i PTEN og ErbB2 potensielt bidra til gruppering av EGFR familien hemmere og avvik i PTEN og CDKN2A å bli assosiert med narkotika rettet mot PI3K og IGF1R trasé, var det ingen klare avvik som driver flertallet av stoffet respons klynger (fig. 3). Igjen dette tyder på at flere co-events må bidra til narkotika følsomhet og resistens. De potensielle co-hendelser er utforsket nedenfor.

Molecular Co-forekommende hendelser Avslør Drivere og Co-handlings Targets i Cancer

For å identifisere potensielle samarbeidende hendelser, må vi først identifiserte genomisk hendelser som co-inntraff utover det som er forventet om de var uavhengige og foreningen på grunn av tilfeldige faktorer alene. Dette definerer co-hendelser som var sannsynlige under seleksjonstrykk under startfasen eller progresjon (eller under tilpasning til kulturen), og dermed har en høy sannsynlighet for å være driverne av kreft fenotype. Molekylære lesjoner som co-forekomst fører til en proliferativ eller overlevelse fordel utover det som er observert for separate enkeltforekomster vil være co-valgt og hyppigheten av co-arrangementet vil øke i befolkningen (Fig. 4). Basert på databasen av genomiske hendelser i cellelinjer, ble løpet av observerte to co-hendelser (f.eks Mut1-Mut2) genereres for de 294 cellelinjer som genomisk informasjon var tilgjengelig (GSK sett). Det var 6871 observert tydelige doble co-hendelser i 294 cellelinjer, og 12958 totalt forekomster. Det var 95415 forskjellige trippel co-hendelser (f.eks Mut1-Mut2-Mut3) i 294 cellelinjer, og 110872 totalt forekomster. Vi sammenlignet spådd å observerte co-event frekvenser i 294 cellelinjer hvor tilstrekkelig antall co-hendelser var tilgjengelige for å gi statistisk analyse. (Fig 2;. Tabell S5 i File S3)

Illustrert her er en sekvensiell multippel hit modell av kreft initiering og progresjon, underliggende co-utvalget og gjensidig eksklusivitet av genetiske hendelser i kreft. A, B, C er gener inne i cellens kjerne.

Legg att eit svar