Abstract
Protein kinaser er de vanligste proteindomener involvert i kreft, hvor somatisk ervervede mutasjoner er kjent for å være funksjonelt knyttet til en rekke kreft. Resequencing studier av protein kinase kodende regioner har understreket viktigheten av sekvens og struktur determinanter for kreftfremkallende kinase mutasjoner i forståelsen av mutasjonen avhengige aktiveringsprosessen. Vi har utviklet en integrert bioinformatikk ressurs, som konsolidert og kartlagt alle for tiden tilgjengelig informasjon om genetiske endringer i protein kinase gener med sekvens, struktur og funksjonelle data. Integreringen av ulike datatyper gitt et praktisk rammeverk for kinome omfattende studie av sekvens-baserte og struktur-baserte signaturer av kreft mutasjoner. Databasen drevne analyse har avdekket et differensial anrikning av SNPs kategorier i funksjonelle regioner av kinase-domenet, som viser at et betydelig antall cancer mutasjoner kan falle på strukturelt tilsvarende stillinger (mutasjonssoner), innenfor den katalytiske kjerne. Vi har også funnet at strukturelt konservert mutasjons hotspots kan deles av flere kinase gener og er ofte beriket av kreft driver mutasjoner med høy onkogen aktivitet. Strukturell modellering og energisk analyse av mutasjons hotspots har foreslått en felles molekylære mekanismen av kinase aktivering av kreft mutasjoner, og har lov til å forene de eksperimentelle data. I henhold til en foreslått mekanisme, kan det strukturelle effekten av kinase-mutasjoner med en høy potensiell onkogent manifestere seg i en betydelig destabilisering av autoinhibited kinase form, som er egnet til å drive tumorgenese på et eller annet nivå. Strukturbasert funksjonell annotering og prediksjon av kreft mutasjoner virkninger i proteinkinaser kan legge til rette for en forståelse av mutasjonen avhengige aktiveringsprosess og informere eksperimentelle studier som undersøker molekylær patologi tumorigenesis
Citation. Dixit A, Yi L, Gowthaman R, Torkamani A, Schork NJ, Verkhivker GM (2009) sekvens og struktur Signaturer av kreft Mutation Hotspots i proteinkinaser. PLoS ONE 4 (10): e7485. doi: 10,1371 /journal.pone.0007485
Redaktør: Kumar Selvarajoo, Keio University, Japan
mottatt: 16 juli 2009; Godkjent: 25 september 2009; Publisert: 16 oktober 2009
Copyright: © 2009 Dixit et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av The University of Kansas oppstart finansiering. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Et sentralt mål for kreftforskning innebærer oppdagelsen og funksjonell karakterisering av muterte gener som driver tumorigenesis [1]. The Human Genome Project har gitt forskere med enestående innsikt i struktur og organisering av gener. Storskala resequencing og polymorfisme karakterisering studier har i ettertid fokusert på identifisering og katalogisering av naturlig forekommende gen og sekvensvariasjon [2] – [5]. Kreft Genome Atlas og relaterte DNA-sekvense tiltak spesifikt har undersøkt de genetiske faktorer som bestemmer kreft [6]. Disse studier har vist at bare en brøkdel av genetiske endringer som bidrar til tumorgenese kan være arvelig, mens somatisk ervervede mutasjoner kan bidra avgjørende under progresjon av en normal celle til en kreftcelle. Protein kinaser spiller en kritisk rolle i cellesignalisering og har dukket opp som de mest vanlige proteindomener som er implisert i kreft [7] – [11]. Selv om kinase katalytiske domenet er svært konservert, er protein kinase-krystallstrukturene avslørte store strukturelle forskjeller mellom nært beslektede aktive og meget spesifikke inaktive former av kinaser [12] – [17]. Evolusjonær konservering og konformasjonelle plastisitet av kinase katalytisk domene tillater en dynamisk likevekt mellom aktiv og inaktiv kinase former, noe som kan lette reguleringen av den katalytiske aktivitet [15] – [17]. Det er mer enn 500 proteinkinaser kodet i det menneskelige genom og mange medlemmer av denne familien er fremtredende terapeutiske mål for bekjempelse av sykdommer forårsaket av forandringer i signaloverføringsveier, spesielt ulike former for kreft [18] -. [22]
den komplette sekvensering av det menneskelige genom og høy gjennomstrømming generasjon av genomiske data har åpnet opp muligheter for en systematisk tilnærming til å forstå den komplekse biologi av kreft og klinisk målretting av aktiverte onkogener. Storskala svulst sekvense studier har identifisert en rik kilde til naturlig forekommende mutasjoner i protein kinase gener med mange være enkle enkeltnukleotidpolymorfi (SNPs) [23] – [32]. En undergruppe av disse SNPs kan forekomme i de kodende regionene (cSNPs) og fører til det samme polypeptid sekvens (synonyme SNP’er, sSNPs), eller resultere i en forandring i det kodede aminosyresekvens (nonsynonymous kodende SNP, nsSNPs). Resequencing studier av kinase-kodende regioner i tumorer er klassifisert tumorassosierte somatiske mutasjoner som avslører at bare et lite antall av kinase-mutasjoner kan bidra til tumordannelse (kjent som kreft driver mutasjoner) mens hoveddelen kan være nøytrale mutasjons biprodukter av somatisk cellereplikasjon ( kjent som passasjer mutasjoner) [23] – [28]. Mens protein kinaser har en fremtredende rolle i tumordannelse, ofte mutert protein kinaser i kreft syntes å være unntaket fra regelen, og de fleste av kinase driver mutasjoner forventes å bli distribuert over mange protein kinase gener [27]. Kreft mutasjoner i proteinkinaser kan ofte eksemplifisere fenomenet onkogen avhengighet der, til tross for periodisering av mange genetiske forandringer over modning av en svulst, kan kreftceller forblir avhengige på bestemte onkogene stier og kan bli avhengige av fortsatt drift av spesifikke aktiverte onkogener [33], [34]. De dominerende onkogener der det gis onkogen avhengighet effekt inkluderer ABL, EGFR, VEGFR, BRAF, FLT3, RET, og møtte kinase gener [34].
Den nylige oppdagelsen av lungekreft mutasjoner i EGFR kinase domene [35 ] – [37] og deres forskjellig sensitivitet til EGFR inhibitorer har antydet at genetiske endringer kan være forbundet med strukturelle endringer, slik at tumorer som er følsomme for selektive inhibitorer. Strukturelle bestemmelse av EGFR [38] – [41] og ABL kreft mutanter [42], [43] har foreslått at molekylære mekanismer for kinase aktivering av kreft mutasjoner og aktivitets signaturer av kreftlegemidler kan være forbundet med dynamikken i funksjonelle overganger mellom inaktive og aktive kinase former. Biofysikalsk modellering av protein kinase struktur og dynamikk har avdekket viktige mekanistiske funksjonene kinase aktivering på atom oppløsning. Molekyldynamikk (MD) simuleringer av store konformasjonelle overganger er utført for mange terapeutisk viktige proteinkinaser, inkludert HCK kinase [44], adenylatkinase [45], Src kinase [46] – [51], cyklin-avhengig kinase 5 (cdk5) [52], ABL kinase [53], KIT kinase [54] EGFR, RET og MET kinase domener [55] – [57]. Disse studiene har antydet at kreft mutasjoner kan ha en subtil, men likevel svært viktig funksjonell innvirkning ikke bare på lokale konformasjonsendringer på mutasjons området, men også på allosterisk regulering og samarbeids interaksjoner i signaltransduksjon nettverk [58], [59]. I henhold til den foreslåtte mekanisme av kinase-aktivering, kan strukturelle effekten av kreft mutasjoner manifestere seg i skiftende den dynamiske likevekt mellom inaktive og aktive kinase-formene mot en konstitutivt aktiv kinase, og derved forårsake skadelige konsekvenser for regulering kinase.
Cancer biologiske studier av protein kinase gener har integrert genetiske, strukturelle og funksjonelle tilnærminger for å karakterisere underliggende molekylære signaturer av kreft mutasjoner. High-throughput DNA-sekvensanalyse og funksjonell vurdering av kandidatkreft mutasjoner i tyrosinkinase-genene er identifisert punktmutasjoner i de konserverte hot spots fra aktiveringen sløyfe i leukemi-assosiert tyrosin-kinaser [60] – [63]. A high-throughput plattformen har blitt brukt til å avhøre hele FLT3 kodende sekvens i AML-pasienter og eksperimentelt teste de funksjonelle konsekvenser av hver kandidat tumorigen allel [63]. Disse studier har indikert at sjeldne driver varianter kan ofte forekomme ved frekvenser utvisket fra passasjer mutasjoner. Som et resultat, kan funksjonsanalyse av kandidat identifiserte mutasjoner i genom-wide skjermer være til slutt er nødvendig for å bestemme hvilke mutasjoner bidrar til celletransformasjon. Beregnings nærmer seg, når de kombineres med strukturelle og funksjonelle studier har også muliggjort identifisering og prediksjon av kandidatkreftgener og individuelle alleler som bidrar til tumorgenese [64] – [67]
Bioinformatikk verktøy ble nylig utviklet for å skille mellom. fører- og passasjer nsSNPs [68], [69]. Selv ganske kraftig, kan gener prediksjon metoder mislykkes i å oppnå sensitivitet og spesifisitet oppnåelig ved prediksjonsmodeller skreddersydd til den enkelte protein familier. Vi har utviklet kinase-målrettet maskinlæringsmodeller som fokuserte på nsSNPs i proteinkinaser ved å utnytte kjente sekvensbasert og struktur-baserte protein kinase funksjoner for å identifisere mønstre i Rester og sekvensmotiver huser funksjonelt relevante varianter [70] – [72]. Den utviklede støttevektormaskin (SVM) metoden har vist seg å skille mellom sykdomsassosierte nsSNPs og nøytrale nsSNPs med ~80% nøyaktighet [70]. Disse funnene har antydet at den prediktive kraften i maskinlæringsmodeller i vurderingen funksjonelt viktige mutasjoner kan bli betydelig forbedret ved å velge informativ attributter karakteristisk for en bestemt protein familie. Videre har vi funnet at kinase-regioner som bærer et stort antall kreft mutasjoner i flere proteinkinaser kan inneholde en høy andel av de forutsagte driver mutasjoner, mens kinase domenene blottet for kreft mutasjoner var mer sannsynlig å inneholde passasjer mutasjoner [71], [72 ]. Disse resultatene har foreslått at biologiske egenskaper og funksjonelle konsekvenser skiller kreft driver mutasjoner fra passasjer mutasjoner i proteinkinaser kan avvike fra de skille sykdomsassosierte fra nøytrale nsSNPs over hele genomet.
Den økende mengde av genetisk, molekylær og funksjonell informasjon om proteinkinaser gener, kombinert med deres fremtredende rolle som terapeutiske mål for kreft intervensjon har produsert en enestående eksplosjon av ulike data. En stor mengde informasjon om genetiske endringer i protein kinase familier har vært samlet i ulike kilder, inkludert PupaSNP [73], dbSNP database [74], omim (OMIM) fra Nasjonalt senter for Bioteknologi Information (NCBI) [75 ], [76], KinMutBase [77], [78], BTKbase [79], human genmutasjon database (HGMD) [80], [81], Katalog av somatiske mutasjoner i kreft database (COSMIC) [82], Protein kinase Resource (PKR) [83], og Mutasjoner av kinaser i Cancer (MoKCa) [84]. Mens dagens databaser og informasjonsportaler har samlet en stor mengde informasjon om kinase SNPs, er det et økende behov for integrering og omfattende kartlegging av ulike datakategorier på protein kinase gener innenfor en sentral ressurs.
I dette arbeidet, vi introdusere Composite kinase Mutation Database (CKMD), et enkelt depot og integrert bioinformatikk ressurs som konsolideres og utvetydig kartlagt alle for tiden tilgjengelig informasjon om genetiske variasjoner i protein kinase gener med sekvensen, strukturelle og funksjonelle data. CKMD og web-basert ressurs er fritt tilgjengelig på https://verklab.bioinformatics.ku.edu/database/. Funksjonaliteten og mulighetene CKMD portal kan tillate for robust funksjonell annotering av protein kinase gener og aktivere kinome dekkende prediksjon og struktur-funksjonsanalyse av kreft mutasjoner. Den databasedrevne analyse av sekvens og strukturbaserte signaturer av kinase SNPs har avklart fremtredende aspekter ved sekvenskonservering mønstre og strukturelle profiler av kreftfremkallende mutasjoner, inkludert fremveksten av strukturelt konserverte tumorigene hotspots over flere proteinkinaser. Videre strukturell modellering og energisk analyse av kinase kreft mutasjoner, som utgjør den største mutasjons hotspot, har gitt nyttig innsikt i en felles mekanisme kinase aktivering.
Resultater
Sequence-struktur klassifisering og kartlegging av kinase SNPs
integrering og kartlegging av ulike datatyper i CKMD gitt et praktisk rammeverk for kinome dekkende analyse av sekvensbasert og struktur-baserte signaturer av kreft mutasjoner. Genetiske variasjoner i protein kinase genene er viden spredt over både fylogenetisk og strukturell plass, og bare en undergruppe av alle SNPs kan kartlegges direkte til kinase katalytiske domenet. Vi begynte ved å analysere fordelingen av forskjellige SNPs kategorier som kan kartlegges på de 12 funksjonelle domenene (SDS) av kinase katalytisk kjerne [7] (figur 1). Strukturelle kartlegging av sSNPs resulterte i en jevn dekning av kinase underdomener, viser bare en svak preferanse mot SD II som ikke har noen åpenbar funksjonell rolle i kinase regulering (figur 2A). I kontrast, fordelingen av nsSNPs uthevet fortrinnsrett bias mot spesifikke funksjonelle regioner. Faktisk, funksjonelt viktig P-løkke (SD I), hengsel-regionen (SD V), katalytisk sløyfe (SD VIB), og særlig aktivering sløyfe (SD VII) sammen med den nedstrøms P + 1 sløyfeområdet (SD VIII) har en tendens til å bli mer tettbefolkede (figur 2B). P + 1 segment knytter underdomener i C-terminal lapp med ATP og substrat bindende regioner i N-terminal lapp. Videre er P + 1 sløyfe direkte koblet til F-heliks, som tjener som en sentral stillaset i monteringen av aktive kinase-form [85] -. [87]
kinase katalytisk domene ble oppdelt i 12 underdomener (SD) ved hjelp av abl kinase krystallstrukturen (PDB entry 1IEP) som referanse for å definere rest områder som følger: SD i: 242-261 (P-sløyfe region); SD2: 262-278; SD3: 279-291 (αC-helix); SD4: 292-309; SD5: 310-335 (hengsel region); SD6A: 336-356; SD6B357-374 (katalytisk loop); SD7: 375-393 (aktivering loop); SD8: 394-416 (P + l loop); SD9: 417-438; SD10: 439-461; SD11: 462-480; SD12: 481-498. Justeringen av funksjonelle domenene for protein kinase gener ble gjort ved hjelp av struktur informert multippel sekvenssammenstilling.
Fordelingen av kinase sSNPs er vist i panel (A) og fordelingen av sSNPs er presentert i panel ( B)
kinase katalytiske domenet havner et betydelig antall nsSNPs faller inn i tre hovedkategorier:. vanlige og sannsynlig nøytrale nsSNPs, arvet sykdomsfremkall nsSNPs, og kreftfremkallende (somatiske) nsSNPs. Vi analyserte evolusjonære bevaring mønstre blant disse tre ulike kategorier av kinase nsSNPs (figur 3). Et mål for bevaring ble avledet fra den absolutte verdi av substitusjonen stilling spesifikke evolusjonær konservering stillingen, betegnes «subPSEC», som ble oppnådd ved å rette et gitt protein mot et bibliotek av skjulte Markov-modeller (HMM) som representerer distinkte proteinfamilier [88] , [89]. At resultatet ble definert som – | ln (P
aij /P
bij) |, hvor P
aij er sannsynligheten for å observere en aminosyre i posisjon i i j HMM. Ifølge PANTHER- nettsted [89], vil en score på -3 svarer til anslagsvis 50% sannsynlighet for at SNP kan være en sykdomsfremkallende variant. De SNPs bevaring profiler for kinase gener kan beskrives som den absolutte verdien av subPSEC score, hvor høyere score, jo større grad av evolusjonære bevaring. Fordelingen av felles nsSNPs var forutinntatt mot et lavere nivå av bevaring, som ville være forventet for nøytrale varianter med lite eller ingen funksjonell betydning. Kreft-assosiert nsSNPs ut til å falle inn i stillinger med et høyere nivå av bevaring enn vanlige nsSNPs, men kan bli så bevares som sykdomsfremkall nsSNPs (figur 3A). Denne analysen indikerte at enten kreft-assosiert nsSNPs ikke nødvendigvis faller inn evolusjonære høyt konserverte posisjoner, eller fordelingen kan være skjev mot lavere bevaring nivå av kreft varianter av ingen funksjonell konsekvens (passasjer mutasjoner). Ved hjelp av en nylig utviklet SVM-basert metode som kan forutsi funksjonelt viktige kreft mutasjoner [70], [71], sammenlignet vi de evolusjonære bevaring distribusjoner av kreft driver mutasjoner og passasjer mutasjoner på ulike nivåer av bevaring (figur 3B). Selv om den anslåtte kreft driver mutasjoner falt på stillingene som stiller litt høyere bevaring nivå, sammenlignet med de passasjer mutasjoner, forskjellen var heller beskjeden. Derfor virket det som kreft mutasjoner i proteinkinaser ikke kan vise sterke sekvens bevaring signaler og følgelig funksjonell betydning kinase genetiske varianter kan ikke direkte relatert med deres evolusjonære bevaring.
(A) Sannsynligheten fordeling av felles nsSNPs (vist i blå søylene), sykdomsfremkallende SNPs (vist i røde søyler) og kreftfremkallende nsSNPs (vist i grønne søyler) som en funksjon av evolusjonære bevaring nivå. (B) Den sannsynlighetsfordeling for kreft driver mutasjoner (vist i blå søyler) og passasjer nsSNPs (vist i røde søyler) som en funksjon av evolusjonære bevaring nivå. For begge paneler (A) og (B), tilsvarer en høyere poengsum til et høyere nivå av bevaring.
Vi har også analysert molekylære determinanter av genetiske variasjoner i proteinkinaser utnytte CKMD ressurs for en omfattende strukturell kartlegging av nsSNPs ut mot kinase katalytiske kjerne. Databasen drevne analyse viste en differensial anrikning av SNPs kategorier i funksjonelle regioner av kinasedomenet (figurene 4, 5). Vanlige nsSNPs har en tendens til å være tilfeldig fordelt i den katalytiske kjerne, bare sparsomt fyller funksjonelle segmenter av den katalytiske kjerne, slik som de katalytiske eller aktiverings løkker, mens disse nsSNPs mer tett oppta evolusjonære unconserved regioner av den C-terminale hale (figur 4A). Sykdomsfremkallende nsSNPs primært tilordnet til de som er involvert i regulering og substrat regioner bindende, slik som APE-sløyfen og P + 1 region, samt den katalytiske sløyfe (figur 4B). Kreft-assosiert nsSNPs tendens til å målrette regioner som er direkte involvert i den katalytiske aktiviteten som er i hovedsak lokalisert i P-loop, aktivering sløyfe og katalytisk sløyfe (Tall 4C). Fordelingen av kinase nsSNPs tvers av funksjonelle kinase underdomener forsterket forestillingen om at de kinase regioner som er beriket (eller blottet) av SNPs kan være vesentlig forskjellig på tvers av de tre mutasjonstyper, med en minimal overlapping. Faktisk viser fordelingen en klar preferanse for kreftfremkallende nsSNPs å akkumulere det meste i aktiveringssløyfeområdet (SDVII), så vel som å fylle P-loop (SD I) (figur 5A). Et betydelig antall av sykdomsassosierte nsSNPs ble ikke direkte involvert i ATP-bindings, men snarere begravet i den katalytiske kjerne. Interessant, P + en sløyfe og rester som forankre dette lomme til F-helix var noen av de mest beriket i sykdomsassosierte mutasjoner, men ikke kreftfremkallende mutasjoner. Disse resultatene underbygger med tidligere funn indikerer at sykdomsassosierte mutasjoner kan først og fremst påvirke kinase regioner som er involvert i funksjonelle regulering, allosteriske interaksjoner og substratbindende [72].
Structural kartlegging er vist for vanlige nsSNPs (A), sykdoms -causing nsSNPs (B), og kreftfremkallende nsSNPs (C). I alle paneler den grønne fargen representerer regioner med en SNP frekvens som tilsvarer hva som forventes av tilfeldig sjanse, representerer blå farge regioner som er statistisk blottet for SNPs, og rød farge viser områder som er statistisk beriket i SNPs. Anriking av SNPs i disse regionene ble beregnet som beskrevet i Materialer og metoder. For klarhet, ble SNPs tetthet kartlagt på et representativt kinase krystallstruktur (EGFR, PDB oppføring 1M14) ved å projisere multippel sekvens kinase innretting på proteinstruktur.
(A) Fordelingen av felles nsSNPs (vist i blå søylene), sykdomsfremkallende nsSNPs (vist i røde søyler), og kreftfremkall nsSNPs (vist i grønne søyler) i de funksjonelle underdomener av kinase katalytiske kjerne. Den forventede Sannsynligheten for en SNP som forekommer i en kinase subdomene region ble beregnet for hver SNP typen som er beskrevet i avsnittet Materialer og metoder delen. (B) Posisjonen spesifikk fordeling av felles nsSNPs (vist i blå søylene), sykdomsfremkallende nsSNPs (vist i røde søyler), og kreft-assosiert nsSNPs (vist i grønne søyler) på tvers av ulike kategorier av strukturelt konserverte mutasjons hotspots som bestemmes med antall SNPs per strukturelt identisk posisjon.
Funksjonelle forskjeller mellom ulike mutasjonstyper kan også gjenspeiles i den posisjon spesifikk fordeling av nsSNPs på mutasjons hotspots bestemmes av antall strukturelt tilsvarende protein kinase posisjoner (figur 5B). Fordelingen av vanlige nsSNPs, som har liten eller ingen funksjonell påvirke og kunne bli tilfeldig fordelt gjennom den katalytiske kjerne, var dominert av svakt konserverte posisjoner mutert i en enkelt eller to proteinkinaser. I kontrast til sykdomsfremkallende nsSNPs har en tendens til å være konsentrert på strukturelt tilsvarende stillinger, med et betydelig overskudd av mutasjoner som forekommer i stillinger mutert i fire eller flere forskjellige proteinkinaser. Stillingen spesifikk fordeling av kreft nsSNPs ble flyttet til et høyere antall nsSNPs per stilling, sannsynligvis på grunn av valg av tumorigene mutasjons hotspots deles på tvers av flere proteinkinaser (figur 5B).
Strukturelle Bioinformatikk Analyse av kinase mutasjons hotspots
Kinome dekkende analyse av sekvens og strukturbaserte signaturer av kreft mutasjoner, viste at et betydelig antall kreft mutasjoner kan falle på strukturelt tilsvarende stillinger innenfor den katalytiske kjerne. Disse strukturelt bevart mutasjoner tendens til å klynge i spesifikke mutasjons hotspots som kan deles av flere kinase gener. Kreft mutasjon hotspots i proteinkinaser er i stor grad lokalisert i P-loop, hengslene region, og aktivering loop (Figur 6A, Tabell S1). Av spesiell interesse er et spektrum av EGFR, ABL, MET, FLT3 og KIT kreft mutasjoner som tilsvarer den samme strukturelt konservert stilling i aktiverings løkke, som syntes å være mutert i minst 8 forskjellige kinaser (figur 6A, Tabell S1). Dette nettstedet er i samsvar med kjente driver mutasjoner BRAF-V600, FLT3-D835, KIT-D816, PDGFRA-D842, MET-D1228, EGFR-L861, ABL-L387, og ErbB2-L869. Til tross for en sekvens-spesifikk bevaring mønster, mange mutasjoner på dette strukturelt bevart posisjon vanlig forekommende aktiverende mutasjoner, inkludert D1228H /N /V i MET [90], [91], D835E /F /H /N /V /Y i FLT3 [92], [93], D816E /F /H /N /i /V /Y i KIT [94], [95] og V600D /E /G /K /L /M /R i BRAF [96]. I noen tilfeller kan disse mutasjonene har viktige implikasjoner for målrettet hemmer behandling av ledende narkotika motstand effekter i KIT [97], BRAF [98], EGFR [99], ABL [100], og MET [101]. En annen funksjonelt viktig mutasjons hotspot tilsvarer den konserverte gate-keeper kinase posisjon og inkluderer ABL-T315I, EGFR-T790M, KIT-T670E, og PDGFRα-T674I varianter (figur 6A, Tabell S1). Noen av strukturelt tilsvarende stillinger kan bli konservert på tvers av kinome, som aspartat og glycin-rester fra det DFG motiv (svarende til referanseposisjoner EGFR-D855 og EGFR-G857), så vel som en konservert glycin i hengselregionen (hvilken tilsvarer referanseposisjon EGFR-G796). Det finnes eksempler på kreft mutasjoner viser en undergruppe nivå av bevaring, inkludert EGFR-L858 posisjon, som bærer et konservert leucin i EGFR og ABL-kinaser, eller en konservert aspartat delt i FLT3, KIT, MET, PDGFRα.
(A) Strukturell lokalisering av de konserverte mutasjonspunkter er illustrert ved hjelp av krystallstrukturen av det aktive EGFR kinase (PDB entry 2J6M). Den store størrelse rød ball tilsvarer den strukturelle posisjonen L861, og betegner lokalisering av de største mutasjons hotspot delt i 8 forskjellige kinaser. De mellomstore gule baller tilsvarer strukturelle posisjoner T790, D855, og G857 rester (respektive mutasjons hotspots som deles av 6 forskjellige kinaser). Jo mindre grønne ballen tilsvarer G796 posisjon (5 strukturelt konserverte kinase mutasjoner); cyan baller tilsvarer L718 og G721 posisjoner (hver posisjon betegner rester med fire kreft mutasjoner); og den minste blå ball tilsvarer L858 posisjon (3 strukturelt bevart kinase mutasjoner). Kreft mutasjon hotspots i proteinkinaser er i stor grad lokalisert i P-loop, hengslene region, og aktivering loop. Se også tabell S1 for en omfattende annotering av strukturelt bevart mutasjons hotspots. (B) Strukturell lokalisering av cancer driver mutasjoner med høyt onkogene potensialet er illustrert ved hjelp av krystallstrukturen av det aktive EGFR kinase (PDB entry 2J6M). De dominerende onkogene mutasjoner er BRAF-V600E, KIT-D816V, og PDGFRA-D842V som alle svarer til den samme strukturelt bevart mutasjons hotspot. Strukturelle annotering av kreft driver mutasjoner er anordnet i henhold til deres onkogene potensial som bestemmes av frekvensen av observere respektive somatiske mutasjoner i proteinkinaser gener. Jo høyere onkogene potensialet av kreft stasjonen, jo større ballen betegner strukturelle posisjon respektive mutasjon.
Mens de fleste av kreft driver mutasjoner er sannsynlig å være ganske sjelden, er det påfallende at en betydelig antall funksjonelt viktige kreft mutanter falle på strukturelt konserverte posisjoner i kinase katalytisk kjerne. Videre har vi observert at strukturelt konserverte hotspots av kreft driver mutasjoner ofte bærer mutasjoner med en høy onkogen aktivitet (figur 6B). En kvantitativ karakterisering av «onkogenisitet» kan beskrives på en rekke måter, inkludert celletransformasjon potensial, substratutnyttelse, og katalytisk effektivitet. Men slike data er vanligvis tilgjengelig kun for et begrenset antall gener og mutasjoner og er ikke egnet for genom-wide analyse. Vi brukte en enkel definisjon av en onkogent potensiale som kan tilbys ved hjelp av frekvens profiler av somatiske mutasjoner i protein kinaser gener hentet fra den kosmiske depotet [82]. Denne analysen viste at et ganske lite antall av somatiske mutasjoner kinase med det kjente onkogene potensial kunne fremstå med en høy frekvens på mutasjons prøvene (tabell S2). Påfallende, disse funksjonelt viktige mutasjoner faller i store strukturelt bevart stillinger i kinase katalytiske domenet. Faktisk svært onkogene mutasjoner BRAF-V600E, KIT-D816V, og PDGFRA-D842V tilhører den største mutasjons hotspot (figur 6B). Den funksjonelle betydningen av onkogene kinase mutasjoner fra mutasjons hotspots som ABL-T315I, EGFR-L858R, og RET-M918T, er også anerkjent. For eksempel, strukturelt konservert RET-M918T og MET-M1250T kreft driverne er beliggende i det substratbindende C-lapp av kinase kjernen (figur 6B) og er kjent for å være assosiert med onkogene aktivering ved å vise den høyeste transpotensialet hos kjente RET [ ,,,0],102] – [106] og møtte mutasjoner [107] – [110]. Den presenterte analyse antyder at strukturelt konservert hotspots i kinase katalytiske domenet kan være statistisk beriket av mutasjoner med en høy sannsynlighet for å være kreft drivere. Vi mener at den fortrinnsrett strukturelle lokalisering av onkogene mutasjoner i aktiverings sløyfen og substratbindende C-lapp av kinasedomenet kan bestemmes ved sin strategiske plassering kritisk for kinase autoinhibition, regulering og allosteriske interaksjoner i signaltransduksjon nettverk.
Strukturelle og energisk Signaturer av kinase mutasjons Hotspots
Strukturell modellering og energisk analyse av kreft mutasjons effekter kan gi ytterligere innsikt i molekylære mekanismer av kinase aktivering. Vi ansatt homologi modellering og MD simuleringer for å analysere om strukturelt bevart kreft drivere som er rettet mot samme tumorigent hotspot i kinase katalytiske domenet kan også dele en felles aktiveringsmekanisme. Molekylær modellering fokusert på en kvantitativ sammenligning av MET-D1228V, MET-D1228H [90], [91], FLT3-D835V, FLT3-D835E [92], [93], og KIT-D816V, KIT-D816H [94], [95] mutanter. Innbyttere av D835 i FLT3 og D816 i KIT resultat i den konstitutive aktivering av reseptoren, har denne resten blitt foreslått å spille en viktig regulerende rolle. Det krystallstrukturer av FLT3 [111], KIT [112] og møtte kinaser [113], [114] har foreslått at kreft mutasjoner kan destabilisere form autoinhibited villtype (WT). Det er viktig å merke seg at strukturmodelleringsstudier ble utført for å evaluere graden av lokale forstyrrelser som kan bli indusert av kreft mutasjoner på autoinhibited kinase struktur. Gitt fravær av høyoppløselige krystallstrukturer av kinase kreft mutanter og natur store konformasjonsforandringer endringer forårsaket av aktive mutasjoner, har vi fokusert på å forstå lokale funksjonelle effekter av kreft mutasjoner snarere enn å forsøke å gjøre beregnings spådommer av muterte strukturer.
homologi modellering og MD simuleringer av vanlig forekommende aktiverende mutasjoner i denne mutasjons hotspot viste en betydelig lokal omlegging av autoinhibited kinase konformasjon. Dette gjenspeiles i de lokale strukturelle variasjoner nær stedet av mutasjonen (root mean square avvik, RMSD = 3 A-4 A) (tabell S3). Flertallet av kreft mutasjoner resulterte i moderate globale endringer, men betydelige lokale strukturendringer i nærheten av mutasjons nettstedet og i aktivering loop.