PLoS ONE: inferring Temporal Order of Cancer genmutasjoner i Individuell Tumor Samples

Abstract

Den tidsmessige rekkefølgen av kreft genmutasjoner i tumorer er viktig for å forstå og behandle sykdommen. Eksisterende fremgangsmåter er ikke i stand til å antyde størrelsesorden av mutasjoner som er identifisert på samme tid i de enkelte tumorprøver, slik at den heterogene størrelsesorden ukjent. Her viser vi at gjennom et komplekst nettverk basert tilnærming, som er basert på den nylig definerte statistikken –

carcinogenesen informasjon ledningsevne plakater (CIC), kan det timelige ordre i enkeltprøver være effektivt utledes. Resultatene tyder på at tumor-suppressor-gener er kanskje oftere initiere bestillingen av mutasjoner enn onkogener, og alle typer kreft kan ha sin egen unike rekkefølgen av mutasjoner. De første mutasjoner synes å være opptatt av å anskaffe funksjon for å unndra apoptose, og noen ordre begrensninger kan reflektere potensielle regulariteter. Vår tilnærming er fullstendig datastyrt uten parameterinnstillingene og kan forventes å bli mer effektive som mer data blir tilgjengelig

Citation. Guo J, Guo H, Wang Z (2014) konkludere Temporal Order of kreft~~POS=TRUNC genmutasjoner i enkelte tumorprøver. PLoS ONE 9 (2): e89244. doi: 10,1371 /journal.pone.0089244

Redaktør: Raya Khanin, Memorial Sloan Kettering Cancer Center, USA

mottatt: 22 oktober 2013; Godkjent: 20 januar 2014; Publisert: 27 februar 2014

Copyright: © 2014 Guo et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Natural Science Grunnlaget for Kina under stipend no. 61273217; Chinese 111 program av «Advanced Intelligence og nettverkstjeneste» under stipend no. B08004. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser. Zhanyi Wang er med China Mobile forskningsinstitutt, men dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer.

Innledning

Kreft er en genetisk sykdom forårsaket av mutasjon av kreftgener som består av onkogener og tumor-suppressor gener. I de fleste krefttilfeller, multiple mutasjoner forekommer i en prosedyre som er kjent som tumorprogresjon [1], [2]. For å forstå tumorprogresjon har studier blitt utført for å modellere generelle lovmessig på timeorden mutasjoner for en gitt type kreft ved bruk av både eksperimentelle og beregningsorientert tilnærminger [3] – [7]. Som en kanonisk modell, ble rekkefølgen av mutasjoner for tykktarmskreft rekonstruert gjennom tumorstørrelse og grad [8]. De siste beregningsmodeller antyde de typiske timeordre begrensninger for visse typer kreft ved å simulere tumorprogresjon som en stokastisk prosess [9] – [11]. Til tross for dette pågår, er det fortsatt ingen veldefinert metode for å antyde størrelsesordenen mutasjoner identifisert på samme tid i enkelte prøver, selv om denne slutning er nødvendig for å avdekke heterogenitet i størrelsesorden av mutasjoner i kreft. Nylig, som ny generasjon sekvensering blir mye brukt, mutasjons landskap i ulike kreftformer blir avslørt én etter én. Resultatene har vist at mutasjoner i kreft ofte demonstrere statistiske korrelasjoner med hverandre eller til og med føre til-og-virkningssammenhenger for induksjon mellom den førstnevnte og den sistnevnte [12] – [18]. Men disse korrelasjonene /sammenhengene er ikke fullt utnyttet i dedusere den tidsmessige rekkefølgen av mutasjoner.

Fra en informatic perspektiv, denne studien definerer en statistisk måling for å tildele verdi til korrelasjoner eller sammenhengene som er nevnt ovenfor, og modellere mutasjoner innenfor et komplekst nettverk, gjennom hvilken den tidsmessige rekkefølge av mutasjonene i individuelle prøver kan utledes. Vi kaller målingen

carcinogenesen informasjon ledningsevne plakater (CIC), som måler reachability for å overføre informasjonen til en kreft genet har mutert til transkripsjon prosessen med en gitt un-mutert kreft genet for å indusere sin mutasjon. Statistisk sett kan reachability anslås ved de enkelte hendelsesfrekvensen og den sekvensielle co-forekomst frekvens av de to genene «mutasjoner i kreftprøver. I tillegg bør også tas i betraktning konkurranse mellom den informasjon som sendes fra flere muterte gener til en gitt un-muterte genet som noen vellykket sending vil føre til målgenet for å mutere, dermed sluttet mutasjonen prosessen. I denne studien, kaller vi alle to mutasjoner funnet i de samme kreftprøve co-truer mutasjoner. Mens de fleste genomiske studier gir denne mengden på en indirekte måte, her har vi som mål at løsrive sekvensen av forekomsten av to mutasjons hendelser fra det enkle co-forekomst. Fra disse sekvenser av mutasjon hendelse, kan den sekvensielle samtidig forekomst frekvens beregnes (Materialer og metoder). Basert på denne ideen, har vi definert CIC av kreft genet

jeg anbefale til kreft genet

j

som: (1) hvor () er hyppigheten av mutasjon av genet

i

(

j

) i kreft, er det sekvensielle co-forekomst hyppigheten av mutasjon av genet

i

fulgt av mutasjon av genet

j

, og er prioritert av genet

i

sammenlignet med andre muterte gener å sende informasjonen til genet

j

. Vi har fastslått at. I denne ligningen er det sett av kreftprøver med muterte gener

i

og

j

, er antall prøver i settet, og er en indikator funksjon som tilsvarer 1 hvis de muterte gener

j Hotell og

i

i prøven. Ellers er det lik 0. Følgelig høyeste prioritet vil bli tildelt dersom er større enn i hver prøve av settet, og jo flere ganger at, jo større verdi. Vi anser formel (1) som et mål på kreft informasjon ledningsevne fordi forholdet er et estimat av maksimal sjanse for at genet

i

sender kreftinformasjon til genet

j Hotell og fører sin mutasjon, den forholdet er et estimat av maksimal sjanse for at mutasjon av genet

j

er forårsaket av kreft informasjon mottatt fra genet

i

, og er prioritert av kommunikasjonsforbindelsen sammenlignet med andre linker til genet

j

. Verdien av i området fra 0 til 1. I likhet med definisjonen av

aktiveringskraft

, en måle vi tidligere har foreslått for å vekte koblinger av komplekse nettverk [19], definisjonen av CIC følger formelen av tyngdekraften hvis vi forestille seg prosenter og som massene og den prioritet som avstand. Statistikk er definert på denne måten er sannsynlig å distribuere sine verdier i et strøm lov, noe som er praktisk for å analysere komplekse nettverk av intrikate relasjoner, inkludert de i biologi [20] – [24]

En utfordring ved beregning av CIC. er mangelen på kreft prøver som kan anvendes som kilde for de etterfølgende samtidig forekomst frekvensene av kreft genmutasjoner på grunn av mutasjoner i forskjellige gener i en kreftprøve er vanligvis identifisert på samme tid ved sekvensering. For å takle denne utfordringen, presenterer vi en iterativ prosedyre som par CIC beregning og slutning av sannsynligheten for alle potensielle orden kreft genmutasjon. Anvendelsen av denne prosedyren til Katalog av somatiske mutasjoner i Cancer (COSMIC) database [25], [26] viste at iterasjonen nådde konvergens innenfor færre enn 10 looper, og de konvergente resultatene tyder på betydelige konklusjoner.

materialer og metoder

iterativ slutning ordningen

for å utføre iterativ slutning prosedyren, et stort sett av kreftprøver med kreft genmutasjoner identifisert av genom-wide sekvensering er nødvendig. Med datasettet, finner vi de grunnleggende statistikk over forekomst og ikke-sekvensiell co-forekomst frekvenser av kreft genmutasjoner. Fra disse grunnleggende statistikk, iterativ slutning for antall prøver i spørsmålet begynner og CIC resultater og sannsynlige bestillinger av kreft genmutasjon for hver prøve i spørsmålet bestemmes når køyring når konvergens. Fig. 1 viser en oversikt over prosedyren.

(a) forekomst og co-forekomst frekvensene av kreft genmutasjoner og bestemmes fra tilgjengelige prøvene, hvor og er antall kreftgener målrettet i studien . En forekomst av et gen vil bli regnet dersom det er mutert i en av prøvene, og en samtidig forekomst av to gener vil bli regnet hvis begge er mutert i en av prøvene; da og. (B) Basert på prinsippet om maksimal entropi, blir de opprinnelige verdiene av de sekvensielle samtidig forekomst frekvenser som angitt. (C) leverkreftkarsinogenese informasjons konduktiviteter, er beregnet ut fra vektoren for og matrisen av. Det bør bemerkes at kanskje ikke være lik, noe som tyder på at matrisen av representerer en rettet nettverk. (D) For hver av prøvene i spørsmålet, er sannsynlighetene for alle mulige orden av de mutante gener i prøven beregnes i henhold til CIC for hver ordre (Methods). (E) Matrise som blir gjenbestemt ved matrisen av og forholdet mellom sannsynlighet veid antall ordrer indikerte at

i

opptrer før

j

til antallet av samtidig forekomst frekvens , er det viktig å merke seg at ikke er lik generelt. Dersom matrisen til ikke har nådd kriteriet om konvergens, vil de utledede ordre om ikke betraktes som stabil og en ny løkke av beregningen av og vil bli utført. Ellers (f), er ordrer med en sannsynlighet høyere enn tilfeldigheter og tilsvarende sannsynligheter og regnes som de refererte resultatene. For eksempel, av alle 6 mulige bestillinger for et utvalg med tre muterte kreftgener

en

,

b Hotell og

c

, ordre og er identifisert som den sannsynlige seg grunnet sannsynlighetene for 0,7 og 0,2 (høyere enn en tilfeldig sjanse til 1/6).

iterativ prosedyre for CIC beregning og slutning av mutasjon for

Per definisjon, sekvensiell co-forekomst frekvenser er nødvendig for å estimere CIC verdi. Imidlertid kan dette kravet ikke oppfylles av de nåværende databaser, inkludert COSMIC. For å overvinne denne vanskelighet, har vi adoptert en iterativ prosedyre for å koble den slutning av de forekommende mutasjon ordrene og beregning av CIC. Først må vi jevnt dele en ikke-sekvensiell co-forekomst frekvens i de to mulige sekvensiell co-forekomst frekvenser for å beregne de første CIC. Vi deretter antyde mutasjons ordrer med de innledende CIC til repredict sekvensielle co-forekomst frekvenser, gjenta CIC beregning og slutning av mutasjons ordre til en konvergent resultat oppnås.

Basert på prinsippet om maksimal entropi, vi først bruke en uniform før fordeling av forekomsten ordrer, noe som betyr at for de ikke-sekvensiell co-forekomst hyppigheten av mutasjon av to gener

i

og

j

, de to mutasjon bestillinger av

i

j Hotell og

j

i

oppstå med samme sannsynlighet. Derfor er det nødvendig sekvensiell samtidig forekomst frekvens angitt som en halvdel av den tilsvarende ikke-sekvensiell frekvens. Med denne innstillingen, beregner vi den første CIC mellom hvert par av kreftgener.

Vi deretter beregne CIC at en bestilling av mer enn to muterte gener besitter. I denne beregning, må vi anser at hver av de foregående gener kan sende carcinogenesis informasjonen i parallell til et målgen i orden. Derfor låne vi prinsippet om å beregne motstanden i en krets, som er en parallell-til-seriell-prosedyre; vi oppsummere alle de parallelle CIC fra de foregående gener til et mål gen innenfor for å bestemme

fase CIC

av ordren og deretter formulere

for CIC

av brus all

fase CIC

s. Vurdere rekkefølgen

APC → ATM → KRAS

som et eksempel; denne ordren inneholder to faser av informasjon sending,

→ ATM Hotell og

→ KRAS

. I den første fasen, kan informasjonen sendes fra bare én kilde,

APC

. Derfor ,, CIC fra

APC

til

ATM

, rett og slett blir CIC av den første fasen. I den andre fasen, imidlertid både

APC

og

ATM

kan bli informasjonskilde, som krever summering av de to parallelle CIC CIC som av den andre fasen. Etter den parallelle trinn i hver fase, den inverse verdien av

fase CIC

s, anses som motstander, blir serie oppsummeres som gjensidig av

for CIC

. Trinnene er som følger:

Parallel skritt

:

Serie skritt

.

k

th gen i den rekkefølgen er den informasjonen du mottar genet på

(k-1)

th fase og har

k-1

avsendere av parallell informasjon. En ordre som består av

n

gener har

n-1

faser av kreft informasjon ledning. Generelt har vi ligningen, hvor er CIC av fase

k

, er CIC fra genet til genet, og er indeksen av genet i posisjon i den rekkefølgen.

Basert på definisjonen av CIC, en større CIC verdi av en mulig rekkefølge innebærer enklere karsinogenese informasjon ledning inne i orden. Blant alle konkurrerende ordrer, jo større CIC verdien av en bestilling, desto større sannsynlighet for forekomsten av ordren. Derfor antar vi at CIC av en ordre er positivt i forhold til sannsynligheten for at bestillingen skjer. Ved estimering av sannsynligheten for alle potensielle ordre av en lineær mapping fra CIC til alle potensielle bestillinger for et gitt sett av muterte gener, er summen av sannsynlighetene for alle mulige bestillinger lik en. Formelt for en prøve med

n

muterte kreftgener, antall potensielle bestillinger er

n

!; vi kartlegge CIC av orden

m product: (

m

= 1, 2, …,

n

!) inn i sin sannsynlighet ved hjelp av ligningen

Etter fastslå sannsynligheten for alle mulige bestilling av mutasjonene, redetermine vi den anslåtte sekvensielle co-forekomst frekvenser som følger: hvor stor er sannsynligheten for bestilling

m

prøve

l

, og

L

er antall prøver i spørsmålet. er en indikator funksjon som tilsvarer en da gen

i

oppstår før genet

j

for

m

prøve

l Hotell og lik 0 i alle andre saker, og er den ikke-sekvensiell co-forekomst frekvens mellom genet

i

og genet

j

. Hvis bestemt verdiene er nesten identisk med de gamle eller bli konvergent, de beregnede CIC og dermed inferred ordre sannsynlighetene kan anses som pålitelige resultater. Ellers CICS og ordresannsynligheter må gjenbestemt i en ny sløyfe. Den iterative prosedyre fortsetter på denne måte inntil konvergens er nådd. I praksis kan kriteriet om konvergens betraktes som oppfylt når den absolutte forskjell mellom den nye og gamle verdier av monotont reduseres til en tilstrekkelig liten verdi.

Ettersom vi begynner den iterative prosedyre med en første prediksjon av den sekvensielle samtidig forekomst frekvenser fra ikke-sekvensielle frekvenser basert på maksimal entropi prinsippet, som gir maksimal endring potensialet i sekvensielle co-forekomst frekvenser i første iterasjon, vil endringen avta gradvis og til slutt bli ubetydelig. Denne forutsetningen ble bekreftet i studien; en tilfredsstillende konvergens ble nådd i løpet færre enn 10 ledd av den slutning prosedyren ved hjelp av et sett med prøver fra COSMIC databasen.

iterasjon basert på COSMIC data når konvergens innen 10 sløyfer. Her bruker vi beregningen av CIC fra

KRAS

til

APC

å innføre prosedyren i detalj. I utgangspunktet regner vi forekomsten frekvenser av = 125 og = 209 og en ikke-sekvensiell co-forekomst frekvens = 79 fra COSMIC database. Ved å definere halvparten av den ikke-sekvensiell ko-forekomstfrekvens (79) i sekvensiell frekvens, vi fastslå at = 39,5. Når man sammenligner med de sekvensielle co-forekomst frekvenser fra andre enn gener

KRAS

til genet

APC

i hver av de 79 prøvene, er funnet å ha en gjennomsnittlig ordre på 1,47. Derfor prioritet = 1,47, og den opprinnelige verdien av = (39,5 /125) * (39,5 /209) /1.47

2 = 0,028.

Ved hjelp av de innledende CIC mellom alle kreft genet parene, anslår vi sannsynligheten for enhver potensiell mutasjon forekomst orden i hver prøve på den måte som er beskrevet ovenfor. I henhold til sannsynlighetene, kan de ikke-sekvensiell ko-hendelsesfrekvensen være ujevnt fordelt på sekvensielle frekvenser. For de 79 prøvene i dette eksempelet, forholdet mellom

KRAS

APC

vs.

APC

KRAS

basert på tilsvarende totale sannsynligheten for hver ordre er 0,28: 0,72. Derfor oppdaterer vi verdien av = 79 * 0,28 = 22,1, og prioriteten blir deretter bestemt med den nye. Med disse nye verdiene, redetermine vi.

Konvergens av og motparten i løpet av gjentakelser er vist i fig. 2. Dette eksempel viser at verdiene oppnå en tilfredsstillende konvergens etter bare 6 iterasjoner. Dette eksemplet representerer også vanlig situasjon, og dermed endte vi beregningen av CIC etter 10 gjentakelser i denne studien.

CIC (a) og dens motstykke (b) raskt nå konvergent som gjentakelser av beregningen er utført . Etter 6 gjentakelser, har en tilfredsstillende konvergens er oppnådd.

Kompleksitet av slutning prosedyren

CIC beregningen har en kompleksitet

O product: (

n

2) hvis antallet kreftgener i studien er

n

, og slutning av sannsynlighetene for alle mulige bestillinger for en prøve med

m

muterte kreftgener har en kompleksitet av

O product: (

m! m

2). I vår studie,

n

er lik 397 og

m

varierer fra 2 til 8. Derfor kompleksiteten i

O product: (

m! M

2) kan være svært forskjellig for ulike prøver. I virkeligheten, under slutning for 1,118 prøvene rapportert i studien, ble størstedelen av den tid som forbrukes av noen få prøver med det maksimale antall av mutante kreftgener. Det er verdt å merke seg at under hele prosedyren, vi bare nødt til å beregne CIC gang i hver sløyfe å antyde ordre sannsynlighetene for alle prøvene. Den slutning prosedyre med 10 gjentakelser for 1,118 prøvene ble gjennomført i løpet av 10 minutter på en plattform som består av en PC (4 * 2,66 GHz Quad CPU) og Matlab.

Study data

Resultatene rapporteres i denne studien ble hentet fra en fersk COSMIC database (utstedt 12. september

th, 2012) på kodepunktmutasjoner. Det er en tabell-fil som inneholder navnene på de muterte kreftgener i hvert kreft samplet. Mutant gener i samme kreft har samme svulst ID (

ID_tumour

), og innen

genome-wide-screen Hotell og

primærsiden

gi nødvendig informasjon som brukes i denne studien.

trinn for å bestemme forekomst og co-forekomst frekvenser av kreft genmutasjoner i prøvene

forekomst og co-forekomst frekvenser av kreftgener i kreftprøver ble brukt til å anslå CIC i studien, og de grunnleggende statistikk ble bestemt ved å gjøre følgende:

Last ned

kilde

fil

CosmicMutantExport_v61_120912.tsv

gjennom ftp: //ftp. sanger.ac.uk/pub/CGP/cosmic/data_export/;

Lag

midlertidig

fil ved å skaffe postene med verdien «

y

« i «

genom-wide screen

-feltet fra

kilde

fil;

Lag

primære

fil ved å skaffe registreringer av kreftgener definert av filen

Table_1_full_2012-03-15.xls

i

Cosmic

nettside fra

midlertidig

fil, og raffinering poster i sekvenser av

Gene_name Hotell og

ID_Sample

;

Lag

mutation_sequence

fil der hver post er en liste over de muterte gener i den samme prøven, basert på

primære

fil , og kast den posten som inneholder bare ett gen navn i

mutation_sequence

fil;

Count forekomst og co-forekomst frekvensene av kreftgener basert på

mutation_sequence

fil.

Resultater

funksjoner av de estimerte CIC

Vi utførte slutning om kreft genmutasjon data fra genom-wide skannet prøver samlet i en nyere versjon av Cosmic database. Til sammen 1212 prøver skjuler 6,281 mutasjoner i 397 kreftgener var tilgjengelig for å bestemme de grunnleggende forekomst og co-forekomst frekvenser. Fra disse, 1,118 prøvene, som hver husing ikke mer enn 8 mutante kreftgener, ble anvendt i den iterative fremgangsmåten i CIC beregning og orden slutning. Tabell S1 viser 1,118 prøvene. Resultatene ble funnet å konvergere i løpet av 10 iterasjoner. Etter konvergens, CIC med en verdi som er større enn 1.0e-6 presentert en kraft lov lignende fordeling over størrelsene, slik at de aller fleste har en størrelse mindre enn gjennomsnittet av 4.0E-4 og en meget liten del har en større enn gjennomsnittlig størrelse (fig. 3, Tabell S2). Denne funksjonen er også sant for fordeling av størrelsene av CIC fra (eller til) et gitt gen i de fleste tilfeller, noe som betyr at bare et lite antall partnere er vesentlig i form av karsinogenese informasjon ledning for et gitt gen. Med andre ord, de CIC identifisere nærmeste samarbeidspartnere i kreft informasjon ledning. Videre er rettet nettverk av kreftgener koblet av CICS var asymmetrisk og liten verden-aktig. CIC fra genet

jeg anbefale til genet

j

var som regel ulik til at fra genet

j

til genet

i

; nettverket har et antall knutepunkt gener med mange flere linker enn normalt. Denne funksjonen er i tråd med forestillingen om at signaleringsnettet i kreft er analogt til Internett, som konstruerer en liten verden med hub noder [27] – [29]. Fig. 4 illustrerer et CIC knyttet nettverk dekker 44 kreftgener, inkludert hub genene

APC

,

TP53 Hotell og

MLL3

, og koblingene sterkere enn 1.0e-2 viser asymmetri . Asymmetrien av CIC innebærer eksistensen av en preferanse for visse mutasjons ordrer. I tillegg er tre hub gener er alle tumor-suppressor gener, og den sterkeste rettet linken, med en verdi på 0,136, er fra

APC

til

KRAS

, en av de mest mutert onkogener , noe som tyder på en overordnet informasjonskanal fra mutasjon av

APC

til mutasjon av

KRAS

.

CIC større enn 1.0e-6 er tilstede i en makt lov-lignende distribusjon; spesifikt, logaritmen av antallet av CIC kontra logaritmen av deres størrelsesordener gir en stykkevis lineær sammenheng. Basert på spørsmålet om hvorvidt en kraft lov fordelingen er hensiktsmessig for å analysere komplekse nettverk og bekymringer om upålitelighet av undervurderte CIC som kan være forårsaket av reserve data, bare de CIC større enn 1.0e-6 ble brukt direkte i den slutning i denne studien . CIC inferred som mindre enn 1.0e-6 ble erstattet av terskelen for utjevning.

Førti-fire ofte muterte kreftgener (i mer enn 20 genome-wide skannede prøvene i COSMIC database) er illustrert med CIC mellom dem større enn 1.0e-2. Tykkelsen av koblingen er proporsjonal med styrken av det tilsvarende CIC. Når et par av gener har toveis linker blir sterkere kobling tegnet som en rett linje, og den svakere en er tegnet som en buet linje (se tilfelle av

APC

← →

TP53

) . Asymmetri kan observeres av det faktum at ingen toveis koblinger av lignende styrker eksisterer mellom genet parene, og

APC

,

TP53

, og

MLL3

hver spiller en hub rolle i nettverket.

den slutning av sannsynlige bestillinger

de anslåtte mutasjon bestillinger med en sannsynlighet høyere enn tilfeldig sjanse, heretter kalt

sannsynlige bestillinger

, forut mer konkrete innsikt i tumorprogresjon. Vi analyserte de sannsynlige bestillinger inferred for 1,118 kreftprøver aktuelle å undersøke maksimalt 8 mutasjons skritt fra innvielsen. Den primære områder av prøvene ble hovedsakelig lokalisert i

eggstokk product: (256),

large_intestine product: (

LI

, 180),

haematopoietic_and_lymphoid_tissue plakater (

HLT

, 148),

prostata product: (100),

bryst product: (97),

central_nervous_system product: (

CNS

, 86) og

upper_aerodigestive_tract product: (

UAT

, 72).

Tabell S3 viser alle sannsynlige bestillinger og deres sannsynligheter i de analyserte prøvene, og Tabell 1 viser et utvalg av dem . Basert på de sannsynlige ordre, konkluderte vi at i en gitt prøve bare en liten del av alle de potensielle ordrene har en sannsynlighet større enn tilfeldige, og den totale sum av sannsynlighetene for disse ordrene er nær det antall sampler med en ratio av 1034,4 /1118. Dette indikerer at den slutning identifisert en liten del av alle potensielle ordrene permutert ved gitt sett av muterte kreftgener som den sannsynlige ordrer. For et utvalg huse to muterte kreftgener, den slutning alltid sterkt antyder en av to mulige bestillinger. Imidlertid, for de prøver med mer enn to mutante kreftgener, kan enkelte ordre ha sammenlignbare høye sannsynligheter. Selv om vi ikke kan dømme de enkelte plausibilities av de utledede sannsynlige bestillinger på grunn av mangel på bakken sannhet for bestillinger i de fleste tilfeller, kan deres betydning bli sterkt antydet ved å evaluere den slutning med prøver av en bestemt krefttype som har blitt godt studert i form av orden. For eksempel

APC, KRAS og TP53

er de tre hyppigst muterte gener i tykktarm kreft, og deres mutasjons bestillinger har blitt godt modellert [30], [31]. I våre resultater, prøven med muterte kreftgener

APC Hotell og

KRAS

, ga en antatt sannsynlighet på 0,95 for ordren

APC

KRAS

, som var i overensstemmelse med tidligere studier. For prøven med mutant

APC, KRAS og TP53

kreftgener, tre sannsynlige bestillinger av

APC → KRAS → TP53 plakater (0,33),

APC → TP53 → KRAS product: ( 0,32)

og TP53 → APC → KRAS product: (0,19) ble utledet fra 6 potensielle seg, og dette resultatet var også i overensstemmelse med tidligere studier.

BRCA1

germline mutasjoner gi en høy risiko for brystkreft og eggstokkreft, men somatisk tap av villtype

BRCA1

allel har vist seg å oppstår vanligvis

etter

mutasjon av

TP53 product: [32]. Etter avtale med denne observasjonen, vi utledes somatisk mutasjon for

TP53 → BRCA1

med en sannsynlighet større enn 0,99. Disse eksemplene gir bevis for å støtte den slutning gyldighet.

initiativtakerne sannsynlige mutasjoner bestillinger

Identifisere initiativtakerne mutasjon bestillinger har vært ansett som en av de store utfordringene i studiet av svulst progresjon [1]. Våre inferred sannsynlige bestillinger av mutasjon gitt informative hint til å løse denne utfordringen. Ved å undersøke genene som setter i gang den sannsynlige bestillinger, fant vi ut at initiativtakerne ble dominert av tumor-suppressor gener. Et overveldende flertall (mer enn 77,5%) av sannsynligheten veid antall av de sannsynlige ordrene ble antydet å være initiert av en tumor-suppressor-gen i stedet for et onkogen. Det var 368 kreftgener i test kreftprøver, blant dem bare 92 var tumor dempere. Mer spesifikt, det var 1,858 mutasjoner av tumor suppressors blant totalt 3823 mutasjoner av alle kreftgener. Derfor gjennomsnittlig sjansen for svulst suppressors å initiere mutasjon ordrene var 48,6% (1858/3823). Dette viser at dominans av tumordempere i initiering mutasjons ordre ikke kan tilskrives tilfeldigheter. I tillegg blir forholdet mellom det antall ganger et gen var initiatoren til dens mutasjonsfrekvens var vanligvis forskjellig, noe som tyder på at det ikke er sikkert at ofte muterte gener vil mutere tidlig (tabell 2). Betydelig, sannsynligheten veid antall sannsynlige ordrer startet av de to øverste tumor-suppressor genet initiativtakerne

TP53 Hotell og

APC

, besto av prosenter så stort som 46,9% og 11,4%, henholdsvis . I motsetning til de to øverste onkogene initiativtakerne,

PIK3CA Hotell og

KRAS

, ble funnet i prosenter så lite som 3,1% og 1,3%, henholdsvis. Den øverste initiativtakerne mutasjon ved de respektive primære kreftformer foreslått flere detaljer (Tabell 3). Generelt alle kreft på de store primære områder av prøvene viste en tumor-suppressor genet som sin topp initiator. Spesielt

TP53

var en vanlig topp initiativtaker i fire av de tidligere oppført krefttyper,

eggstokk

,

UAT

,

bryst Hotell og

prostata

, med prosenter på 91,5%, 73,4%, 57,6% og 30,4%, respektivt. I

LI

kreft, den øverste initiativtakeren var

APC plakater (57,5%), etterfulgt av

TP53 plakater (29,7%). Begge

CNS Hotell og

HLT

kreft hadde ingen åpenbart overlegne initiativtakerne, med

CIC plakater (13,6%),

PIK3CA plakater (10,1%) og

TP53 product: (10,0%) som de tre initiativtakerne for det tidligere, og

TP53 plakater (14,9%),

NPM1 plakater (10,4%) og

MLL2

(9,9%) som de tre initiatorer for den sistnevnte. Fra perspektivet til initiativtaker distribusjon,

eggstokk

,

LI

,

UAT Hotell og

bryst

kreft ble inferred å bli dominert av et lite antall tumor -suppressor gener, mens

HLT

,

CNS Hotell og

prostata

kreft ble antydet å ha mer varierte betydelig initiativtakerne.

tidligere studier har antydet en rekke kjennetegn funksjoner som må erverves for en kreft å generere, hjelper forskerne å forstå kompleksiteten i tumorprogresjon hos en måte logisk, vitenskapelig måte [33], [34]. Våre inferred resultater peker mot et forslag som går ett skritt videre. I de fleste kreftformer, kan tidligst ervervet kjennetegn funksjon være

unndra apoptose

fordi flertallet av første muterte gener i hver krefttype i tabell 3 (

TP53, APC, KRAS, PIK3CA, NPM1 Hotell og

CIC

) har blitt funnet å kode for apoptose regulerende proteiner, og mutasjonen av alle disse gener har vist seg å føre til mangelfulle apoptose funksjoner. Nærmere bestemt mutasjon av

TP53

kan resultere i fjerning av en viktig del av den DNA-skade føleren, som virker til å indusere apoptose [33], [34], mutante former av APC protein kan svekke responser til apoptotiske stimuli [35], [36], mutasjonene i

KRAS Hotell og

PIK3CA

kan aktivere trasé som overfører anti-apoptotiske overlevelsessignaler [33], og proteiner kodet av

NPM1 Hotell og

CIC

har vist seg å fungere i apoptose [37], [38].

Informative overganger i de sannsynlige bestillinger

overgangene i den sannsynlige ordrer gitt ytterligere informasjon om tumorprogresjon.

Legg att eit svar