Abstract
Surprisal analyse blir i økende grad brukt for undersøkelse av transkripsjons nivåer i cellulære prosesser, mot avslørende indre nettverksstrukturer og forutsi respons. Men for å oppnå sitt fulle potensial, bør surprisal analyse integreres i et bredere spekter beregningsverktøy. Formålene med denne artikkelen er å kombinere surprisal analyse med andre viktige beregnings prosedyrer, for eksempel enkel bruk av analyseresultatene – f.eks for å velge ønskede resultat sub-sett for videre inspeksjon -, gjenfinning og sammenligning med relevante datasett fra offentlige databaser og fleksible grafiske skjermer for heuristisk tenkning. Hele settet med beregnings prosedyrer integrert i én praktisk verktøy er det vi kaller
Computational Surprisal Analyse
. Denne kombinerte typen analyser bør legge til rette for betydelig kvantitativ forståelse av ulike cellulære prosesser for forskere, inkludert applikasjoner i proteomikk og metabolomics. Utover det, er vår visjon at
Computational Surprisal Analyse
har potensial til å nå status som en rutinemessig analysemetode for utøvere. Oppløsningsevne
Computational Surprisal Analyse
er her demonstrert av sin søknad til en rekke cellekreft prosesstranskripsjons datasett, vår og fra litteraturen. Resultatene gir en kompakt biologisk bilde av den termodynamiske betydning av de ledende genekspresjon fenotyper i alle trinn av sykdommen. For hvert transkript vi kjennetegner både dens iboende stabil tilstand i vekt, dens korrelasjon med de andre transkripsjonene og dets variasjon på grunn av sykdom. Vi presenterer en egen nettside for å lette analysen for forskere og praktikere
Citation. Kravchenko-Balasha N, Simon S, Levine RD, Remacle F, Exman I (2014) Computational Surprisal Analyse Hastigheter-Up Genomisk Karakterisering av kreft~~POS=TRUNC prosesser. PLoS ONE 9 (11): e108549. doi: 10,1371 /journal.pone.0108549
Redaktør: Jose M. Sanchez-Ruiz, Universidad de Granada, Spania
mottatt: 18 februar 2014; Godkjent: 31 august 2014; Publisert: 18.11.2014
Copyright: © 2014 Kravchenko-Balasha et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av en EMBO postdoktorstipend til NKB og EU-kommisjonen FP7 Future og Emerging Technologies-Åpne prosjekt BAMBI 618024 (til FR og RDL). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Surprisal Analyse, i sin mest generelle forstand, er en prosedyre for å karakterisere sannsynligheten for ulike tilstander av et system, stater som kan ha et rikt indre struktur. Videre kan systemet ikke være i en stabil tilstand. Fremgangsmåten begynner ved å anta at et sett med et forholdsvis lite antall begrensninger er kjent. Disse begrensninger er ansett å være tilstrekkelig for å karakterisere de avvik av distribusjonen fra den stabile tilstand som følge av de pålagte betingelser på systemet. Hvis de antatte begrensninger er utilstrekkelige for å faktisk reprodusere sannsynlighetsfordelingen, er en
overrasket Hotell og må derfor søke etter modifiserte og /eller ytterligere begrensninger.
Surprisal Analyse har sitt grunnlag i naturvitenskap og har blitt brukt til en mengde fysiske, kjemiske og tekniske problemer og overbevisende demonstrert å være relevant, nyttig og produsere prøvbare resultater [1] – [4].
Den nåværende arbeid tilhører en serie av papirer [ ,,,0],5] – [9] som har som formål å vise at Surprisal analyse er også relevant og aktuelt for biologiske fenomener, spesielt cellulære kreftprosesser. En fersk kommentar til tilnærming i biologi er [10]. Bruke surprisal analyse identifiserer vi de mest stabile balanserte mRNA-distribusjoner i alle faser av sykdommen fra de eksperimentelle data og også mindre stabile mRNA nettverk som holder cellene bort fra balansert tilstand. Disse nettverkene til grunn for prosessen med kreftutvikling. Vi sammenligner mellom cellesystem /pasientnettverk som deltar i kreft transformasjon og relatere dem til de nettverkene som bidrar mest til balansert tilstand.
Dette papiret har to ekstra spesielle formål.
Først, for å kombinere Surprisal Analyse med andre viktige beregnings prosedyrer, for eksempel enkel bruk av analyseresultatene – f.eks for å velge ønskede resultat sub-sett for videre inspeksjon -, gjenfinning og sammenligning med relevante datasett fra offentlige databaser og fleksible grafiske skjermer for heuristisk tenkning. Hele settet med beregnings prosedyrer integrert i én praktisk verktøy er det vi kaller
Computational Surprisal Analyse
. Denne kombinerte typen analyser bør være mye raskere for praktikere og forskere, enn å ha uavhengige, men feilaktige verktøy skal integreres i logisk og praktisk konsistens.
For det andre, over en lengre tidsskala, er vår visjon å nå status som
Computational Surprisal analyse
vil være en rutinemessig analyse for kreftdiagnostikk. Dermed foruten, bildeteknikker, minimal invasiv kirurgi, cellegift, kontrollerte strålebehandlinger, er det forventet at
Computational Surprisal Analyse
vil finne sin plass i klinisk praksis, påskynde oppstartsdiagnosen.
Derfor denne artikkelen tar sikte på å vise:
relevansen av Surprisal Analysis til
forstå
av biologiske fenomener, ved å diskutere nye resultater i området av Cellular kreft Prosesser i laboratoriemiljø,
at
Computational Surprisal Analyse
faktisk akselererer Surprisal analyse, ved først å beskrive integrerende aspekter av verktøyet, og deretter forklare speed-up gevinster i beregningen og i heuristisk tenkning;
anvendelig av
Computational Surprisal Analyse anbefale til diagnostisering av Cellular kreft prosesser, ved å sammenligne resultater oppnådd for syke i motsetning til friske personer.
Cellular Kreft Prosesser
Kreft er en sterkt heterogen sykdom som viser en betydelig fenotypisk variasjon mellom pasienter med samme type cancer. Derfor forståelse av de underliggende onkogene prosesser involvert i prosessen med transformasjon, krever systemnivå tilnærminger slik at identifisering og karakterisering av systemkomponenter.
Nye tekniske forbedringer som cDNA mikromatriser og masse spec analyse av celle proteom, gjøre det mulig å etablere globale og kvantitative funksjonelle profiler av kreftceller og vev. Derfor er det en økende etterspørsel etter teoretisk-dataverktøy bistå med for dypere forståelse av dataene.
Ved hjelp av en teoretisk-beregnings tilnærming vi analysert flere genuttrykk datasett, inkludert nyrekreftpasienter, HPV16 indusert forvandlet keratinocytter og WI-38 forvandlet fibroblaster [7], [8]. Videre analysemetoden kan brukes ikke bare til messenger RNA, mRNA som vi gjør her, men også for å microRNAs [9] og utover til alle -omics datasett, inkludert proteomikk og metabolomics.
I denne artikkelen vi sentrumet oppmerksomhet på en analyse av mRNA-nivåer som benytter de samme kvantitative prinsipper som i ikke-likevektsflerkomponentsystemer i fysikk og kjemi. Anvendelse av biologiske systemer utvikler seg i tid i forhold til forstyrrelsene vi tar sikte på å definere mRNA-signaturene i den mest stabile, stabil tilstand av systemet og de grupper av mRNAer som avviker fra den stabile tilstand på grunn av forstyrrelse. For dette formålet bruker vi surprisal analyse som en teknikk som gjør oss i stand til å anvende termodynamiske prinsipper i biologi [4], [6], [8], [14].
Utgangen av surprisal analyse omfatter flere grupper av mRNA, de som bidrar mest til steady state og annen gruppe av mRNA som bidrar betydelig til avvik fra stabil tilstand i alle faser av transformasjon. Den siste gruppen omfatter svært heterogene ustabile transkripsjons fenotyper [6] underliggende prosessen med transformasjon. I tillegg til identifikasjon kreft bestemte gen /protein signaturer, lar surprisal analyse som sammenligner av sykdom mRNA fenotyper til de mest stabile og motstandsdyktige mot forstyrrelser stabile transkripsjons mønstre i alle faser av sykdommen, og legger et nytt lag til karakterisering av varierende deler i kreften transkriptomet.
Surprisal Analyse
Surprisal analyse er basert på prinsippet om maksimal entropi. Entropi er en fysisk størrelse som oppsto i faget Termodynamikkens, deretter dukket opp i Statistical Mechanics og senere i Information Theory. Kvalitativt talende entropi er et mål på lidelse eller mangel på informasjon. Entropi øker når sjansen for et system til å være i en gitt tilstand blant de mange mulige tilstander er mer ensartet. Dersom sannsynligheten for at systemet skal være i en viss tilstand er mye større enn sannsynligheten for å være i noen annen stat, har vi ikke mangler informasjon om systemet og entropi er minimal.
tilnærming basert på prinsippet av maksimal entropi, forteller at vår informasjon om en fordeling av systemtilstander oppnås ved å maksimalisere entropien under de kjente informasjons begrensninger. I fravær av informasjon, er den lidelsen maksimal og informasjonen er minimal.
Vi pålegge begrensninger ved bruk av en metode introdusert av Lagrange (for ytterligere informasjon se File S1). Det krever maksimere uttrykket for Lagrange som en funksjon av Lagrange-multiplikatorer: (1)
Hver multipliseres med en koeffisient en Lagrange-multiplikator hvis tallverdi forteller om den relative betydning av den respektive begrensning i den spesielle omstendigheter . Alle de veide begrensninger summeres og begrense Entropy å bli redusert fra sitt absolutt maksimale verdi.
I vår anvendelse av denne teknikken til cellulære kreft prosesser, er begrensninger på som såkalte transkripsjons /oversettings mønstre /kreft signaturer f.eks knyttet til spesifikke cellulære prosesser. Disse biologiske mønstrene hindre kreftceller for å nå maksimal entropi som forventes å foreligge i den balanserte tilstand av det biologiske system. Surprisal analyse identifiserer begge statene i alle faser av sykdommen: balanserte tilstand og begrenset stat, hvor spesifikke kreft mønstre er mest aktive [6] – [8]. På et gitt tidspunkt visse mønstre bidra mer enn andre. Dermed kan man antyde om den relative betydningen av spesifikke cellulære prosesser i ulike stadier av kreft utbruddet. I denne analysen hver transkripsjon kan delta i mer enn en transkripsjon mønster, underliggende prosessen med kreftutvikling.
Computational Surprisal Analyse
For å demonstrere konseptet og fått speed-up av
Computational Surprisal Analysis
, et integrert verktøy er utviklet og implementert, som har den generelle programvarearkitektur er vist i figur 1. dets programvaremoduler (fra nå av kalt softmodules) vil bli beskrevet i detalj i metodedelen av papiret (for ytterligere informasjon se også Fil S1).
Software Architecture av integrert verktøy.
for å få den integrerende smaken av
Computational Surprisal Analyse
verktøy vi nå nevne de fire softmodules «innganger og det endelige resultatet av analysen:
Surprisal analyse Z – inngang er en stor rektangulær matrise av data av genuttrykk nivåer hentet fra målinger i en chip array. En av dimensjonene datamatrisen er mye større enn den andre (for eksempel 4 tidsangivelse etter omtrent 22 000 gener). Et mål for surprisal analysen er å redusere datamatrise til håndterlige dimensjoner, nemlig. for å oppnå en kvadratisk matrise hvis dimensjon er mindre eller høyst lik den lille dimensjon av datamatrise;
Gene Profiling Z – inngang er en liten matrise med data hvis størrelse er bestemt av antall mønstre som er relevante for informasjon måles, sier en 4 av 4 matrise, relevant til 4 tidsstempler i cellulære prosesser,
DB Retrieval Anmeldelser – inngang består av sub-sett av gener innhentet av genet profilering. Hver under Settet inneholder de mer innflytelsesrike genene i de respektive mønster;
Heuristisk analyse Z – inngang er data innhentet i forrige softmodules. Beregningen er utført for å analysere og interaktivt vise til ytterligere analyse heuristisk.
En prøve utgang er sett i to varmekart, som beskriver protein-tilkobling, i figur 2.
Den øvre varme kartet er oppnådd ved hjelp av Surprisal analyse. Den nedre varmekart er basert på helt uavhengige data innhentet av DB innhenting. Aksene i begge heatmaps er identiske, nemlig. de inneholder de samme transkripsjons navn i samme rekkefølge. Som vanlig for heatmaps, farger står for relative intensiteter (numeriske skalaer sett over hver heatmap): rød er høy intensitet og blått er lav intensitet. Regionene med samme farge på begge heatmaps klart overlapper hverandre, det vil si deres resultater passe veldig godt, noe som tyder på at
Computational Surprisal Analyse Z – i øvre heatmap – kan gi prediktiv informasjon om transkripsjons og proteinnettverksstrukturer – i nedre varmekart. Hvite prikker i nedre heatmap betegne mangel på informasjon for de spesifikke transkripsjoner
Resultater
I denne delen presenterer vi resultatene av vårt arbeid sett fra tre ulike perspektiver. A- genomisk karakterisering av kreft prosesser: b- natur
Computational Surprisal Analyse
; c- visjonen om
Computational Surprisal Analyse
som en praktisk kreftdiagnose verktøy.
A- Genomisk Karakterisering av kreft Prosesser
For genomisk karakterisering av kreft behandler relevante eksperimentelle innspill er de transkripsjonsnivåer i de forskjellige mRNA. Begrensningene i surprisal analyse etiketten fenotypene og en egnet terminologi er gitt av et program og spesialisering av ligning (1) ovenfor, som følger: (2) hvor indeksene henviser til genet
i
og til fenotype . er den eksperimentelle ekspresjonsnivået av genet
i
, er den (tidsuavhengig) graden av deltakelse av en gitt transkript
i
i transkripsjonsmønsteret og, Lagrange multiplikatoren av ligning (1) er her vekten av den respektive transkripsjonsmønsteret. Denne terminologien vil bli nærmere avklart i Metoder delen med særlig henvisning til den spesielle rollen av begrepet.
Det endelige resultatet av
Computational Surprisal Analyse
er varmekart som viser omfanget av deltakelse transkripsjonene i transkripsjons mønstre indeksert av. Disse teoretiske heatmaps er sammenlignet med eksperimentelle varmekart som beskriver den funksjonelle tilkobling av de undersøkte transkripsjoner, ved hjelp av tilkoblings score fra STRING databasen (se metodedelen). På denne måten forholder vi verdier til de funksjonelle nettverk, ha de høyeste STRING tilkoblingsresultater, noe som ble bekreftet eksperimentelt.
Koeffisientene, hvor indeksen 0 refererer til den nulte fenotype, har negative verdier, noe som betyr at transkripter mest bidrar til
steady state
ha de laveste verdiene. verdier – for første fenotype – representerer grad av deltakelse i en bestemt avskrift i den viktigste transkripsjon mønster ligger til grunn for
prosessen med mobilnettet transformasjon
. Verdiene kan være både negativ og positiv, og pekte på sammenhengen eller omvendt korrelasjon av vitnemål innenfor transkripsjon mønster. Transkripsjonene er merket i henhold til Gene Ontologi kategorier
HF1 celler -.. HPV16 udødelig keratinocytter
Ved hjelp av HPV-16 indusert udødelig keratinocytter, analyserte vi genekspresjon mellom ulike stadier av HPV-16 indusert transformasjon av keratinocytter [11]. Genuttrykk nivåer ble målt til
fire diskret tid peker
, kalt henholdsvis:
K (normale celler ikke-transformerte av papilloma virus),
E (HPV16 transformerte celler fra en
tidlig
stadium av transformasjon), etter
L (forvandlet celler fra en
sent
fasen av transformasjon)
BP (cellene fra sent stadium som ble behandlet av
benzo [a] pyren
) [11].
ved hjelp surprisal analyse identifiserte vi de store transkripsjon mønsteret bidrar på alle tidspunkter (For mer informasjon se [8 ]). Dette transkripsjon mønster inkludert transkripsjoner ansvarlig for krymping i trasé kontrollerende apoptose og forbedring i cellesyklus nettverk i de sene stadier av transformasjon. Alle disse signaturene ble validert av biokjemiske hjelp [11].
Surprisal analyse identifiserer også sekundære transkripsjons mønstre som ikke er signifikant på alle stadier av HF1 transformasjon [8]. I dette arbeidet undersøker vi de mest stabile transkripsjoner bidrar til balansert, invariant state of the HF1 system og sammenligne dem til de store transkripsjon mønster involvert i prosessen med transformasjon. Vi bruker
Computational Surprisal Analyse
å bygge symmetriske matriser – for å generere heatmaps – f.eks som
ij
element er.
I figur 3 kan man se resultater for HF1 celler (HPV16 udødelig keratinocytter) av
Computational Surprisal Analyse
i fem forskjellige former. Disse er henholdsvis:
(A) En heatmap av de 100 mest stabile (sett i (a) i rød farge) og 100 mest bidrar til hoved transkripsjon mønster (høyest) og oppregulert transkripsjoner (sett i (a) i blå farge) oppnådd i surprisal analyse. I denne figuren: PS – proteinsyntese, SG – signalering og vekst. (B) En heatmap av samme karakterliste i (A) med STRING DB score. (C) Listen samme transkripsjoner ble brukt til å generere. (D) Tilkobling Kart over de 100 mest stabile utskrifter som bruker STRING DB; den røde fargen ellipsen omslutter de mest stabile og sammenhengende transkripter som er involvert i proteinsyntese. Tykkelsen på linjene viser den omtrentlige sannsynligheten for protein-protein funksjonell link for de relaterte transkripsjoner som tilbys av String score (se Metoder seksjoner for mer informasjon). For eksempel tykke linjer (som for proteiner markert med røde stjerner inne i ellipse, String poengsum = 0,999) representerer høy sannsynlighet for funksjonell tilkobling basert på biokjemiske verifikasjon, mens tynne linjer (som for proteinene markert med svarte stjerner, i venstre nederst utenfor ellipsen, String poengsum = 0,507) representerer mindre sannsynlighet for funksjonell sammenheng. (E) Tilkobling kart over de 100 transkripsjoner fleste som bidrar til hoved transkripsjon mønster (blå farge)
Øvre venstre – Heatmap representerer verdier;.
Øvre midten – Heatmap av det samme listen transkripsjoner i (a) ved hjelp STRING DB score;
Øvre høyre – Heatmap av listen samme transkripsjoner i (a) med verdier,
Nedre venstre – Tilkobling Kart over de mest stabile transkripsjoner i (a) ved hjelp STRING DB;.
Nedre høyre – Tilkobling Kart over høyeste
fra figur 3 kan man observere at de mest stabile transkripsjoner (med de laveste verdiene av tilhøre det meste til proteinsyntese kategorien. det er et godt samsvar mellom (Fig.3A) og (Fig.3B) heatmaps, noe som betyr at de mest stabile transkripsjoner, som definert av surprisal analyse, er mer funksjonelt koblet til som vist i STRING DB heatmap . den heatmap (fig. 3B) er den kvantitative representasjon av tilkoblings kart (fig. 3D og 3E).
(fig. 3C) heatmap av det samme genet liste med verdier er korrelert med (fig . 3A) og (figur 3B)., Hvilket betyr at transkripter med det største bidraget til den stabile tilstand invariant neppe deltar i prosessen for transformasjon. Disse transkriptene som bidrar mest til prosessen for transformasjon genererer mindre koblet kart (Fig.3B, 3E) sammenlignet med de mest stabile transkripter (fig. 3B og 3D) som har svært små relative endringer (de laveste verdier av).
Wi-38 celler – WI-38 forvandlet fibroblaster
i figur 4 kan man se resultater for WI-38 celler (WI-38 transform fibroblaster) av
Computational Surprisal Analyse
i. de samme fem former og konvensjoner som i figur 3. Dette celledelte systemet omfatter 12 stadier av kreft transformasjon hvor forskjellige genetiske endringer ble anvendt [12]. Dette cellesystem gikk omtrent 12 molekylære manipulasjoner slik som hTERT innsetting, celle doblinger, undertrykkelse av p53-funksjon og innsetting av onkogene H-Ras som angitt i [12], hvorved utvikling av den normale WI-38 udødeliggjort ikke-transformerte fibroblaster i fullt transformerte celler. I dette kreft celledelt system i balansert tilstand var stabil under alle 12 tidspunkter for transformasjon, mens betydningen av transkripsjonsmønstre som er involvert i prosessen for transformasjon varieres ved forskjellige tidspunkter [7].
(A) En heatmap av de mest stabile 100 (sett i (A) i rød farge) og 100 mest bidrar til hovedtranskripsjonsmønster (høyeste) og oppregulert transkripter (sett i (A) i blå farge) oppnådd i surprisal analyse. (PS – proteinsyntese, SMP – Signa, migrasjon, spredning). (B) En heatmap av samme karakterliste i (A) med STRING DB score. (C) Listen samme transkripsjoner ble brukt til å generere. (D) Tilkobling Kart over de 100 mest stabile utskrifter som bruker STRING DB; den røde fargen ellipsen omslutter de mest stabile og sammenhengende transkripter som er involvert i proteinsyntese. (E) Tilkobling kart over de 100 transkripsjoner mest bidrar til transkripsjon mønster (blå farge)
Fra figur 4 en gjør de samme observasjonene som ovenfor.. Det er en god trenings mellom (fig 4A .) og (fig 4B) varmekart; (C) verdier heatmap er ukorrelert med (fig. 4A) og (fig 4B.). Heatmap (Fig. 4B) er den kvantitative representasjon av tilkoblings kart (Fig. 4D og 4E fig.). Transkripsjoner med de høyeste verdiene og den største absolutte genererer mindre tilkoblede kart (Fig. 4E) med flere biologiske moduler (ikke å forveksles med softmodules). Hovednettverksmodulen i figur 4E inkluderer transkripsjoner deltar i NFkB (Nuclear faktor kappa B) signalering. Interessant denne modulen tilhører ekstra (mindre) transkripsjon mønster som har store vekter i de siste stadier av kreftutvikling [7]. Denne modulen ble validert og definert tidligere som «svulst dannende genetisk signatur» i WI-38 kreft modellsystem [12]
En oppsummerer Genomisk Karakterisering ledd av følgende punkter:.
Stabile nettverk
(transkripsjoner med de laveste verdiene) genererer sterke funksjonelle forbindelser etter STRING DB. Hvert protein det er et knutepunkt protein, med en rekke tilkoblinger og broer som kan kvantitativt visualiseres i surprisal og STRING DB varmekart. Sannsynligheten for at en dødelig mutasjon, for eksempel delesjon, ved at navet protein ville føre til en celledød er forventet å være høyere i sammenligning med mindre forbundne proteiner.
transformeringsnettverk og tilkoblings
– transkripsjoner med de høyeste verdiene, som bidrar mest til prosessen med transformasjon, genererer mindre koblet gruppe i alle datasett. Således delesjon av en av dem eller erstatning med et annet protein, kan ikke påvirke i betydelig grad nettverket. Det samme resultat ble oppnådd for transkripsjonene med de laveste verdier [6]. Som vist ovenfor, inneholder kartet vanligvis flere adskilte nettverk moduler (se for eksempel fig. 4E). Disse modulene kan bli ytterligere undersøkt som potensielle mål for medikamentell behandling.
B- The Nature of Computational Surprisal Analyse
Her er vi beskrive egenskapene til
Computational Surprisal analyse
. Den består i det vesentlige av de tre følgende aspekter: a- synergistiske integrering av ulike typer beregning; b- kvantitativ speed-up; c- roman slags slutninger utelukkende basert på surprisal analyse.
Synergistic Integrering av Diverse typer Computation.
Etter softmodules avbildet i figur 1, er det to moduser av drift av
Computational Surprisal Analyse
system.
1-
Sekvensiell Anmeldelser – til å flette sammen softmodules nøyaktig som vist i figur 1, ved hjelp av hver softmodule utgang som inngang til neste softmodule
2
syklisk.
– visse softmodules er valgt til å være syklisk gjentatt, med muligens varierende innganger til en kommer ut av loopen, med tilfredsstillende resultater
i begge veier en effektiv beregning er i det vesentlige begrenset bare av vekselvirkninger med den menneskelige brukeren. Disse interaksjonene kan være så enkelt som å velge /lese input /output. De kan være mer sofistikert, som for eksempel dedikere tid til heuristisk tenkning og gjøre slutninger av flere typer.
For å aktivere sykliske gjentagelser, må man være i stand til å vilkårlig starte med en softmodule, uavhengig av andre softmodules. Dette er faktisk mulig som softmodules er bygget slik at de kan direkte motta utgangssignalet fra en foregående softmodule i en kjede måte eller for å få en annen ekstern inngang. Det er ingen grunn til å kaste bort tid på eksplisitt datamanipulasjon, slik som å konvertere formater i mellom softmodules. Dette blir automatisk gjort, å være en iboende egenskap ved synergis integrering
Når det gjelder en
st softmodule -. Surprisal Analyse – vi har allerede sett at produksjonen omfatter flere grupper av f.eks mRNA: de som deltar i den stabile tilstand, og andre som bidrar betydelig til de avvik fra den stabile tilstand. Den softmodules synergisme er nødvendig for å forstå den biologiske betydning av disse gruppene, nemlig. vi bruker f.eks STRING DB tilgang [15] for å tegne funksjonelle nettverk for hver gruppe
2
nd softmodule -. Gene Profilering – er et effektivt integrere bro mellom 1
st og 3
rd softmodules . Det gjør det mulig utvalg av de viktige gener fra surprisal analyseresultater for å hente relevant informasjon fra offentlig tilgjengelige databaser.
Når det gjelder 3
rd softmodule, er tilgang til en database som STRING DB gjøres gjennom en passende grensesnitt – transparent for den menneskelige brukeren – tillater enkel seleksjon og innhenting av de ønskede data i softmodule, for forover beregninger. Systemet er modulbasert gjør enkle fremtidige grensesnitt til flere databaser av interesse.
Til slutt, 4
th softmodule gjør om kvantitativt utgangen av surprisal analysen til den funksjonelle tilkobling mellom mRNA. To typer varmekart er gitt:
1- teoretisk heatmap tilkoblings hjelp grader av andeler av f.eks mRNA ved steady state /avvik fra steady state beregnet ved Surprisal analyse (fra 1
st softmodule) og valgt ved hjelp av Gene Profilering (2
nd softmodule);
2 -.. funksjonell heatmap beregnet fra STRING DB kombinert score
Disse integrerte prosedyrene tillater svært
effektiv og kvantitativ
forståelse av den funksjonelle tilkobling mellom mRNA som bidrar til de ulike stadier av transformasjon
Kvantitativ Speed-Up Evaluering.
Som sett ovenfor,
Computational Surprisal Analyse
innebærer ulike typer beregningsprosedyrer. Disse har varighet ganger med svært forskjellig rekkefølge av størrelser, som kan klassifiseres som følger:
Automatisk rent beregningsmåten
– for eksempel Surprisal analyse utført av en
st softmodule. Varigheten av en slik beregning kan være og har faktisk blitt målt meget nøyaktig. Denne perioden kan sikkert forkortes ved effektiv sekvensiell beregning i vanlig forstand eller si ved parallellisering. På den annen side, er dette så mye raskere enn de neste prosedyrer, at det for alle evalueringsformål en grov tid øvre grense av størrelsesorden noen få sekunder, er tilstrekkelig tilfredsstillende
Humant interaktiv prosedyre -.
for eksempel Gene Profilering av 2
nd softmodule eller litt lengre heatmaps sammenligning. Dette er den hastighetsbestemmende trinn i
Computational Surprisal Analyse
. Deres varighet kan være i prinsippet forkortet ved hjelp av menneske-maskin interaksjon analyseteknikker. På den annen side, er det rimelig trygt å anta at den nedre grense er begrenset av humane evner, grovt anslått til å ta en tid av størrelsesorden minutter.
For å evaluere den kvantitative hastighets- opp innhentet av modulene i
Computational Surprisal Analyse
, bør de ovennevnte varighetstidene bli sammenlignet med ikke-synergistisk ytelse:
Manuell datakonvertering og manipulasjon
– for eksempel, manuelt flytte data fra databaser, mens konvertere dem til et passende format til et heatmap skildring prosedyre. Det kan ta et grovt anslått varighet på minst i størrelsesorden titalls minutter, selv for dyktige programmerere.
Fra ovennevnte estimater, man vurderer den generelle kvantitative speed-up innhentet av
Computational Surprisal Analyse
, for å være i størrelsesorden ti. Dette er forholdet mellom den lengste mulige varighet, nemlig.
manuell datamanipulasjon
til kortere hastighetsbestemmende trinnet, nemlig.
menneskelige interaktiv prosedyre
formidlet av synergis automatisk datakonvertering og manipulasjon.
Dette raskere behandlingstid gjør at forskere og praktikere å bruke fått tid for lønnsom analyse. I denne forstand, hastigheter opp det potensialet heuristisk tenkning. Heuristisk tenkning har en assosiativ karakter, som ble hintet til ved å sette side-by-side (for eksempel i figur 3 og 4 i denne papir) variert resultat viser som Surprisal Analyse generert varmekart og tilkoblings kart.
En viktig Inference. Stabilitet av steady state
i tillegg til integrering av ulike typer beregninger med surprisal analyse, muliggjør analyse nye typer slutninger. Her diskuterer vi den slutning av stabiliteten i de grunnleggende, housekeeping cellular prosesser, for eksempel proteinsyntesen.
Den kvantitative argumentet bruker eq. (2) som innebærer at de eksperimentelle uttrykk nivåer av vitnemål med betydelig (negativ Som vist i fig.