PLoS ONE: Prediction og Testing of Biological Networks underliggende Tarm Cancer

Abstract

Tykktarmskreft utvikler seg gjennom en opphopning av somatiske mutasjoner, noen som bor i såkalte «driver» gener som gir en vekst fordel å svulsten. Å identifisere krysningspunkt mellom fører genet stier, gjennomførte vi en nettverksanalyse rammeverk ved hjelp av protein interaksjoner å forutse sannsynlige tilkoblinger – både precedented og romanen – mellom sentrale driver gener i kreft. Vi benyttet rammeverket for å finne signifikante sammenhenger mellom to gener,

Apc Hotell og

Cdkn1a product: (

p21

), kjent for å være synergistisk i tumorigenesis i musemodeller. Vi så vurdert den funksjonelle sammenhengen i den resulterende

Apc-Cdkn1a

nettverk av ingeniør

in vivo

enkelt node forstyrrelser i nettverket: musemodeller muterte individuelt på

Apc plakater (

Apc

1638N +/-

) eller

Cdkn1a product: (

Cdkn1a

– /-

), etterfulgt av målinger av protein og genuttrykk endringer i tarm epitelvev . Vi antok at hvis den predikerte nettverket er biologisk enhetlig (funksjonelle), deretter de anslåtte nodene skal knytte mer spesifikt med feilregulert gener og proteiner enn stokastisk utvalgte gener og proteiner. Den spådde

Apc-Cdkn1a

nettverk ble betydelig forstyrret på mRNA-nivå av både enkelt gen knockouts, og spådommer ble også sterkt støttes basert på fysisk nærhet og mRNA koekspresjon av proteomikk mål. Disse resultatene støtter den funksjonelle sammenhengen i den foreslåtte

Apc-Cdkn1a

nettverk og også demonstrere hvordan nettverksbaserte prediksjoner kan statistisk testet ved hjelp av high-throughput biologiske data

Citation. Patel VN, Bebek G, Mariadason JM, Wang D, Augenlicht LH, Chance MR (2010) Prediction og Testing of Biological Networks underliggende tarmkreft. PLoS ONE 5 (9): e12497. doi: 10,1371 /journal.pone.0012497

Redaktør: Chad Creighton, Baylor College of Medicine, USA

mottatt: May 16, 2010; Godkjent: 26 juli 2010; Publisert: 01.09.2010

Copyright: © 2010 Patel et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet har vært støttet av National Institutes of Health Grants UL1-RR024989 fra National Center for Forskning Resources (Kliniske og translasjonell Science Awards) og P30-CA043703 fra case Western Reserve University Comprehensive Cancer Center. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

de fleste nonhereditary kolorektal tumorer oppstå ved sekvensiell opphopning av mutasjoner i viktige driver gener, hvor en mutasjon i et tumor suppressor (f.eks

Apc

) eller onkogen (f.eks

Kras

) initierer prosessen, og en kaskade av somatiske mutasjoner oppstår [1]. Selv om disse mutasjonene ble klassisk antatt å bestå av noen få gener (f.eks

Apc

,

Kras

,

Trp53

), siste store sekvense innsats avslørte at enhver tumor omfatter (i gjennomsnitt) 80 mutasjoner, med så mange som 15 liggende i hyppig mutert «driver» gener [2]. Til støtte for hypotesen om at disse viktige gener fungere samarbeide i å drive tumorigenesis, musemodeller mutert på to driver gener samtidig har vist en synergistisk økning i tumorbyrde, inkludert:

PTEN-Apc product: [3],

Kras-Tgfb product: [4], og

Apc-Trp53 product: [5]. Bevis på synergistiske, det vil si ikke-additiv, økninger i tumorbyrde tyder på at signalveier til to muterte gener kan krysser hverandre nedstrøms, og således forutsi og utspørre disse punktene skjærings –

som et biologisk nettverk

– er av betydelig interesse. For å spore sammenhengene mellom gener, en rekke high-throughput datasett – f.eks protein-protein interaksjoner (PPI), genet koekspresjon og transkripsjon faktor relasjoner – har blitt ansatt for å antyde funksjonelle foreninger som egner seg til analyse som nettverk, der hvert gen eller protein er representert som en node og en interaksjon som en kant. Videre kan nettverksbaserte analyser anvendes for å identifisere biomarkører [6], for å forutsi tumorprogresjon [7], eller for å avsløre de molekylære forandringer underliggende sykdom [8].

Imidlertid vår nåværende kunnskap om biologiske nett er langt fra komplett. Dekningen av omløps interactome databaser er anslått til å være mindre enn 10% av det totale antall interaksjoner [9]. Så når interpole sammenhengene mellom driver gener, nettverksbaserte analyser som bare baserer seg på bekreftede interaksjoner kan mangle viktige forbindelser. Som ett mål av vår forskning er å forutse og analysere funksjonelle baner mellom driver gener, var et avgjørende skritt for å utvikle en prediktiv rammeverk for å antyde og evaluere nye forbindelser mellom gener. Rammeverket foreslått her (modellert på Pathfinder [10]) konkluderer mangler kantene med spådommer fra protein familieforhold og filtrerer disse banene basert på kjente forening regler. På den annen side, ettersom en kreft gen deltar i flere signalbaner, kan det være flere titalls – hvis ikke, hundrevis – av veier hvorved to proteiner funksjonelt samvirke. Dermed er en beregnings tilnærming er nødvendig for å begrense nettverket plass til den spesifikke biologiske konteksten av interesse. Hvis du vil trekke funksjonelt relevante subnett, oppdager de rammer svært sannsynlige signalveier basert på gen-gen mRNA koekspresjon og Gene Ontologi [11] foreningen regler utvunnet fra publiserte trasé.

Vi brukte beregningsmetoden for å belyse sammenhengene mellom en velkjent driver genet for tarmkreft,

Apc product: (

adenomatøs polypose coli

), til et annet gen også involvert i kreft,

Cdkn1a plakater (tidligere kjent som

p21

). Selv

Cdkn1a

ble ikke funnet å være mutert i populasjoner av menneskelige kolorektal kreft studert til dags dato [2], korrelerer sitt uttrykk nivå med neoplastisk progresjon og har en prognostisk verdi som er større enn den for

Trp53

[12]. Videre støtter sin betydning i neoplasi, den doble mutant mus,

Apc

1638N +/- Cdkn1a

– /-

, viser en synergistisk økning i tumorbelastning [13]. Etter å forutsi nettverk til

Apc Hotell og

Cdkn1a

, vurderte vi relevansen av disse spådommer ved å manipulere det underliggende systemet: generere

in vivo

nettverks forstyrrelser i to musemodeller, etterfulgt av systemer-nivå «Omic målinger fra den lille tarmepitelet. De «omic målinger – både proteomic og genomiske – til perturbert system ble anvendt for statistisk testing av den forutsagte nettverket, og dermed innføre begrepet med å evaluere

i silikoaluminofosfater

anslag mot kontekstspesifikke biologiske data

.

Materialer og metoder

nettverks~~POS=TRUNC analyse~~POS=HEADCOMP Work

nettverksanalyse rammeverk (figur 1, og forklarte i Methods S1) benytter Pathfinder arkitektur skissert tidligere [10]. Den rå nettverk av offentlig tilgjengelige fysiske interaksjoner er først beskjæres falske positiver ved hjelp av en logistisk modell som inkorporerer (i) antall ganger en PPI er observert, (ii) Pearsons korrelasjon av uttrykk målinger for de tilsvarende gener, (iii) proteinene «liten verden clustering koeffisient, og (iv) proteinet subcellulære lokalisering data av samvirkende partnere. Positive (1000 PPIs fra MIPS [14] database for interaksjoner) og negativ trening datasett (1000 tilfeldig utvalgte PPI som ikke er i MIPS) brukes i 1000 kryss-validering forsøk for å skaffe seg de parametrene som maksimerer sannsynligheten for en sann interaksjon .

prosessen begynner med en to-trinns filtreringsprosess for å gjøre rede for falske positive og falske negative i interaksjonsdatabaser. Når du har valgt driver gener av interesse, er trasé spådd og deretter beskjæres ved hjelp av både GO sikt forening regler og gen-gen koekspresjon verdier. Til slutt blir de signifikante banesegmenter slås sammen for å komme frem til et nettverk som forbinder de to driver gener. Rammeverket inneholder vev-spesifikk mRNA koekspresjon på to nivåer: i den parvise filtrering av falske positiver; og i filtrering av stier ved gjennomsnittlig koekspresjon. Den logistisk regresjonsmodell er trent på gull-standard interactome databaser (se Metoder S1 for ytterligere detaljer).

Falske negative interaksjoner utledes ved hjelp av sekvenshomologi relasjoner. Det ble observert at proteiner med lignende sekvenser dele lignende interaksjonspartnere i samme organisme [15], og således proteiner fra den samme familie er også sannsynlig å ha lignende interaksjonsmønstre. Den Pfam database, utnytte flersekvenssammenstillinger og skjulte Markovmodeller (HMM), bruker sekvenslikhet til å formulere protein familie klassifiseringer [16] og fungerer som et nyttig verktøy for å utnytte disse sammenhengene. Derfor utledes vi et samspill kant hvis (i) to proteiner ikke samhandler med hverandre i PPI nettverk, og (ii) det finnes minst en interaksjon mellom familiene til disse to proteinene.

For å identifisere disse banene er relevante for vår modell system av interesse, koekspresjon data basert på microarray eksperimenter fra

Apc

Min /+

mus liten tarmepitelet ble hentet fra Gene Expression Omnibus (serie GSE422 [17]); denne studien brukte laser-fangst mikrodisseksjon å prøve krypter av adenomer, karsinomer, og normal epitel. I gjennomføringen vår, brukte vi Pfam utgivelsen 23,0 [16] og Gene ontologi utgivelsen i august 2008 [11]. Søkealgoritmen ble utvidet til å finne veier opp til 6 noder i lengde, og terskelen for den gjennomsnittlige koekspresjon av trasé var.

Mus tarmepitelet Isolation

Alle dyrene ble håndtert i henhold til god dyr praksis som definert av de relevante nasjonale og /eller lokale dyrevern organer, og alle dyr arbeidet ble godkjent av Institutional Animal Care og bruk Committee (IACUC) av Albert Einstein College of Medicine (tillatelse nummer 20070805).

Apc

1638N +/- Hotell og

Cdkn1a

– /-

C57BL6 /J mus ble generert som beskrevet tidligere [13] og vevsprøver ble høstet ved hjelp av metoden skissert av Weiser et al, noe som resulterer i krypten og Haug populasjoner av celler fra tynntarmen av

APC

1638N +/-

,

Cdkn1a

-. /-

, og villtype mus [18].

2D Differensial Etter gelelektroforese

2D Differensial Etter gelelektroforese (2D-DIGE) ble utført som tidligere beskrevet [19]. Ulikt uttrykte proteiner fra krypten og Haug fraksjoner ble identifisert i mutant mus (

Apc

1638N +/- Hotell og

Cdkn1a

– /-

) i forhold til de respektive fraksjoner fra vill -type mus (4 gjentak). Univariate t-tester (ulike avvik og like utvalgsstørrelser) og multivariat lineær regresjon (kodet i R pakken LIMMA [20]) ble utført. Gel flekker ble valgt for LC-MS /MS identifikasjon basert på disse to t-statistikk på 0,05 nivå av betydning.

Gel flekker ble kuttet, trypsin fordøyd, og peptidene ble deretter analysert ved tandem LC-MS /MS på et LC emballasje /Dionex Ultimate 3000 HPLC-Orbitrap XL (Finnigan, San Jose, California) system [19]. For tolkning av MS /MS spektra ble maskoten programvarepakke som brukes til å søke i SwissProt database; en null database av revers peptidsekvenser ble søkt samtidig for å redegjøre for falske positiver. Identifiserte proteiner er oppført i tabell S1. Mascot DAT filer har blitt gjort offentlig tilgjengelig gjennom Proteomikk Identifikasjoner Database [21], sjonsnummer 10638.

Gene Expression Profilering

Microarray studier for krypten og Haug populasjoner fra

Apc

1638N + /

Cdkn1a

– /-

, og villtype mus (4 gjentak) ble utført på Affymetrix Mouse Genome 2,0 chips ifølge publiserte prosedyrer [22] . Alle data er MIAME kompatibel og rådata er gjort offentlig tilgjengelig gjennom kompatibel database MIAME, Gene Expression Omnibus [23], tiltredelse antall GSE19338.

Nettverk mRNA Analyse

Raw .CEL filene ble behandlet i MATLAB bruker Robust Multiarray gjennomsnittsprosedyre [24]. Å håndtere flere sonder fange ulike aspekter av et genprodukt atferd, brukte vi alle sonder for å representere et gen. Derfor, i den følgende analysen, hver

Apc-Cdkn1a

nettverksnode,

i

, var representert ved

k

i

sonder på tabellen, noe som resulterer i en matrise av størrelse

q

×

n

, hvor og. For å avgjøre om

Apc-Cdkn1a

nettverksnoder ble kollektivt forskjellig uttrykt i en vev rommet (krypter eller villi), utvidet vi Ling er

T

2

statistikk – en klassisk tilnærming nyttig for testing genet grupper [25] – for å innlemme flere eksperimenter, som følger: hvor er vektoren av midlere mRNA intensitet for alle

q

sonder for en genetisk bakgrunn,

G

, hvor (

Apc

indikerer

Apc

1638N +/-

;

Cdkn1a

indikerer

Cdkn1a

– /-

, og

WT

angir vill-type C57BL6 /J).

S

er den absolutte verdien av objektiv felles utvalgs kovariansmatrise for hver mutant: der

Mutant

kan referere til enten

Apc

1638N +/-

eller

Cdkn1a

– /-

, og den absolutte verdien i

S

brukes for å unngå imaginære komponenter når du tar den inverse roten av

S

i. Det bør bemerkes at sonder som tilsvarer

Apc Hotell og

Cdkn1a

seg ekskludert, da disse forventes å ha ekstremt lave intensitetsverdier (i de respektive mutanter) som ville forskyve den opplevde samlet nettverk effekt. I, er forskjellen av midler, for hver mutant kan være positiv eller negativ for en sonde

i

, slik at, i motsetning til

T

2

,

V

2

kan være enten positiv eller negativ.

Gitt at prøven kovarians estimatene er ikke positivt bestemt, og dermed er entall den inverse. For å omgå dette problemet, setter vi alle kovarianser til null for første beregning av

V

2 Hotell og deretter beregne betydningen av

V

2

bruke en permutasjon test (dvs. stokastisk generere nye «

mutant

» og «

villtype

» fenotype etiketter), og dermed bevare den underliggende samvariasjon strukturen i null distribusjon. Stille på diagonalen elementer av

S

null forenkler

V

2

til: Dermed

V

2

er bare summen av produktet av skalert t-statistikk som er beregnet for hver sonde, i hver av de to eksperimentelle perturbasjoner. Etter hvert som antall prøver var liten (for mutant og vill-type, hver), ble tilfeldig støy tilsatt til hver permutert matrise for å oppnå en interpolert og glattet empirisk null fordeling; standardavvik,, av støy for hver sonde,

q

, i den genetiske bakgrunnen,

G

, ble beregnet ved prøven standardavvik på hver probe. 10000 slike permutasjoner ble beregnet å få null distribusjoner, som-som forventet – ligne F-distribusjoner (se figur S1). Siden

Apc Hotell og

Cdkn1a

er både kreft undertrykkere og antatt å påvirke vårt nettverk av interesse på en lignende måte, forventer vi at t-statistikken til å variere i samme retning hvis nullhypotesen ( lende felles effekt) er å bli avvist. Derfor beregner vi

p

-verdi av

V

2

som antall null observasjoner større enn vår observerte verdien av

V

2

. Beregning av

p

-verdi for den negative hale av fordelingen ville være nyttig hvis forstyrrelsene var forventet å ha motsatt molekylære effekter (f.eks

Apc

+/-

paret med en

Stat3

+/-

hypomorph).

Selv om vi presenterer en analyse for en 2-node forstyrrelse av et nettverk, er denne analysen utvidbar til

k

eksperimentelle forstyrrelser ved å beregne parvise

V

2 statistisk, noe som resulterer i en matrise: Hvor representerer statistikken mellom forstyrrelser

j Hotell og

k

; som vist, diagonalen reduseres til en skalert versjon av Ling er

T

2

statistikk for hvert forsøk. Som statistikken er hver av en annen skala, de kan ikke sammenlignes direkte, og derfor bør betydningen av hvert matriseelement bli beregnet (som ovenfor) via en permutasjon test. Deretter, for matrise av

p

-verdier, diagonalelementene gi informasjon om betydningen av individuelle eksperimenter, mens på diagonalen verdier gi informasjon om parvis eksperimentell betydning. Den totale eksperimentell støtte for nettverks forstyrrelsene kan da beregnes ved å legge sammen på diagonalen

p

-verdier, f.eks ved Fisher metode [26]. Vi anbefaler denne tilnærmingen for å håndtere forstyrrelser; for forstyrrelser, som i vårt tilfelle,

p

-verdier kan tolkes direkte.

Analyse av proteomikk Targets

For å vurdere betydningen av fysisk nærhet, den topologiske avstand mellom

Apc Anmeldelser –

Cdkn1a

nettverksnoder og de respektive proteomikk målene ble beregnet. Fysiske PPI nettverk ble satt sammen fra BioGRID [27], Human Protein Referanse Database (HPRD) [28], og intakt [29]. Hvert nettverk node ble testet uavhengig for antall to-hop stier å koble den til et sett med

n

eksperimentelt målte proteiner, uttrykt som følger: Hvor er inngangen på rad

i

og kolonne

j

i nabomatrisen,

En

, av PPI nettverk;

i

er et protein i

Apc-Cdkn1a

nettverk;

j

er en mellom protein; og

k

er et eksperimentelt målt protein. I dette tilfellet, de eksperimentelle proteiner var de proteomikk mål fra enten

Apc

1638N +/-

eller

Cdkn1a

– /-

mus. Hvis det er i det minste en mellomliggende protein,

j

, hvor det eksisterer en to-hop banen mellom nodene

i

og

k

, deretter 2-hop avstand, er 1; den totale tilkoblingsmuligheter,, protein

jeg anbefale til settet av 2D-Dige mål er rett og slett summen av. Betydning ble beregnet mot en empirisk null formulert fra 10000 tilfeldig genererte sett av proteiner også av størrelse

n

.

For å vurdere mønstre av coregulation, ble mRNA koekspresjon verdier (Spearmans korrelasjonskoeffisient) beregnet fra tilsvarende sett normaliserte microarray eksperimenter, som strekker seg vill-type,

Apc

1638N +/-

, og

Cdkn1a

– /-

krypter og villi; sonden med maksimal intensitet ble anvendt som representative for et gen. For å teste betydningen av mRNA-nivå sammenhenger, en modifisert Kuiper test statistikk,

K

, ble beregnet mellom gruppe korrelasjoner (dvs. alle sonder på array) og eksempel sammenhenger (dvs. sett 2D-Dige mål) for hver node i nettverket uavhengig; den beregnes som summen av den maksimale og minimale avvik i prøven, og kontroll (dvs. hele array),

F

, kumulativ fordelingsfunksjon [30]: Per forslagene til Subramanian et al. [31], Kuiper er statistikken,

K

ble endret for å forbedre sin evne til å oppdage bimodal endringer i plassering av prøven distribusjon (som man ville forvente koekspresjon grupper av proteiner for å vise både positive og negative korrelasjoner): der

S

er det sett av proteiner som testes (enten

Apc

1638N +/-

eller

Cdkn1a

– /-

2D-Dige mål) ;

r

er bestilt vektor av korrelasjonskoeffisientene mellom de ulike 2D-Dige mål og en enkelt nettverksnode; og normaliserer å ha sum 1. Betydningen testing ble utført ved hjelp av en normal tilnærming til den empiriske null: den empiriske null ble satt sammen fra den modifiserte

K

beregnet for 500 tilfeldig utvalgte protein sett, hver av størrelse og maksimal sannsynlighet estimering ble brukt til å passe en normalfordeling. For å utforske og illustrerer tilkoblingene av vesentlig (

α

= 0,05) nettverksnoder, vi undersøke den delen av korrelasjoner,

r

y

, der slik det og; og undergruppe av korrelasjoner,

r

p

, der slik det og (analogt til «ledende» undergruppe av GSEA [31]). Å identifisere forskjellig uttrykt noder, valgte vi disse nodene hvor t-statistikken (ulik varians) av maksimal intensitet sonden var slik at enten i krypten eller villus rommet, hvor er den normale inverse kumulative fordelingsfunksjon.

Testing hver node i

Apc-Cdkn1a

nettverk uavhengig resulterte i en

p

-verdi for hver av nullhypotese, hvor, og hver hypotese, antar at det er ingen sammenheng ( fysisk-basert eller koekspresjon basert) mellom

Apc-Cdkn1a

nettverksnode,

i

, og 2D-Dige mål. For å teste den gruppen nullhypotesen at alle er samtidig sant,

p

-verdier ble samlet i en statistikk,

τ

, foreslått av Fisher; signifikans ble vurdert opp mot en fordeling med 2

n

frihetsgrader [26] (se også Metoder S1). Det muterte node (

Apc

i

Apc

1638N +/-

eller

Cdkn1a

i

Cdkn1a

– /-

) ble ekskludert fra de respektive analysene, som deres ekstreme uttrykk mønstre skew gruppevise resultater.

resultater

Driver Gene Nettverks Spådommer

Den doble mutant

Apc

1638N +/- Cdkn1a

– /-

mus ble tidligere vist å oppvise en synergistisk økning i tumormengde sammenlignet med de enkle mutanter [13]. For å identifisere mulige sammenhenger mellom

Apc Hotell og

Cdkn1a

, bygget vi en prediktiv rammeverk for det første lærer merknads mønstre karakteristisk for kjente signalveier (f.eks de som finnes i KEGG [32] og andre), og deretter, par disse mønstrene med vev spesifikke koekspresjon data for å trekke ut de mest sannsynlige kjeder av samspill proteiner som er involvert i

Apc-Cdkn1a

signalisering (illustrert i figur 1). For å identifisere bare høy tillit veier, ble en to-fase filtreringsprosess først påført på det globale PPI-nettverket. I den første fasen, kanter – samlet fra pattedyr interaksjoner i BioGRID [27] og HPRD [28] – ble luket ut nettverket hvis de ikke ligner sannsynlige interaksjoner (som definert av en logistisk regresjonsmodell), med mål om å redusere falsk positive blant de rapporterte interaksjoner. For å ta høyde for falske negative (fase 2), ble interaksjoner lagt til nettverket ved inferring relasjoner som er precedented i modellorganismer basert på protein familieforhold. Etter bruk disse tiltakene for å generere en syntetisk nettverk, vi søkte etter sannsynlige sammenhenger mellom

Apc Hotell og

Cdkn1a

bruker begge gen koekspresjon data og Gene Ontologi foreningen regler.

For å understreke noder og kanter som er relevante for vår biologiske systemet, innførte vi en vev-spesifikk skjevhet i vår søken etter

Apc Anmeldelser –

Cdkn1a

tilkoblinger ved hjelp av genuttrykk data fra tarmepitelet av

Apc

Min /+

mus. Fra disse dataene, beregnet vi mRNA-nivå koekspresjon verdi for enkelt kanter via gen-gen Pearson korrelasjonskoeffisient. Neste, alle baner i syntetisk nettverk knytter genprodukter av

Apc Hotell og

Cdkn1a

ble spurt og de predikerte banene ble filtreres basert på (i) støtte fra foreningen regler for GO kommentarer og (ii) den gjennomsnittlige koekspresjon langs en bane; resultatet (på et signifikansnivå på

α

= 0,01) er vist i figur 2.

Apc Anmeldelser –

Cdkn1a

nettverk inneholder en rekke tidligere kjente interaksjoner (fast linjer), samt spådd interaksjoner (stiplede linjer) basert på: (i) protein familieforhold, (ii) styrke GO forening regler, og (iii) microarray koekspresjon langs bestemt bane kobler

Apc

til

Cdkn1a

. Som genetiske interaksjoner ble inkludert i den opprinnelige interaksjonsdatabaser, omfatter spådd nettverk både fysiske og funksjonelle forhold

Solide kantene representerer tidligere kjente interaksjoner.; stiplede kantene representerer antatte interaksjoner; og kanter merket med en «v» representerer antatte interaksjoner som er validert nylig i den publiserte litteraturen.

På et system-nivå, den foreslåtte

Apc-Cdkn1a

nettverk bærer statistisk usannsynlig egenskap av å være mettet med onkogener: 8 av 20 proteiner er kommentert som onkogener i OMIM (

p

-verdi 5 × 10

-10 ved Fishers eksakte test, se Methods S1), og mange av de resterende gener er blitt eksperimentelt vist seg å fungere som onkogener (f.eks

ErbB3 product: [33], [34],

Shc1 product: [35],

Map2k1 product: [36 ]). Selv om

Apc Anmeldelser –

Cdkn1a

nettverk inneholder mange godt studert proteiner, knutepunktet grad (dvs. antall interaksjoner) innenfor subnettet ikke strengt korrelerer med noden grad i den ufiltrerte samspillet database (Pearsons korrelasjon = 0,51). For eksempel, mens akt1 har mange kjente interaksjoner, sine ofte studert biologiske partnere – nemlig GSK3B og PTEN (som begge er forbundet med

Apc product: [3] og

Cdkn1a product: [37] signale ) – vises ikke i nettverket. Andre kjente interaksjoner, for eksempel at det mellom SHC1 og SRC [38], er også fraværende fra nettverket. Siden vår algoritme spår tilkoblinger forutinntatt av biologien til systemet under studien (gjennom bruk av genuttrykk data fra

Apc

Min /+

mus tarmvevet), et bestemt protein eller kant vises kanskje ikke i nettverket hvis veien (dvs. kjede av proteiner) som den ligger ikke oppfyller genet koekspresjon og /eller GO forening regel terskler

Derimot er

Apc Anmeldelser -.

Cdkn1a

nettverket omfatter nye assosiasjoner: de ikke inneholdt innenfor kildekode-databaser (stiplet kanter i figur 2). Flere av disse interaksjonene har nylig blitt godkjent i fokuserte studier (se tabell 1), som gir tillit til at rammene er nyttig. I tillegg har

Apc Anmeldelser –

Cdkn1a

nettverk tyder også på at visse interaksjoner tidligere i forbindelse med andre kreft modeller – som SRC-CCND1 funksjonell foreningen funnet i prostatakreft [39], eller fosforylering av CDK4 av SRC i en cellelinje [40] – er relevante i denne modellen av tykktarmskreft

én node forstyrrelser:. mRNA Profilering

Som

Apc- Cdkn1a

nettverk representerer skjæringspunktet mellom signalveier som kommer fra

Apc Hotell og fra

Cdkn1a

, forventer vi å observere funksjonelle endringer i nettverkstilknyttet proteiner som respons på forstyrrelser på enten

apc

eller

Cdkn1a

. Single-node forstyrrelsene ble utviklet i musemodeller med mutasjoner i enten

Apc plakater (nemlig

Apc

1638N +/-

) eller

Cdkn1a product: (

Cdkn1a

– /-

). Mens

Apc Anmeldelser –

Cdkn1a

nettverket ble generert ved hjelp av tumor-spesifikke

Apc

Min /+

data – en modell huse en rekke bakgrunns genetiske skader [41 ] – tarmvevet hentet fra

Apc

1638N +/- Hotell og

Cdkn1a

– /-

mus ved 3 måneders alder er relativt polypp gratis, og dermed gir oss til måle effekten av en enkelt genetisk forstyrrelse på den pre-neoplastisk epitel. Selv om dette fjerner potensialet skjevhet som er innført av påfølgende mutasjoner av neoplastisk vev, kan denne tilnærmingen også dempe informasjonsflyten mellom de to genene.

Siden vi bruker de to forstyrrelsene for å avgjøre hvor godt

apc-Cdkn1a

nettverk kan fange biologiske fenomener, innførte vi en multivariat statistikk,

V

2

å teste om forskjellene i gjennomsnittlig mRNA overflod eksisterer i fellesskap mellom

apc

1638N + /- Hotell og

Cdkn1a

– /-

modeller. Ved å bruke

V

2

, som vist på figur 3, gener med mild differensial uttrykk i de to individuelle mutanter kan bidra til den totale støtte av nettet, som

V

2

belønner de genene der hver av de to uavhengige t-statistikk er både større enn 1. Statistisk signifikant

V

2

ble testet mot en permutasjon null, og som våre forstyrrelser involvert to tumor dempere forventes å ha molekylære virkninger i samme retning, vi brukte positiv halen av fordelingen. Å vite at mange molekyler «bryteren» uttrykk (dvs. høy til lav, eller vice versa) i overgangen fra krypter til Villi [19], microarray datasett for disse to biologiske avdelinger ble testet separat. Vi fant at

Apc-Cdkn1a

nettverket ble sterkt støttet (

p

verdi = 0,002) av joint mRNA differensial uttrykk i de to mutanter enes krypt rommet. Network sammenheng var svakere (

p

verdi = 0,060) i villus rommet, og nettverket som helhet ikke var forskjellig uttrykt i villi av enten mutant, bemerket i to

V

2

matriser «

p

-verdier: Hvor, som nevnt, de diagonale elementene indikerer betydningen av dette uttrykket

innen

en mutant (som per Ling er

T

2

), og på diagonalen elementer indikerer betydningen av felles differensial uttrykk

over

mutanter (som per

V

2

). I krypter, ble nettverket forskjellig uttrykt i

Cdkn1a

– /- plakater (

p

verdi = 0,009), men ikke i

Apc

1638N +/- product: (

p

verdi = 0,871), og ennå, ble i fellesskap støttet av differensial uttrykk på tvers av både musemodeller (

p

verdi = 0,002). Dette illustrerer at små mRNA-nivå endringer som deles mellom flere forstyrrelser – på et gen-by-genet basis – gir felles støtte for nettverket hypotesen, mens noen enkelte forstyrrelse kan mislykkes i å demonstrere kravet

Hver. nettverk genet er representert med to overlappende bobler farget i henhold til t-statistikk (ulik variansen) i de to mutanter: nedre venstre boble av et gen tilsvarer t-statistikken for

Apc

1638N +/-

, og øverst til venstre boble til t-statistikken for

Cdkn1a

– /-

. Skjæringspunktet mellom de to bobler tilsvarer summen av t-statistikk, som illustrerer hvordan betydningen av små effekter kan bli styrket når betraktet i fellesskap. Noder nedregulert i mutant er farget rosa, de oppregulert i mutant er gule, og nøytrale t-statistikk er grå.

Legg att eit svar