Abstract
Bakgrunn
Identifisering av gener som er årsaks innblandet i onkogenese er et hovedmål i kreftforskning. Anslagsvis 10 til 20% av kreftrelaterte genmutasjoner resultere i å hoppe over ett eller flere eksoner i de kodede transkripter. Her kan vi rapportere om en strategi for å screene i et globalt mote for slike ekson-hoppe hendelser ved hjelp av mønster basert Correlation (PAC). PAC algoritmen har blitt brukt tidligere til å identifisere forskjellig uttrykt spleisevarianter mellom to forhåndsdefinerte undergrupper. Som genetiske endringer i kreft er prøven bestemt, testet vi muligheten av PAC til å identifisere abnormt uttrykt eksoner i enkeltprøver.
hovedfunnene
Som en proof-of-prinsippet, vi testet PAC strategi på humane cancerprøver hvorav den fullstendige kodende sekvens av åtte kreftgener var blitt screenet for mutasjoner. PAC oppdaget alle de syv ekson-hoppe mutanter blant 12 kreftcellelinjer. PAC også identifisert ekson-hoppe mutanter i kliniske kreftprøver selv om påvisning ble kompromittert på grunn av heterogen transkripsjon uttrykk (villtype). PAC redusert antall kandidat gener /eksoner for etterfølgende mutasjonsanalyse med to til tre størrelsesordener, og hadde en betydelig positiv sann hastighet. Viktigere av 112 tilfeldig utvalgte uteligger eksoner, sekvensanalyse identifiserte to nye ekson hoppe hendelser, to nye endringer basis og 21 tidligere rapporterte endringer basis (SNPs).
Konklusjoner
Evnen PAC til berike for muterte transkripsjoner og å identifisere kjente og nye genetiske endringer bekrefter sin egnethet som en strategi for å identifisere kandidat kreftgener
Citation. Schutte M, Elstrodt F, Bralten LBC, Nagel JHA, Duijm E, Hollestelle A, et al. (2008) Exon Expression Arrays som et verktøy for å identifisere nye kreftgener. PLoS ONE 3 (8): e3007. doi: 10,1371 /journal.pone.0003007
Redaktør: Christopher Arendt, Sanofi-Aventis, USA
mottatt: 10. juni, 2008, Godkjent: 31 juli 2008; Publisert: 20 august 2008
Copyright: © 2008 Schutte et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av Susan G. Komen Breast Cancer Foundation (BCTR0601309), den nederlandske Kreftforeningen Koningin Wilhelmina Fonds, DDHK 2002-2687 og Erasmus MC Mrace 2005.
konkurrerende interesser: forfatterne har erklært at ingen konkurrerende interesser eksistere.
Innledning
Kreft er drevet av mutasjoner i gener som styrer spredning av celler, deres overlevelse og deres integritet. Screens sikte på å identifisere slike kreftgener bruker ofte kromosom plassering og /eller funksjonelle egenskaper for å velge kandidater genene for påfølgende mutasjon analyse [1] – [4]. Selv om mange kandidat kreft genet loci har blitt identifisert, arbeidskrevende mutasjonsanalyse sterkt hemmer finne tilsvarende kreft genet. Andre genet søkestrategier har fokusert på avvik genuttrykksmønster å identifisere kandidater. For eksempel, ble genet mutanter som resulterer i for tidlig avslutning kodoner identifisert ved å screene for gener som er spesifikt uttrykt følgende kjemiske inhibering av nonsens mediert RNA forråtnelse [5]. Videre ble fusjonsgen i prostata kreft identifisert ved screening for utliggere i en stor kohort av gen-ekspresjonsprofiler [6].
humane kreft genmutasjoner ofte resultere i at hoppe av ett eller flere eksoner fra de kodete transkriptene [7] – [9]. Exon-hoppe mutasjoner kan være forårsaket av nukleotidsubstitusjoner innenfor konsensusspleiseseter eller slettinger som spenner hele eksoner. I tillegg kan ekson-hoppe mutasjoner være forårsaket av forholdsvis små intragenic innsettinger, delesjoner eller duplikasjoner. Selv om ekson-hoppe mutasjoner utgjør anslagsvis 10-20% av alle kreftrelaterte genmutasjoner [4], [9] – [12], har ingen høy gjennomstrømning metode vært tilgjengelig for skjerm for slike mutasjoner. Her beskriver vi mønster basert Correlation (PAC) som en tilnærming for å identifisere kandidat kreftgener ved screening for ekson-hoppe hendelser i en global mote. Detaljert mutasjon analyse blir så begrenset bare til PAC-identifiserte uteligger eksoner. Som et bevis-for-prinsipp, viser vi effekten av PAC-strategi på tidligere identifiserte ekson-hoppe mutasjoner i brystkreftcellelinjer og i kliniske hjernetumorprøver. Vi viser også at PAC kan identifisere roman exon hoppe hendelser med underliggende genetiske endringer i kjente kreftgener og i tilfeldig utvalgte PAC-identifiserte uteligger eksoner.
Resultater
avvikende exon identifisering av mønster basert Korrelasjon (PAC)
i denne studien har vi utviklet en ny tilnærming til skjermen ekson-hopper hendelser i humane kreftprøver. Ettersom mutasjoner i kreft ofte er meget heterogene med hensyn til deres plassering intragenic, individuelle tumorer uttrykker ofte unike RNA-arter. Screening for mutasjoner som resulterer i å hoppe over ett eller flere eksoner i det kodede transkriptet krever derfor screening for unike, ekson-hoppet, transkripter innen en bestemt prøve kohort. I korthet blir ekson-nivå ekspresjonsprofiler generert ved hjelp av Affymetrix menneske ekson Arrays, som bestemmer ekspresjonsnivået av praktisk talt alle eksoner til stede i det humane genomet. Mønsteret basert Correlation (PAC) algoritmen blir så brukt til å beregne den anslåtte uttrykk nivået på hver ekson (eller probe sett). Deretter identifiserer uteligger exoner ved å subtrahere den forutsagte ekspresjonsnivået av eksoner fra deres målte ekspresjonsnivå, med verdier lik null når den målte ekspresjonsnivået av en ekson var lik den forutsagte ekspresjonsnivået (formulert i detalj i henhold til metoder). PAC-algoritmen har blitt brukt for å identifisere forskjellig spleising mellom forhåndsdefinerte grupper [13]. I denne studien, har vi testet PAC algoritme for dens evne til å identifisere avvikende uttrykt eksoner i enkeltprøver av et veldefinert kohort av cellelinjer eller svulster. PAC normaliserer effektivt variasjonen i genekspresjon nivåer mellom prøver og, i en enkelt prøve, normaliserer variasjon i signalintensitet mellom sonde sett av samme transkripsjon (fig. 1).
(A) Normalisert ekspresjonsdata av alle eksoner innenfor
PTEN
genet. Hver ekson probe sett er representert med en prikk i heltrukken linje; flere sondesett kan være rettet mot samme exon. (B) PAC normaliserer variasjonen i genekspresjon nivåer mellom prøvene og, i en enkelt prøve, variasjonen i signalintensitet mellom sonde sett av samme transkriptet. PAC beregningen gir derfor rask påvisning av å hoppe av
PTEN
exon 4 i brystkreftcellelinjen MDA-MB-468 på grunn av en
PTEN
c.253 + 1G T spleisesete mutasjon som vi tidligere hadde identifisert [17].
PAC oppdager ekson-hopper hendelser i brystkreftcellelinjer
Vi testet muligheten for PAC strategi på et panel av 12 human brystkreft celle linjer som hadde blitt vist for mutasjoner i sju tumorsuppressorgener:
BRCA1
,
CDH1
,
MAP2K4
,
PTEN
,
p16
,
p53 Hotell og
RB1 product: [14] – [18], og upubliserte resultater). Mutasjonsanalyse ble utført ved sekvensering av den fullstendige kodende sekvensene av genene og analyse av alle mutasjoner på begge genomiske genfragmentene og transkripter. Sammen utgjør de 12 cellelinjene inneholdt syv gen-mutanter som skal være detekterbar av PAC, som de resulterte i hoppe av åtte eksoner fra blant fire tumorsuppressorgener (mutasjoner er beskrevet i Tabell 1). Vi har utforsket PAC strategi på ulike cut-off nivå, identifisere uteligger eksoner som ble uttrykt mindre enn 16 ganger, 8 ganger, 4 ganger, 2,8 ganger og 2,5 ganger enn deres spådd uttrykk nivå (dvs. PAC verdier av -4,0, -3,0, -2,0, -1,5 og -1,3, henholdsvis). Uteliggeren eksoner ble identifisert uten forutgående kunnskap om mutasjons data.
Fra totalt 3,4 millioner nålsonden sett at vi analysert for 12 cellelinjer (290.000 kjerne probe sett per prøve), PAC identifisert 21151 (0,6%) outlier probe sett på PAC verdi -4,0 og 94 590 (2,8%) outlier probe sett på PAC verdi -1,3 (fig. 2A). Alle probe sett på PAC verdier -2.0 (34137 probe sett tilsvarende 31,357 eksoner og 10,247 gener) er oppført i tilleggsdata Tabell S1. Når alle PAC-verdier er plottet i et histogram frekvens, blir en hale mot den negative enden observert (fig. 2A). Denne skjevfordeling gir et grovt anslag av den falske positive frekvensen på de ulike PAC nivåer. PAC av de syv fullt karakteriserte tumorsuppressorgener i 12 cellelinjer som er involvert analyse av 1200 eksoner (1,752 probe sett). PAC korrekt detektert seks av de åtte hoppet eksonene ved bruk av PAC verdi -4,0, syv hoppet exoner ble detektert ved PAC verdi -2,0 og alle åtte hoppet eksoner ble detektert ved PAC verdi -1,3 (Fig. 2C). Viktigere, antallet falske positive uteligger eksoner ble vesentlig redusert ved PAC verdi -4,0 sammenlignet med PAC verdi -1,3, noe som resulterer i en økning av det virkelige positive hastighet fra 9% til 24% av de identifiserte uteligger eksonene (fig. 2D) . Til sammenligning stikkprøvekontroll av 24/1200 eksoner har a 85% sannsynlighet for ikke å finne noe sant positiv mutasjon og bare en 10
-8 sjanse for å finne 6 eller mer. For de kjente kreftgener brukes i vår studie, den sanne positive frekvensen av vår tilnærming dermed langt overgår tilfeldig exon utvalg. I denne forbindelse, kan reduksjonen av antall falske positive kandidatgener i utgangspunktet være langt mer fordelaktig for et gen søk prosjekt enn nøyaktig identifikasjon av alle sanne positive uteligger eksoner. Sammen viser våre resultater at PAC strategien er pålitelig ved påvisning av ekson-hoppe-mutantene i kreftcellelinjer.
(A) og (B) Totalt antall PAC-detekterte avvikende probe sett fra blant 290,000 kjerne probe-sett i 12 brystkreftcellelinjer og i 14 glioblastomer, henholdsvis. (C) Antall hoppet exoner detektert av PAC som en prosentandel av alle åtte hoppet eksoner som er tilstede i brystkreftcellelinjer, eller som en prosentandel av den 36 hoppet
EGFR
eksoner som er tilstede i glioblastomer (se tabell 1 ). (D) Totalt antall uteligger eksoner (true pluss falske positiver) og antall sanne positive uteligger eksoner oppdages av PAC blant de sju tumorsuppressorgener og
EGFR
onkogen. Sanne positive uteligger eksoner inkluderer alle PAC oppdaget hoppet eksoner og to missense mutasjoner (
PTEN
c.274G C i CAMA1,
MAP2K4
c.551C G i MDA-MB-134VI).
PAC ytelse i prøver med heterogen avskrift uttrykk
i likhet med andre genetiske screening metoder, er PAC mest egnet til å oppdage homozygote genetiske endringer. For eksempel, den laveste PAC verdi når 50% villtype transkripsjoner er til stede (som kan være tilfelle for en heterozygot genetisk endring) er -1,0. Den noe kompromittert påvisning av hoppet eksoner på PAC verdi -4,0 i forhold til PAC verdi -1,3 (dvs. seks vs. alle åtte hoppet eksoner) i vårt panel av brystkreftcellelinjer derfor kan ha blitt forårsaket av uttrykk for en andre avvikende karakterutskrift som fortsatt har (en del av) ekson. Faktisk en andre
CDH1
avskrift lengde mindre intensitet ble påvist i CAMA-1 (fig. 3A), det spleisesetet mutant som hadde blitt oppdaget bare på PAC verdi -1,3.
Hoppe av
CDH1
exon 11 i brystkreftcellelinje CAMA-1 ble bare detektert ved PAC verdi -1,3, sannsynligvis på grunn av ekspresjon av et andre avvikende transkript variant (*), som ble påvist ved konvensjonell RT-PCR. (B) Uttrykk for
EGFR
transkripsjoner ble oppdaget i glioblastom prøver av Real-Time RT-PCR, ved hjelp av primere designet for å binde inne i ekson 2-7 sletting region av
EGFRvIII
isoform ( grå søyler) eller utenfor sletting regionen (svarte søyler). Forskjeller i Ct verdier mellom de to transkripsjons fragmentene er veiledende for
EGFRvIII
isoform uttrykk nivåer. Alle fem prøver med
EGFRvIII
isoform uttrykte også betydelige mengder av villtype
EGFR
transkripsjoner, sannsynligvis kompromitterende avvikende oppdagelse av PAC (angitt med «oppdaget» og «ikke påvist»). Wild-type, prøver med normale transkripsjoner; Kontroller, non-maligne hjerneprøver.
For å ytterligere asses resultatene av PAC i prøver med heterogen (villtype og mutant) avskrift uttrykk, utført vi PAC på 14 kliniske glioblastom prøver (valgt for å inneholde 70% svulst kjerner) som hadde genomiske presiseringer av
EGFR
onkogen. Glioblastom med
EGFR
amplifikasjoner ofte bære en intragenic delesjon av exon 2 til og med 7, noe som resulterer i ekspresjon av det konstitutivt aktiv
EGFRvIII
isoform [8], [19]. Men glioblastomas uttrykker
EGFRvIII
isoform også ofte uttrykker villtype
EGFR
transkripsjoner. Denne heterogene
EGFR
uttrykk er knyttet til forsterkning av
EGFR
locus før sletting av eksoner [20], selv om ikke-maligne celler i glioblastom prøvene kan også uttrykke
EGFR
. Av de fjorten glioblastom prøvene brukt i denne studien, seks uttrykt
EGFRvIII plakater (totalt 36 hoppet eksoner) hvorav fem også uttrykte betydelige nivåer av villtype
EGFR
transkripsjoner som bestemmes av kvantitativ real-Time PCR (qPCR) (fig. 3B) (utilstrekkelig RNA igjen av den sjette prøven med
EGFRvIII
uttrykk for å utføre qPCR).
fra totalt 4,1 millioner kjerne probe sett som vi analysert for disse 14 prøvene (290.000 kjerne probe sett per prøve), PAC identifisert 1646 (0,04%) outlier probe sett på PAC verdi -4,0 og 39 936 (1,0%) outlier probe sett på PAC verdi -1,3 (fig. 2B). PAC således identifisert tre til ti ganger mindre uteligger eksoner i glioblastom i forhold til brystkreftcellelinjer (Fig. 2A). Alle probe sett på PAC verdier -2.0 (11287 probe sett, tilsvarende 10,903 eksoner og 6,264 gener) er oppført i tilleggsdata Tabell S1. Dette mindre antall av uteligger eksoner i glioblastom kan være relatert til deres homogen histopatologi og deres høyt lignende genekspresjonsprofiler [13], [21], i nærvær av ikke-neoplastiske celler i tumorprøver, eller kanskje reflekterer prøvetakings skjevheter på grunn til små kohort størrelser.
PAC av
EGFR
genet i de 14 glioblastomas involvert analyse av 392 eksoner (434 probe sett). PAC oppdaget to av seks
EGFRvIII
uttrykke svulster (12 av 36 hoppet eksoner) på PAC verdier -2,0 og lavere (tabell 1 og 2C fig.). Av de to glioblastomas med
EGFRvIII Hotell som hadde blitt oppdaget av PAC, en hadde signifikant (dvs. 5 ganger) mer mutant enn villtype
EGFR
transkripsjoner. I denne svulsten, Ct verdien forskjellen var 2 mellom qPCR fragmenter inne (som måler bare villtype
EGFR
transkripsjoner) og utenfor (som måler både villtype og
EGFRvIII
transkripsjoner) den
EGFR
exon 2-7 sletting region (fig. 3B). Den andre glioblastom hadde et lignende uttrykk nivåforskjell mellom vill-type og
EGFRvIII
transkripter (Ct-verdien forskjell av ~1.5) som de tre glioblastom som ikke hadde blitt oppdaget av PAC, men hadde lavere samlet
EGFR
transkripsjonsnivåer. Det ser ut til at PAC påvisning av
EGFRvIII
isoform bestemmes av det totale uttrykket nivået av
EGFR
transkripsjoner i kombinasjon med forholdet mellom
EGFRvIII Hotell og villtype
EGFR
transkripsjoner, hvor prøver med for høyt
EGFR
transkripsjonsnivåer kan unnslippe PAC deteksjon grunn av metning av sonde sett involvert. Disse resultater viser at PAC strategien kan detektere ekson-hoppe-mutantene i kreft kliniske prøver hvis forholdet mutant /villtype-transkripsjon nivået er høyt og når sondesett er innenfor det lineære deteksjonsområdet til mikromatrise.
PAC ytelse i å oppdage tilbakevenduteligger eksoner
PAC ytelse kan også bli utfordret av tilbakevendende uteligger eksoner. Slike ofte hoppes eksoner vil resultere i en undervurdering av ekson /karakter-forholdet i PAC algoritmen og så øke PAC verdier. Vi vurderte derfor resultatene av PAC påvise tilbakevenduteligger eksoner ved gjentok utskifting av
EGFRvIII
uttrykke prøver med prøver som uttrykte bare villtype
EGFR plakater (fig. 4A). Når seks av 14 prøver uttrykke
EGFRvIII
, sletting av eksoner 2-7 i GBM67 ikke oppdages av PAC. PAC verdier faktisk redusert med synkende prosenter av villtype versus mutant prøver. Imidlertid var reduksjonen forholdsvis liten og resulterte i identifisering av bare en av de seks slettede eksoner når forholdet hadde falt til en mutant prøve på 14 prøver. Vi har også simulert PAC påvisning av tilbakevendende mutasjoner med to brystkreftcellelinjer, hvorav HCC1937 hadde hoppet
RB1
ekson 22, og vi var allerede i stand til å identifisere mutant blant to prøvene opp til enda fem mutanter fra blant seks prøver (fig. 4B). Disse simulering eksperimenter tyder på at PAC fungerer godt i å identifisere tilbakevend ekson-hoppe mutasjoner.
(A) Simulering eksperiment for å finne ut PAC ytelse i å oppdage tilbakevend ekson-hoppe hendelser blant kliniske glioblastom prøver, hvor mutantprøver uttrykker
EGFRvIII
isoform med delesjon av exon 2 til og med 7. Den kohort av 14 glioblastom inkludert seks mutante prøver som ble erstattet med villtype-prøvene gjennom gjentakelse, basert på deres posisjon fra venstre til høyre i fig. 3B. Sletting av
EGFR
exon 6 i prøven GBM67 ble oppdaget bare som unike mutant prøve. (B) simulering eksperiment for å bestemme PAC ytelse i å detektere tilbakevendende ekson-hopper over hendelser blant brystkreftcellelinjer ved hjelp av villtype-cellelinje CAMA-1 og
RB1
exon 22 delesjonsmutant HCC1937. De to cellelinjer ble analysert under ulike kohort størrelser, med enten villtype eller mutant cellelinje som enkelt prøve. Mutant Prøven ble fortsatt registrert på PAC verdi -2,0 med fem vendende mutanter blant seks prøver. Den gjennomsnittlige uttrykk nivået av
RB1
ekson 22 falt under PLIER 50 når mer enn fem mutanter ble simulert, utelukker PAC analyse (se materialer og metoder).
Påvisning av nukleotidsubstitusjoner og nye genetiske endringer av PAC
Utførelsen av PAC ble videre undersøkt ved analyse av uteligger eksoner valgt fra alle kandidater på PAC verdi ≤-2,0 i brystkreftcellelinjer og kliniske glioblastom prøver. I alt ble 44 og 68 uteligger eksoner vist i henholdsvis brystkreft cellelinjer og glioblastom prøver. Sekvensanalyse av PCR forsterket uteligger eksoner identifisert to nye ekson hoppe arrangementer og to nye genetiske basen endringer i glioblastom prøver, samt en rekke tidligere rapporterte baseforandringer (homozygot SNPs) i brystkreft cellelinjer (n = 5) og glioblastomas ( n = 16). RT-PCR resultatene fra eksperimentet er beskrevet i tilleggsdata Tabell S2.
De fleste av genetiske endringer som er identifisert av PAC var single nucleotide endringer, både i brystkreftcellelinjer (fem kjente SNPs) og i glioblastomas (to roman basen endringer og 16 kjente SNPs). Videre to av ti tidligere identifiserte onkogene punktmutasjoner som ikke resulterte i ekson hoppe hendelsene ble også PAC påvist i vår kohort av brystkreftcellelinjer:
MAP2K4
c.551C G i MDA-MB-134VI og
PTEN
c.274G C i CAMA-1; [16], [17] (fig. 5). Single nucleotide uoverensstemmelsene er brukt til å definere hybridisering spesifisitet på andre Affymetrix microarray plattformer. Ved analogi, kan enkelt nukleotidsubstitusjoner i kreft også føre til redusert hybridisering til probene på microarray og dermed bli oppdaget som uteligger eksoner av PAC. Faktisk er alle de PAC detektert baseforandringer og SNP var sentralt lokalisert i sonden satt utvalg og overlapper med flere av sine individuelle sonder (Fig. 5).
(A) PAC spår hoppe av 5′- slutten av
PTEN
exon 5 i CAMA-en brystkreftcellelinje. Denne cellelinjen inneholder et bytte nucleotide innenfor identifisert exon. Denne baseendring induserer ikke ekson hoppe, men er sentralt innenfor alle tre sonder av sonden settet (B). Den sentrale plassering antyder denne mutasjonen fører til en redusert affinitet til probene i exon-matrisen.
En av PAC-identifiserte nye exon hopper over hendelser ble forutsagt å resultere i en delesjon av fire 3′-enden eksoner av
EGFR plakater (fig. 6A). Dette exon-hoppe hendelsen skyldtes en genomisk sletting som bestemmes ved hjelp av semi kvantitativ PCR på genomisk svulst DNA. I forhold til den 5 «ende av den
EGFR
locus i GBM157, 3′ enden viste mindre forsterkning (ΔCt -2,5), mens andre prøver viste lik forsterkning mellom 5 «og 3» enden av genet (ΔCt 0,3 ± 1,9). Lignende 3 «slettinger i
EGFR
har blitt observert tidligere i hjernesvulst [19]. Den andre exon-hoppe hendelsen spådd av PAC ville resultere i en sletting av ekson 30 i
FCGBP
cDNA (fig. 6B). Denne delesjon vil føre til en rammeskifte som er forutsagt å resultere i et avkortet protein. Fraværet av exon 30 ble bekreftet ved RT-PCR og sekvensanalyse (fig. 6C). Nye identifiserte enkeltbaseforandringer inkluderer en enkelt base endring 1934C G (S645C) i
EGFR
genet (fig 6A og D.), Og en enkel baseendring 946G A (G316R) i
TLE2
genet (fig. 6E). Den G316R (946G A) mutasjon i
TLE2
er gjengitt med «patologisk» av PMut (mmb2.pcb.ub.es:8080/PMut/) og «ikke tolereres» av SIFT Blink (blocks.fhcrc. org /sile /SIFT_BLink_submit.html). Oppsummert romanen ekson hoppe hendelser og endringer basis identifisert ved analyse av et utvalgt sett av uteligger eksoner bekrefter egnetheten av PAC til å identifisere kandidat kreftgener.
(A) PAC påvisning av nye genetiske endringer i
EGFR
. PAC spådd å hoppe over de siste fire eksonene av GBM157 og 5′-enden av exon 17 i GBM172. Semi-kvantitativ PCR på genomisk DNA bekreftet at slettingen i GBM157 (ikke vist). (B) PAC spår hoppe av ekson 30 i
FCGBP
genet i GBM60. (C) RT-PCR bekreftet
FCGBP
exon hoppe hendelse i GBM60; andre svulster viste ikke dette exon hoppe. (D) Direkte sekvensering identifisert en enkelt base endring i
EGFR
i GBM172 (som spådd av PAC, se fig. 6A). (E) Bekreftelse på en PAC spådd endring i
TLE2
genet i GBM60. Den nukleotidsubstitusjon lapper med individuelle sonder av sonden sett.
Diskusjoner
Vi har utviklet en metode som bruker mønster basert Correlation (PAC) til skjermen for kreft genmutasjoner som forårsaker exon hoppe i de kodede transkripsjoner. Vi viser at PAC riktig registrert alle syv tidligere identifiserte ekson-hopper mutanter i brystkreftcellelinjer og to av seks mutanter i kliniske glioblastom prøver. Den sanne og falske positiver ble bestemt ved forskjellige stringens nivåer. Viktigere, PAC identifisert en rekke nye genetiske endringer, inkludert de som påvirker spleising, som tidligere hadde gått usett. Disse nye genetiske endringer er enten i kjente kreftgener (
EGFR
), resultere i en rammeskifte (
FCGBP
) eller er gjengitt med «ikke tolereres» av genet prediksjon algoritmer PMut og sile Blink (
TLE2
). Andre eksperimenter er nødvendig for å fastslå om endringer i romanen kandidat kreftgener (
FCGBP Hotell og
TLE2
) er faktisk onkogen. Et betydelig antall nukleotidsubstitusjoner som ligger innenfor sonden sett utvalget regionen er også PAC påvist (Fig. 5). Våre resultater og dermed klassifisere PAC som en pålitelig metode for å screene for kandidaten kreftgener i en global mote.
Gene expression profilering på nivå med individuelle eksoner har først nylig blitt mulig gjennom utgivelsen av ekson arrays. Her har vi undersøkt effekten av PAC for å identifisere exon-hoppe mutanter, men den strategi kan også brukes til å utlede den primære strukturen av gentranskriptene [13], [22]. Det er viktig å merke seg at PAC-algoritmen, er beskrevet i henhold til Materialer og metoder, er i hovedsak en enkel formel som forutsier uteligger eksoner basert på bretteendrings forskjeller mellom målte og forutsagte ekson ekspresjonsnivåene. Andre fremgangsmåter kan også brukes til å identifisere utliggere (f.eks n standardavvik fra betyr uttrykket nivå), men trenger å ta hensyn til ikke-linearitet i genekspresjon nivåer mellom samples (spesielt for kreftgener) og den begrensede prøvestørrelsen. På grunn av de høye sanne positive priser innhentet av PAC, hadde vi ikke videre utforske alternative statistiske metoder.
PAC-algoritmen er uavhengig av array plattform eller organisme, slik at anvendelsen av PAC-strategi i et bredt spekter av biologiske systemer . Flere algoritmer for exon-nivå ekspresjon profilering er kommersielt tilgjengelige, inkludert Stratagene ArrayAssist (www.stratagene.com), Partek Genomics Suite (www.partek.com) og Genomatix Suite (www.genomatix.de). Selv om hver av disse programvarepakkene er relativt rett fram, viktigste fordelene med PAC er at det tillater påvisning av unike uteligger eksoner uten forutgående kunnskap om koding genet eller dets transkripsjon struktur, og at det ikke krever forhåndsdefinerte undergruppene av prøver med differensial uttrykk av uteliggeren eksoner.
Som med alle globale screening strategi, har PAC sine forutsetninger for å oppdage uteligger eksoner. Først og fremst, identifisering av uteligger eksoner krever at deres transkripsjon ekspresjonsnivået for å være innenfor det lineære deteksjonsområdet for exon matrise, som bestemmes av deres transkripsjon ekspresjonsnivået samt hybridisering effektiviteten og spesifisiteten av probe-sett som er involvert. Den valgkrets av prøvene er en annen vurdering, særlig når begge mutant og villtype transkripsjoner kan uttrykkes. For eksempel brystkreft cellelinje kohorten inkluderte to spleisesete mutanter som rømte gjenkjenning av PAC fordi hver hadde en annen avskrift lengde av stor intensitet som et resultat av kryptiske spleising (
BRCA1
c.5396 + 1G A i MDA-MB-436 [14] og
p16
c.150 + 2T . C i MDA-MB-436 (. Nagel
et al
, offentlig) Videre PAC deteksjon av
EGFRvIII
avskrift isoform i kliniske glioblastomas ble bestemt av det totale uttrykket nivået av
EGFR
transkripsjoner, som var nær grensene for lineær deteksjon i alle fem
EGFRvIII
glioblastomas , men også av forholdet mellom
EGFRvIII
isoform versus vill-type
EGFR
transkripsjoner (fig. 3B). en konsekvens er at PAC ytelsen kan forringes i å oppdage en avvikende ekson når vill -type transkripsjoner representerer mer enn en fjerdedel av alle utskrifter av den aktuelle genet, som kan være tilfelle i tumorprøver med mindre enn 75% neoplastiske celler. Men uttrykket nivåer av mutant og villtype lene vanligvis er uforholdsmessig til deres allelet frekvens og deteksjon av PAC således igjen bestemmes av den (relative) ekspresjonsnivå av det avvikende transkripsjon. PAC utfører derfor best i fravær av villtype-transkript uttrykk. Homozygot transkripsjoner er hovedsakelig funnet blant tumorsuppressorgener hvor ofte en allelet er muterte ledsaget av tap av den andre allelet
Påvirkningen av allel forholdstall ble ytterligere understreket i våre simuleringer av tilbakevendende avvikende oppdagelse av PAC. Den
EGFRvIII
isoform i GBM67 ble oppdaget bare når det var til stede som en unik avvikende blant 14 prøver, mens det ikke hadde blitt oppdaget i vår opprinnelige PAC-skjerm som inkluderte fem andre
EGFRvIII
uttrykker glioblastomas (fig . 4A). Men denne under optimal ytelse PAC opptrådte ikke er relatert til gjentakelse av utliggere, som tilbakevendende utliggere ble lett identifisert blant cellelinjer – selv når de er tilstede i fem av seks cellelinjer (figur 4B.). Simuleringen Forsøkene viser også at to cellelinjer var tilstrekkelig til å pålitelig detektere uteligger eksoner og at mer enn åtte cellelinjer ikke ytterligere å forbedre PAC ytelse, mens det for kliniske tumorprøver ti først på et minimum, men tyve ville være å foretrekke (fig. 4).
Hvordan effektivt kan PAC være påvise mutasjoner i kreft genomer? Fra vårt utvalg av uteligger eksoner, identifiserte vi ~ 20% (21/112) SNPs, ca. 2% (2/112) endringer roman base og ca. 2% (2/112) ekson hoppe hendelser. Når inkludert alle nukleotidsubstitusjoner, den falske positive rate i disse forsøkene er ~76%. Ved forlengelse, forsterkning og sekvense 1,763 reaksjoner på en enkelt prøve (alle utliggere på PAC verdier -4,0) kan forventes å gi så mye som 34 nye baseforandringer og 34 ekson hoppe hendelser. Derfor kan vår tilnærming bli klassifisert som en svært effektiv metode for screening kandidat kreftgener, spesielt sammenlignet med tilfeldig utvalg av eksoner. Ytterligere studier bør da utføres for å bestemme hvorvidt identifiserte endringer er kausal for tumordannelse og /eller progresjon, for eksempel ved screening for ytterligere mutasjoner (f.eks delesjoner, missense mutasjoner) i andre tumorprøver, eller ved hjelp av funksjonell analyse av de identifiserte mutanter.
Materialer og metoder
Prøver
Vår samling av 41 offentlig tilgjengelige menneskelige brystkreftcellelinjer hadde vært utsatt for mutasjons skjermer av sju tumorsuppressorgener:
BRCA1
(Breast Cancer Følsomhet Gene 1; OMIM 113705),
CDH1 product: (E-cadherin, OMIM 192090),
MAP2K4 plakater (MAP kinase kinase 4, aka
MKK4
; OMIM 601335),
PTEN plakater (fosfatase og Tensin homolog, OMIM 601728),
p16 plakater (CDK4-inhibitor, aka
INK4A
,
CDKN2A
; OMIM 600160),
p53 plakater (Tumor Protein p53; OMIM 191170) og
RB1 plakater (Retinoblastoma Følsomhet Gene 1; OMIM 180200) [14] – [18] (Nagel
et al.
levert til publisering). Mutasjonsanalyse er involvert sekvensere hele det kodende område av slike gener på genomisk DNA, samt analyse av det kodede transkriptet. De tolv brystkreft cellelinjer som benyttes for denne studien var: CAMA-en, EVSA-T, HCC1937, MDA-MB-134VI, MDA-MB-157, MDA-MB-435s, MDA-MB-436, MDA-MB- 453, MDA-MB-468, MPE600, OCUB-F og SK-BR-5. Kliniske glioblastom prøvene ble frosset i flytende nitrogen umiddelbart etter kirurgisk fjerning fra pasienter ved Erasmus University Medical Center, som beskrevet andre steder [13]. Patologisk gjennomgang avdekket minst 70% tumor kjerner for hver prøve.