Abstract
Bakgrunn
Tykktarmskreft (CRC) er med ca 1 million tilfeller den tredje vanligste kreftformen i verden. Omfattende forskning pågår for å dechiffrere de underliggende genetiske mønstre med håp om å forbedre tidlig kreftdiagnose og behandling. I denne retningen, har den siste fremskritt innen neste generasjons sekvensering teknologi revolusjonert innen kreftgenomforskning. Men en påminnelse av disse studiene er fortsatt den store mengden av genetiske variasjoner identifisert og deres tolkning.
metodikk /hovedfunnene
Her presenterer vi den første arbeidet på hele exome NGS av primære tykktarm kreft. Vi utførte 454 hele exome pyrosekvensering av tumor samt tilstøtende ikke berørte normal colonic vev fra mikro stabil (MSS) og mikro ustabil (MSI) tykktarmskreftpasienter og identifisert mer enn 50.000 små nukleotidvariasjoner for hvert vev. Ifølge anslag basert på MSS og MSI pathomechanisms vi identifisert åtte ganger flere somatiske ikke-synonyme variasjoner i MSI kreft enn i MSS, og vi var i stand til å reprodusere resultatet i ytterligere fire CRC. Våre bioinformatikk filtrering tilnærming snevret ned hastigheten på de fleste store mutasjoner til 359 for MSI og 45 for MSS CRC med spådd endrede proteinfunksjoner. I begge CRC, MSI og MSS, har vi funnet somatiske mutasjoner i det intracellulære kinasedomenet av benmorfogenetisk protein reseptor 1A, BMPR1A, et gen hvor hittil kimlinje-mutasjoner er assosiert med juvenile polypose syndrom, og viser at mutasjoner funksjonelt forringe proteinfunksjonen .
Konklusjon /Betydning
Vi konkluderer med at med dyp sekvensering av tumor exomes kan man være i stand til å forutsi mikro status for CRC og i tillegg identifisere potensielt klinisk relevante mutasjoner.
Citation: Timmermann B, Kerick M, Roehr C, Fischer A, Isau M, Boerno ST, et al. (2010) Somatisk mutasjon Profiler av MSI og MSS tykktarmskreft Angitt med Whole Exome Next Generation Sequencing og bioinformatikk analyse. PLoS ONE 5 (12): e15661. doi: 10,1371 /journal.pone.0015661
Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, USA
mottatt: 25 august 2010; Godkjent: 19 november 2010; Publisert: 22.12.2010
Copyright: © 2010 Timmermann et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av det tyske føderale Kunnskapsdepartementet (01GS08105 «Mutanom,» 01GS08111 «Tarm Modifers») og Max Planck Society. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP er den tredje vanligste kreftformen med ca 1 million tilfeller på verdensbasis. I løpet av de siste tiårene har det blitt klart at CRC utvikler seg gjennom flere stier og at disse banene kan grovt defineres på grunnlag av molekylære mønstre som integriteten misparringssystemet (MMR) eller mutasjons og epigenetiske mønstre. Mangel på MMR reflekteres i DNA mikrosatelitt ustabile (MSI) som også har vært assosiert med behandlingsresultatet, men som må ytterligere validert i flere kliniske studier [1], [2], [3], [4], [ ,,,0],5], [6].
High-throughput Sanger-sekvenseringsstudier på den annen side har vist at mutasjonsfrekvensen for kandidatkreftgener kan være mye høyere enn ventet, og at den spesielle kombinasjon av mutasjoner kan påvirke tumor egenskaper [7], [8], [9], [10], [11]. Med utviklingen av neste generasjons sekvensering (NGS) teknologier sekvense gjennomstrømming har økt dramatisk, og kostnadene har gått ned. I tillegg, og spesielt viktig for kliniske omgivelser, NGS kan påføres på formalinfiksert og parafin innleiret FFPE-vevet materiale så vel som svært nedbrutt DNA som blir rutinemessig fremstilt i patologi avdelinger eller funnet i gamle DNA [12], [13]. Flere undersøkelser har anvendt NGS teknologier for identifikasjon av den underliggende mutasjon i monogenetic sykdommer [14], [15]. Men bare et begrenset antall studier rapporterer om neste generasjons sekvensering for å identifisere nye kandidatkreftgener; en av de tidligste studiene undersøkte cytogenetisk normal akutt myeloid leukemi og brystkreft genomer [16], [17]. I tillegg har studier på føflekkreft og småcellet lungekreft cellelinjer gitt første innsikt i genomisk endringer forårsaket av ultrafiolett lys eksponering eller tobakksrøyk [18], [19].
For å få innsikt i genomer av mikro stabile og ustabile kolorektal kreft, og for å identifisere funksjonelle relevante mutasjonsmønstre vi brukte en hybridisering basert hel exome DNA fange tilnærming etterfulgt av 454 neste generasjons sekvensering [20]. Bruk av strenge bioinformatikk analyser, vi snevret ned mengden av funksjonelt betydelige somatiske mutasjoner i MSI til 359 og 45 i MSS kreft, og dermed fremhever spesifikke mutasjonsmønstre avhengig av mikro status. Vi var i stand til å bekrefte våre resultater ved å sekvensere exomes av fire ekstra CRC tilfeller (en MSI, tre MSS) ved hjelp av en annen berikelse og sekvenseringsteknologi. Blant disse mutasjonene er BRAF i MSI kreft og KRAS og TP53 i MSS kreft, ytterligere understreker gyldigheten av vårt utvalg tilnærming [21]. Videre funksjonelle characterizations identifisert vendende somatiske mutasjoner i BMPR1A, et protein som har vært forbundet så langt med juvenil polypose syndrom, en kreft predisposisjon syndrom.
Resultater
Sekvensspesifikke berikelse og sekvensering strategi
Vi sekvensert svulst og matchende normale kolon vev fra to pasienter med høy klasse adenokarsinom i tykktarmen (G3), pasient 1 med en mikro ustabile og pasient 2 med en mikro stabil svulst (tabell 1, figur S1). For bestemmelse av kimlinje-mutasjoner vi sekvensert i tillegg til tumorvev fra hver pasient tilstøtende ikke påvirkes normalt kolonvev. Ved hjelp av Illumina sekvensering og SNP arrays vi fastslått at svulsten av pasienten 1 er kopiantall stabil mens pasienten 2 viste variasjoner som vi brukte for re-evaluering av identifiserte høy stringens mutasjoner (tabell S3).
Vi analyserte fullstendige exomes på mer enn 135.000 exoner med enkelt-les hagle 454 sekvensering (figur 1, figur S1, S2 fig, tabell 2). For å vurdere effekten av dekningen dybde på sensitivitet og spesifisitet sekvens variant deteksjon, genotype samtaler av Affymetrix SNP rekke 6.0 ble sammenlignet trinnvis til de såkalte nukleinsyre stillinger og resulterte i en nøyaktighet på mer enn 99% (Figur S3) . I tillegg til den SNP matrisen, vi brukte Sanger-sekvensering for å bekrefte 23 utvalgte mutasjoner (tabell S5, fig S5).
(A) Venn-diagram av fangede eksoner fra normale og tumorprøver. Captured eksoner med minst en lese ble talt opp. (B) Representant normalisert dekning-distribusjon plot. Fraksjonen av agn dekket eksoner i genomet oppnå dekning lik eller lavere enn det normaliserte dekning er angitt på x-aksen. Gjennomsnittlig dekning per exon ble delt på gjennomsnittlig dekning av alle eksoner.
Identifikasjon av somatiske mutasjoner i kodende sekvenser for en MSI CRC
Søke etter varianter i kodende områder vi fant 12,767 og 12,518 små atom variasjoner i 6,428 og 6,205 gener, for tumor og normal hhv. Av disse variantene 1,428 for kontroll og 2,404 for tumor har en gjennomsnittlig heterozygositet eller mindre allel frekvens lavere enn 1%, eller har ikke tidligere blitt rapportert i dbSNP eller 1000 genomer Project (figur 2). Siden indels (små innsettinger og slettinger) på homopolymere områder er en viktig kilde til sekvense feil av 454 plattformen vi ignorert denne type endring i våre analyser.
(A) Skjematisk av bioinformatikk SNV deteksjon arbeidsflyt. (B) Utvinning av funksjonelt relevante somatiske mutasjoner for MSI og MSS kolorektal kreft. Varianter ble oppdaget med GS Reference Mapper før de ble filtrert for sin lokalisering, merknader i dbSNP130 eller 1000genomes, somatisk og funksjonelt verdifall. Fra dbSNP130 eller 1000genomes varianter med frekvenser over 1% ble brukt. For MSI CRC 359 varianter og for MSS CRC 45 med spådd endrede protein funksjoner ble identifisert.
Vår somatisk variant deteksjon strategi er designet for å minimere falske positive somatisk variant kaller stedet for å fastslå zygosity. Vi brukte en to-trinns metode med to forskjellige stringens nivåer for å detektere varianter i tumor og godartede vev som ligner på Pleasance
et al.
[18]. I det første trinnet, ble tumor varianter kalt under stringente kriteriene, som ble bestemt ved sammenligning med de SNP genotyping array-data. Det andre trinnet konstatert hvorvidt tumoren varianten var kimlinje eller somatisk. For å holde den feilaktig negative klassifiseringen i benign vev på mindre enn 10%, setter vi dekningen cut-off på 5-ganger, under hvilken ingen konklusjoner ble trukket angående hvorvidt en variant ble somatisk eller germline. Hvis dekningen cut-off var oppfylt, et enkelt lese viser den samme varianten i godartet og svulstvev resulterte i kategorisering av varianten som germline.
Ved hjelp av denne strategien vi identifisert 915 somatiske ikke-synonyme mutasjoner påvirker 864 gener. Flertallet av somatiske mutasjoner var missense mutasjoner (65%). Men mange (7%) er plassert innenfor utranslaterte regioner av gener og kan derfor resultere i endrede ekspresjon eller økt nedbrytning av mRNA-arter. Videre er ca 0,5% av disse mutasjonene funnet på spleiseseter og kunne påvirke spleise hendelser, som fører til en endret transkriptom struktur. I tillegg ble tre somatiske varianter identifisert i miRNA regioner (Tabell S6). Disse mutasjonene er av særlig interesse fordi mirnas har vært innblandet som mester regulatorer av svulst homeostase. Analyse av bestemte typer nukleinsyre varianter, deriblant kjente og ukjente varianter, viste i hovedsak de forventede priser av nukleotid utveksling, som bestemmes av beregninger ved hjelp dbSNP130 (figur S4).
Funksjonell analyse av mutasjoner for en MSI kolon kreft
Siden ikke alle de 1,304 somatiske mutasjoner er sannsynlig å være patologisk relevant, vi søkt å identifisere de som sannsynligvis ødelegge protein funksjon eller påvirke svært konservert aminosyrer og kan derfor være funksjonelt viktig. Vi brukte Polyphen og MutationTaster klassifiseringsverktøy for å forutsi de funksjonelle konsekvensene av aminosyre endringer eller rammeskifte mutasjoner og funnet at 359 gener hadde minst ett potensielt ødeleggende mutasjoner (tabell S1) [22], [23].
Av de potensielt destruktive somatiske mutasjoner, 309 ble plassert i posisjoner høyt konservert i 44 ulike arter, inkludert opossum
(Monodelphis domestica)
, kylling
(Gallus gallus) Hotell og niøye
(Petromyzon marinus )
. Av disse 259 ble plassert i gener som blir uttrykt i tykktarmen, hvorav 47 var reparasjon, reseptor, eller kinase-gener. Visualisering av utvalgte mutasjoner på proteinstrukturer indikerer at disse nukleotidene er på protein overflaten, potensielt resulterer i forstyrret protein-protein interaksjoner.
Katalog av somatiske mutasjoner i Cancer (COSMIC) database er en omfattende samling av kreft relaterte mutasjoner. Omtrent 39% av de muterte gener ble allerede beskrevet i denne database, og 13% ble funnet av Wood
et al product: [10]. I likhet med disse tidligere databaser, fant vi
BRAF
p.V600E mutasjon i MSI saken og vi identifisert
KRAS Hotell og
TP53
mutasjoner i MSS svulst.
BRAF
mutasjoner er funnet i ca 10% av CRC, hovedsakelig MSI og 30 til 35% av alle pasienter med sporadisk kolorektal kreft gjennomføre somatisk
KRAS Hotell og
TP53
mutasjoner. Disse funnene ytterligere demonstrere følsomheten av vår klassifisering strategi.
mutasjons landskapet i en MSS tykktarmskreft
For MSS tykktarmskreft vi identifisert 10,622 små atom variasjoner. Etter de samme fremgangsmåter som filtrering for MSI kreft ved hjelp av dbSNP databasen og data fra de 1000 genomer Prosjekt 1,288 varianter forble som hadde enten lav eller utbredelsen var ukjent. Av disse 198 var somatisk og 45 ble spådd å endre gen-funksjon basert på MutationTaster og Polyphen beregninger (figur 2B, Tabell S2) [22], [23]. I forhold til kopiantall variasjoner fem av de 45 identifiserte mutasjoner befinner seg innenfor forsterkede regionene, og, som forventet, ingen i regioner med delesjoner. Forholdene for leser med henvisning sekvens til mutert sekvensen er ikke over forholdene i kopitall stabile områder som støtter SNV-ringer algoritme.
I motsetning til 1,304 somatiske mutasjoner i MSI svulsten fant vi 198 somatiske mutasjoner i MSS svulst som viser at den defekte MMR-systemet i MSI svulster resulterer i en betydelig økning i mutasjon priser i tykk- og endetarmskreft.
Videre ser i kryss mellom begge krefttypene vi funnet BMPR1A, WDTC1 (WD og tetratricopeptode gjentar en ) og EHD3 (EH-domene som inneholder 3) mutert i begge svulster. Utvalget var basert på funksjonssvikt med høy sannsynlighet i Polyphen og MutationTaster [22], [23]. Alle mutasjoner er plassert på overflaten av proteinet og er sterkt konservert. Siden vi fant signifikante kreft-relaterte reaksjonsveier forbundet bare med BMPR1A men ikke med WDTC1 eller EHD3, og i tillegg til kimlinje-mutasjoner i BMPR1A er en kjent risikofaktor for juvenil polypose syndrom, valgte vi BMPR1A for ytterligere funksjonelle analyser (figur 3, figur S5) . Bruke reporter analyser med villtype og muterte BMPR1A proteiner vi var i stand til å vise at de muterte proteinene blir sterkt svekket i sin signalfunksjon og at stimulering med BNIP2 resulterer i en redusert maksimal aktivitet (figur 3D).
(A ) Proporsjonal Venn-diagram. Brøkdeler av såkalte SNVs identisk med genomene Prosjektfakta og dbSNP130. Bare data for hvilken den marginale allel frekvens eller den gjennomsnittlige heterozygositet var kjent og under 1% ble anvendt for sammenligning. (B) Fordeling av synonymt, missense, tull og mutasjoner som påvirker starte eller stoppe kodon er vist i forhold til alle somatiske mutasjoner. (C) BMPR1A mutasjoner p.W487R og p.E502G er plassert på protein kinase domene av BMPR1A. Referanse aminosyrer i grønt, er de muterte former vises i rødt. Notstrukturen ved venstre nedre side angir den ATP-bindende domene. (D) BMPR1A mutasjoner viser redusert signaleaktivitet. Aktivitet av vekt mBMPR1A, mBMPR1A E502G og mBMPR1A W487R ble bestemt i C2C12 celler ved hjelp av en SMAD-responsive luciferasereportergenet analysen. Indusert Luciferase aktiviteten ble normalisert til Renilla acitivty. Aktiviteten av utransfekterte celler ble satt til 0%, og aktiviteten av wt mBmpr1a ble satt til 100%. Signifikante forskjeller ble beregnet med en tosidig t-test og merket som:. * P≤0.05, ** p≤0.01, *** p≤0.001
MSI kolorektal kreft havnen opp til åtte gangers mer koding somatiske mutasjoner enn MSS kreft
analysene presentert så langt har vært basert på 454 hele exome sequencings av en kolorektal kreft pasient for hver mikro status. For ytterligere å bekrefte at den økte mengden av koding mutasjoner i MSI kreft kan generaliseres, og er ikke på grunn av den teknologien som brukes ( «matrise» berikelse og 454 sekvensering) vi sekvensert de exomes av fire ekstra kolorektal kreft, hver med matchende normalt vev. Denne gangen vi brukte «i løsning hybridisering» for å fange av DNA fulgt av fast sekvensering. Etter de samme filtreringsprosedyrer som er beskrevet for de to første pasientene vi igjen bestemt opp til åtte ganger høyere mutasjon priser for MSI tykktarmskreft enn for MSS kreft (Tabell 3). I denne forbindelse har vi funnet 532 ikke-synonyme somatiske SNVs i ekstra MSI CRC og bare 65, 74 og 76 i de tre MSS CRC tilfeller. Dermed forskjellene i mutasjon priser er reproduserbare og uavhengig av sekvenseringsteknologi som brukes.
Diskusjoner
Ved hjelp av neste generasjons sekvensering, sekvensert vi exomes av MSS og MSI tykktarmskreftpasienter med en gjennomsnittlig dekning på ca 20 ganger. Vi brukte et tosidig klassifisering algoritme for å avdekke funksjonelt relevante mutasjoner. Ved hjelp av denne tilnærmingen, vi viser for første gang at en rekke-fangst NGS ett-trinns arbeidsflyt er et kraftig verktøy for dyp karakterisering av solide svulster og vise at MSI svulster bære åtte ganger mer funksjonelle relevante mutasjoner enn MSS tumorer (figur 2) .
den funksjonelle virkningen av de somatiske variasjoner ble beregnet med to funksjonelle prediksjon algoritmer, Polyphen og MutationTaster, og vi har funnet 359 somatiske mutasjoner for MSI og 45 for MSS kreft som er svært sannsynlig å forårsake funksjonstap [ ,,,0],22], [23]. Den heterogenitet av muterte gener tyder på at ikke en bestemt gen
per se
men det berørte pathway spiller en viktig rolle for tumorutvikling. I denne forbindelse finner vi en betydelig berikelse av mutasjoner i kreft-relaterte reaksjonsveier slik som kreft, cellulær utvikling og DNA-replikasjon, rekombinasjon og reparasjon (tabell S5). Interessant, finner vi 50% av de mest betydningsfulle beriket baner i MSS kreft også som vesentlig beriket trasé for MSI kreft, noe som indikerer at selv om MSI kreft havn et økt antall mutasjoner både kreftformer kan utvikle seg gjennom overlapp pathomechanisms.
Historisk mikro testing i kolorektal kreft var det første forutsigende test for identifisering av en underliggende mismatch reparasjon (MMR) mutasjon. Siden mer enn 90% av arvelige non-polypose kolorektal kreft (HNPCC) viser MSI har mikro status blitt et vanlig diagnostisk markør for MMR. I tillegg har overlevelses fordeler og terapeutiske konsekvenser blitt rapportert hos pasienter med MSI tumorer [5], [24]. Ved hjelp av ultradypt sekvensering av en konservert område, UCR41, de Grassi og kolleger viser at denne regionen har høyere mutasjon priser i HNPCC prøver enn hos friske kontroller og foreslår at dette kan brukes som sensitive molekylær analyse av genomisk ustabilitet [24]. Vi har utvidet sine analyser til hele exomes og fant åtte-fold forskjeller i antall somatisk mutasjon av MSI og MSS kolorektal kreft. Til sammenligning en studie av Greenman
et al.
Som rapporterte om sekvensering av 518 protein kinase gener i 210 ulike kreft hos mennesker funnet en ca 25 ganger høyere mutasjonsraten for MMR-mangelfull kreft [9]. Men disse er fremskrivninger og i motsetning til vår studie inkluderte de svulster fra forskjellige steder og undersøkt alle somatiske mutasjoner uavhengig av deres funksjonelle relevans. Med vår sekvensering tilnærming vi også oppdaget en somatisk
MLH3
mutasjon i MSI svulst, som, selv om
MLH3
mutasjoner ikke tilhører de klassiske MMR mutasjoner i CRC, kan bidra til mikro ustabilitet fenotype [25]. Videre kombinasjonen av MSI og
BRAF
mutasjon, som oppdaget for MSI svulst beskrevet, oftest funnet for CpG island metylering fenotype 1 (CIMP1) svulster som er forbundet med
MLH1
promoter metyleringer [21], [26]. Arrangøren metylering i sin tur er forbundet med genet Slå mekanismer som er tankevekkende som en forklaring på MSI status av svulstene. På den andre siden, er det blitt foreslått at kromosomal ustabilitet (CIN) og CIMP representerer to uavhengige og omvendt relaterte mekanismer for ustabilitet [27]. CIMP-negative tilfeller er forbundet med p53 (71%) og
KRAS plakater (33%) mutasjoner, men er sjelden funnet med
BRAF
(2%) mutasjoner. Siden vi fant store kopinummervariasjoner samt
KRAS Hotell og
TP53
mutasjoner i MSS svulst analysert denne svulsten er mest sannsynlig CIMP-negative [5], [24].
sekvensering og analyse strategi som er presentert kan være basis for fremtidige klassifiserings verktøy for kolorektal kreft fordi det kan gi en parallell deteksjon av en økning i mutasjonsfrekvens MSI tumorer, så vel som deteksjonen av den underliggende MMR defekten. I tillegg var vi i stand til å detektere mutasjoner av gener ofte forbundet med visse undergrupper av kolorektal kreft som
BRAF, KRAS Hotell og
TP53
. Innenfor våre prioriterte gener, som omfatter alle gener som passerer alle utvalgs filtre,
BMPR1A
skiller seg ut som mutert i begge tilfeller. Den generelle strukturen viser at de muterte aminosyrer er alle plassert ved den C-terminale intracellulære heliksbunt på protein kinase domene og antyder at protein-protein interaksjoner blir ødelagt [28]. Kimcellelinje
BMPR1A
mutasjoner disponere for juvenile polypose syndrom; imidlertid våre funn tyder på at også somatiske mutasjoner kan spille en viktig rolle i sporadisk kolorektal kreftutvikling [29], [30], [31], [32], [33].
I tillegg til disse mutasjonene har vi også identifisert flere muterte kreft narkotika mål eller gener som er assosiert med behandlingsresultat, inkludert
BRAF, KRAS, FGFR2 Hotell og
mTOR
, som kan bidra til å velge optimale medikamentkombinasjoner. Som slike lignende målrettede re-sekvense tilnærminger og bioinformatikk filtrering strategier kan bli en gullstandard for individuelt tilpasset kolorektal kreft behandling i fremtiden.
Materialer og metoder
Etikk erklæringen
studien er godkjent av etisk komité Medical University of Graz. For nye prøver pasienter har gitt sitt skriftlige samtykke. For gamle prøver (15 år gammel) uten informert samtykke var tilgjengelig, derfor alle prøvene og medisinske data som brukes i denne studien er irreversibelt anonymisert.
Case presentasjon og vevsprøve samling
Pasient 1 hadde en høy grad (G3) adenokarsinom i proksimale colon, iscenesatt pT-3C, pN-0, pM-X, PR-0, mikro ustabil (figur 1A). I tillegg ble dette tilfelle valgt på grunn av dets kromosomale stabilitet, som bestemt ved anvendelse av genom-wide neste generasjon sekvensering (NGS) (figur 1B). Pasient 2 hadde et høyverdig (G3) adenokarsinom i proksimale colon, iscenesatt PT-4B, PN-2, PM-X, mikro stabil.
Menneskelig vev oppnådd under operasjonen var snap-frosset i flytende nitrogen . Frysesnitt (3 mikrometer tykk) var forberedt og farget med hematoksylin og eosin å evaluere tumor celleinnhold. Disseksjonene ble utført under mikroskop for å oppnå en tumorcelle-innhold av 80%. DNA ble utført ved hjelp av QIAamp DNA Mini Kit (Qiagen), i henhold til produsentens instruksjoner.
Hele Exome DNA berikelse og Genome Sequencer FLX sekvense
Genomisk DNA fra begge vev ble utsatt for hele exome sekvens fangst ved bruk av Roche /NimbleGen sin 2.1M Menneskelig Exome Array. Denne tabellen er basert på bygge 36,3 av det humane genom-sekvensen, og fanger de kodende regioner av 16,755 NCBI RefSeq gener (ca. 180 000 kodende eksoner) samt 493 miRNA regioner. Tumor og normalt DNA vev ble utsatt for hele exome sekvens fange i henhold til produsentens protokoll. DNA ble skåret ved forstøving å fragmentere størrelser under 800bp, rengjøres (Zymo Research) og end-polert hjelp T4 DNA Polymerase og T4 polynukleotidkinase. Linker adaptere pSel3 (5 «- CTCGAG AAT TCT GGA TCC TC – 3») og pSel4-P (5 «- Phos /GAG GAT CCA GAA TTC TCG AGT T – 3») ble ligert og størrelse utvalg ble utført ved hjelp av AMPure DNA Purification perler (Agencourt). Kvaliteten ble kontrollert med Bioanalyzer system. LM-PCR ble utført med LMPCR3 primere (5 «- CUC UCU GAG AAU GGA UCC UC – 3») før den bibliotek ble anvendt for hybridisering ved 42 ° C i 72 timer. Matriser ble vasket to ganger ved 47,5 ° C, to ganger ved romtemperatur og to ganger ved 42 ° C med vaske-buffere som anbefalt. Bundet genomisk DNA ble eluert med 125 mM NaOH i 10 min ved romtemperatur og ble amplifisert ved LM-PCR ved anvendelse av primere LMPCR3. Captured amplifiserte prøver ble utsatt for kvantitativ PCR for å måle den relative berikelse.
beriket NimbleGen DNA ble brukt til å konstruere enkeltkjedet Genome Sequencer FLX (454 /Roche) biblioteker. Etter emulsjon PCR sekvenseringsprimere ble bundet til malen og kulene ble inkubert med Bst-DNA-polymerase, apyrase, og enkeltkjedet bindingsprotein. Pyrosekvensering ble utført på en 70 × 75 mm picotiter plate i 13 separate sekvense går. Etter standard rå databehandling, ble en resequencing trimming filter som brukes for å øke datautgang. (Parametere brukt: doValleyFilterTrimBack = false, vfBadFlowThreshold = 6, vfLastFlowToTest = 168, errorQscoreWindowTrim = 0,01)
For sekvense vi utført 13 Genome Sequencer FLX går, som produsert over 558 millioner baser og 1.43 million leser per løp. . Leser ble justert til den menneskelige referansen genom, NCBI bygge 36 (https://hgdownload.cse.ucsc.edu/goldenPath/hg18/), ved hjelp av GS Reference Mapper versjon 2.0.0.12 (Roche). De beste kamper i genomet ble brukt som lokasjon for den leser med flere kamper. Bare unike lyder med en minimum lengde på 50 bp ble brukt for videre analyse (se kjøre statistikk Tab. 2).
Påvisning av varianter ble utført med GS Reference Mapper versjon 2.0.0.12 (Roche). Redundant leser ble trukket før variant kall. Bare den HCDiff (høy pålitelighets forskjeller) til GS Mapper programvare ble anvendt som basis for deteksjon variant [20]. HCDiff kall anta minst tre leser med varianten med både forover og bakover leser inkludert; alternativt kvalitetspoeng på de variable posisjoner må være over 20 (eller over 30 hvis et homo av fem eller flere baser er involvert). Som flere kvalitetskriterier vi brukte bare varianter med en dekning . 10 × av høy kvalitet leser
Hele Exome «i løsning» DNA berikelse og solid sekvense
enrichments og solid bibliotek forberedelse ble utført ifølge Agilent atVelg Target berikelse protokoll for Applied Biosystems solid system. I korte trekk, ble hele genomisk DNA skåret og slutt reparert. For adapter ligations 30x overkant av kortene ble brukt. Størrelsene for 150-200 bp DNA-fragmenter ble utført etterfulgt av en nick-oversettelse og forsterkning takt med Platinum polymerase (Invitrogen) og PFU-polymerase (Fermentas). For hybrid utvalg bibliotekene ble justert til 500 ng i 3,4 mL volum og lagt til atVelg Block løsninger. Hybridiseringer ble utført i 24 timer ved 65 ° C, ble hybrider ekstrahert med 500 ng M-280 streptavidin Dynabeads (Invitrogen) og til slutt eluert med 50 ul elueringsbuffer. Etter forsterkning med platina-polymerase bibliotekene ble kvantifisert ved qPCR og DNA-konsentrasjonen ble titrert for å oppnå en fraksjon på 10-20% monoklonalt mal perler i emulsjonen PCR ved anvendelse av i alt 0,7 til 1 milliarder perler. Påfølgende perle berikelse og avsetning på 130 millioner perler per kvartal lysbilde (quad) ble etterfulgt av standard 50 bp fragment går. Hver av de fire pasientprøver ble analysert på en enkelt kvadrant
Mapping ble utført med Bioscope innretting rørledningen ved hjelp av frø utvide algoritmen med en mismatch straff poengsum -2,0. Enkelt nukleotid-varianter (SNV) ble kalt med den DiBayes algoritmen integrert i Bioscope pakken.
enkelt nukleotid-variant (SNV) deteksjon
Tissue materialer ble genotypet på Affymetrix 6,0 array, ifølge produsentens protokoll. Array stillinger med et kvalitetspoeng (p-verdi) 0,1 ble brukt til sammenligning med sekvensering av data. Sekvensedataposisjoner ble brukt om deres dekning oversteg tre ganger. Dette genererte 46.000 og 49.000 stillinger for svulst og godartet vev, henholdsvis, som var kvalifisert for sammenligning. For å finne ut falske positive og falske negative priser, setter vi tabelldata som standard og skilte mellom referansesamtale og SNP samtale avhengighet av tabelldata.
For deteksjon av somatiske varianter, ble en bimodal strategi påføres med svulst variantene kalles etter strenge kriterier, mens varianter i kontrollen vev ble kalt bruker mindre strenge kriterier: et minimum terskel for leser ble satt med varianter av 15% av alle lyder på en gitt posisjon i tumor. Mindre strenge kriterier ble brukt for å kalle kontroll vev varianter med et minimum av en variant lese og et minimum dekning cutoff av 5. For dekning over 30 ganger en variant lese ble godtatt.
Capillary Sekvense
Oppfølging bekreftelse av identifisert SNVs ble utført på en ABI 3730 (Applied Biosystems) kapillær sekvense instrument følgende standard prosedyrer.
Fastsettelse av kopinummervariasjoner
Klargjøring av enkle lese biblioteker og sekvensering var utføres ved hjelp av Solexa sekvenseplattform (GenomeAnalyzer IIx, Illumina) etter produsentens anvisninger. Bildeanalyse og basen kall ble utført ved hjelp av Firecrest 1.9.5_14 og Bustard 1.9.5_14 og leser ble justert til det menneskelige genom (NCBI36) med Bowtie 0.9.7.1 [34]. Kopier nummer analyse ble gjort i R bruker DNAcopy pakken [35]. Kort sagt, DNA lese frekvensene ble bestemt for hyller av 50 Kb. Den log2 frekvensforhold av samsvarende hyller ble beregnet for tumor mot normalt vev. Median av forholdstall var sentrert til null eksperiment klok. Logg forhold ble glattet ved DNAcopy med standardverdier og kopiere nummer variasjon ble oppdaget av DNAcopy hjelp av en terskel på to standardavvik.
Genotyping på Affymetrix 6,0 matrisen ble utført i henhold til produsentens protokoll. Regioner med kopi nummer gevinst og tap ble bestemt av paret og analyse ved hjelp Hidden Markov Model (HMM) av Partek Genomics Suite-programvaren (Partek Inc, St.Louis, MO) med standard parameterinnstillingene. For paret analysen ble kopitallverdier som genereres ved å sammenligne svulst og vev profiler godartede fra samme pasient.
Bioinformatikk arbeidsflyt
For hvert vev, ble variasjoner kommentert ved hjelp av genet modellene generert av Ensembl ( ensembl 54.36, www.ensembl.org). Alle varianter ble kartlagt alle transkripsjons modeller, noe som førte til flere merknader for flere loci. For eksempel kan en variant føre til en aminosyreforandring i en transkripsjon og vises i UTR av en annen.