Abstract
CAPAN-en er en godt karakterisert
BRCA2
-deficient human cellelinje isolert fra en levermetastaser av en bukspyttkjertelen adenokarsinom. Her rapporterer vi et genom-wide vurdering av strukturelle variasjoner og høy dybde exome karakterisering av single nucleotide varianter og små innsetting /slettinger i CAPAN-en. For å identifisere potensielle somatisk og tumorassosierte variasjoner i fravær av et samsvar-normal cellelinje utviklet vi en ny fremgangsmåte basert på analyse av HapMap prøver. Vi viser at CAPAN-1 har en av de rearrangerte genom sekvensert hittil. Videre er små innsettinger og delesjoner påvist oftere i sammenheng med korte sekvensen gjentas enn i andre genomer. Vi identifiserer også en rekke nye mutasjoner som kan representere genetiske endringer som har bidratt til tumorprogresjon. Disse dataene gir innsikt i de genomiske effekter av tap av BRCA2 funksjon
Citation. Barber LJ, Rosa Rosa JM, Kozarewa jeg, Fenwick K, Assiotis jeg, Mitsopoulos C, et al. (2011) Omfattende Genomisk analyse av en
BRCA2
Mangel Menneskelig kreft i bukspyttkjertelen. PLoS ONE 6 (7): e21639. doi: 10,1371 /journal.pone.0021639
Redaktør: Robert Oshima, Sanford-Burnham Medical Research Institute, USA
mottatt: 17 mars 2011; Godkjent: 03.06.2011; Publisert: 05.07.2011
Copyright: © 2011 Barber et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Forfatterne takker gjennombrudd brystkreft, Cancer Research UK, og American Association for Cancer Research /Stand Up til kreft for å finansiere dette arbeidet. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
personer heterozygote for tap av funksjon mutasjoner i tumor suppressor genet
BRCA2
er høyt disponert for en rekke ulike kreftformer. Kvinner som arver en mutant
BRCA2
allelet har en betydelig sterkt forhøyet levetid risiko for å utvikle brystkreft og eggstokkreft [1]. I tillegg er mannlige bryst og prostata kreft sterkt assosiert med
BRCA2
genmutasjoner [2]. I begge kjønn,
BRCA2
mangel øker risikoen for å utvikle kreft i bukspyttkjertel, mage, galleblæren og galleveier, samt melanomer [3]. Behandling av kreft i bukspyttkjertelen presenterer betydelige utfordringer som de fleste pasientene stede med lokalt avansert eller metastatisk sykdom og konvensjonelle anticancer behandling viser begrenset effektivitet; bare 5% av pasienter med kreft i bukspyttkjertelen overleve utover fem år fra den første diagnosen [4], [5].
BRCA2 spiller en sentral rolle i opprettholdelsen av genomisk integritet, særlig gjennom regulering av DNA-reparasjon ved homolog rekombinasjon reparasjon (HR) [6] en prosess som også kontrolleres av en annen tumor suppressor protein, BRCA1 [7]. HR er en stor grad feilfri prosess som gjenoppretter den opprinnelige sekvensen på stedet av en DNA dobbel-tråd pauser (DSB sin) [8]. DSB sin oppstår forholdsvis ofte, og kan være forårsaket av normal cellulær replikasjon så vel som eksogene stress som eksponering for ioniserende stråling [9]. I fravær av HR, for eksempel på grunn av tap av BRCA2 funksjon, DSB sin ser ut til å bli reparert ved mer utsatt for feil prosesser som til slutt fører til opphopning av brutto kromosomale rearrangementer [10]. Det er antatt at utnyttelse av utsatt for feil DNA reparasjonsprosesser i fravær av BRCA2 funksjon mest sannsynlig fremmer tumorgenesen [10]. Som en del av sin rolle i HR, styrer BRCA2 lasting og fjerning av DNA recombinase RAD51 på DSB sin. Den resulterende RAD51-ssDNA filament formidler søk etter en homolog DNA-sekvens til mal reparasjon av DSB [11].
Til tross for den store interessen i BRCA2 funksjon og dens rolle i tumorgenesen og DNA-reparasjon, er det få tumorcelle modeller av BRCA2-mangel som kan brukes produktivt i laboratoriet. Av disse CAPAN-en er den mest godt karakterisert. CAPAN-en ble avledet fra en levermetastaser i en 40-år gammel hvit mann med en primær bukspyttkjertelen adenokarsinom [12], [13]. Disse cellene mangler funksjonelt
BRCA2
allel og i stedet bære en
c.6174delT
allel. De enkeltstående basedelesjon på
c.6174
bevirker en rammeskifte, (p.S1982fs * 22) som resulterer i tap av de C-terminale 1416 aminosyrer av proteinet [14], [15]. Den resulterende avkortede protein mangler to BRC motiver som er involvert i interaksjonen mellom BRCA2 med RAD51 og ssDNA [16], så vel som C-terminale sekvenser som antas å være nødvendig for nukleær lokalisering av BRCA2 og RAD51 /DNA demontering [17], [18] . Dette avkortede BRCA2-isoformen er blitt vist å være både cytoplasmisk og dysfunksjonell i HR [19], [20]. I tråd med konseptet som BRCA2 dysfunksjon fører til genomisk ustabilitet, har SKY karyotype analyse viste at CAPAN-en besitter en hypotriploid genom, med 36 definerte strukturelle rearrangements fordelt over hele genomet [21]. De fleste av disse rearrangementer er sannsynligvis svært komplisert og synes å involvere mer enn tre kromosom segmenter, selv om to motstående trans (t (6; 15) og t (7; 10)) er blitt beskrevet (www.path.cam.ac. uk /~ pawefish).
Gitt betydelig bruk av CAPAN-en cellelinje som modell ikke bare av BRCA2 dysfunksjon, men også for kreft i bukspyttkjertelen, brukte vi neste generasjons sekvenseringsteknologi for å studere genomisk sekvens av dette cellelinje.
Resultater
DNA-sekvensering strategi
for å identifisere kandidat strukturelle rearrangements vi først genererte en middels dybde hele genomsekvens av CAPAN-en. Vi isolert DNA fra en CAPAN-1 celler, og genererte et 500 bp fragment DNA bibliotek ved hjelp av en PCR-fri tilnærming som forbedrer bibliotek kompleksitet [22]. Denne DNA-bibliotek ble sekvensert ved hjelp av en sammenkoblet-end strategi på en Illumina GAIIx Genome Analyser, noe som ga 365 811 868 raw 76 bp kompis-paret leser (27,8 Gb). Etter justering til en referanse humane genom (hg19 /build37) og den etterfølgende filtreringsprosess for å fjerne PCR duplikater og dårlig kvalitet leser, dette ga tilstrekkelig genomet dekning (90,09%) for studiet av strukturelle rearrangementer, ved en median dybde av 8,55 fold (tabell 1; Tabell S1).
for å undersøke den kodende sekvensen av CAPAN-en i større dybde, brukte vi en målrettet berikelse strategi basert på Agilent atVelg in-løsning fangst. Vi utnyttet atVelg Menneskelig All Exon kit, designet for å fange større enn 38 MB humant genomisk DNA tilsvarer NCBI Consensus CDS database. To uavhengige fangsthybridiseringer ble utført på omtrent 200 bp fragmenter av CAPAN-en genomisk DNA. De resulterende exome bibliotekene ble sekvensert på en Illumina GAIIx hjelp parvise end 2 × 76 bp sekvense går. Dette ga 130310847 rå leser (9,9 Gb). På samme måte til hele genomet analyse, leser sekvensen fra renseprosessen ble justert til en referanse humane genom (hg19 /build37) ved anvendelse av Burrows-Wheeler Aligner (BWA, [23]), og deretter filtrert for å fjerne PCR duplikater og dårlig kvalitet leser. Prosentandelen av lyder på målet var 65%, og nådde en endelig dekning av 98,51% for de agnet regioner med en median dybde av 89 ganger (tabell 1, Tabell S2), som langt overskrider 30 ganger dybden som kreves for å identifisere genetiske varianter i tumorprøver [24].
for både hele genomet og exome sekvense strategier, mer enn 80% av lesninger ble justert i forbindelse med deres respektive kompis-par (tabell 1). I tilfelle av hele genomet resekvensering, 5,63% av lesninger kartlagt til et annet kromosom i forhold til sin partner-par, og en ytterligere 10,31% av lesninger ble foreldreløse, det vil si hvor mate-paret ikke klarte å justere på grunn av overdreven N eller uoverensstemmelser /indels (tabell 1). Dette støtter tidligere lav oppløsning spektrale Karyotype analyser (SKY) av CAPAN-en som foreslår en svært omorganisert genom [21]. For exome sekvens, litt færre lesninger ble justert uavhengig av deres mate-pair enn for hel-exome sekvensering, kanskje noe som tyder på at rearrangementer innenfor den kodende regionen forekom mindre hyppig i CAPAN-1 enn i ikke-fremkallende regioner (tabell 1).
Sequence dybde over hele genomet ble sammenlignet med data generert av matrisen sammenlignende genomisk hybridisering (aCGH) (fig. S1, Tabell S1). Generelt er den midlere dybde for hvert kromosom identifisert ved sekvensering tilpasset kopiantallet profilen genereres av aCGH (fig. S1). For eksempel, kromosomer eksempel 4 og 6, som ved aCGH så ut til å være til stede i to eksemplarer, overveiende selv viste dybde over hele sin lengde. I tillegg løssalgs X-kromosomet returnert omtrent halvparten så mange leser kromosomer 4 og 6. tidligere rapportert [21], [25] homozygot sletting av 9p21 involverer
CDKN2A
, og tap av flertallet av kromosom Y, ble også bekreftet ved sekvensering. (Figur 1A, fig. S1, Tabell S1)
A. Genome-wide Circos plott av rearrangements identifisert i CAPAN-1 av breakdancer analyse. En ideogram av en normal karyotype, er vist i den ytre ring, og kopiantall er representert ved den blå linje i de midterste ringene. Den relative posisjon og klasse av hver enkelt rearrangement er avbildet i den indre sirkel, slik det er beskrevet i tegnforklaringen. B. Sammenligning av det totale antall inter- og intra-kromosomale rearrangements oppdages av breakdancer analyse i et panel av
BRCA2
,
BRCA1
, og ikke-
BRCA
mutert cellelinjer og primære svulster. C. Prøvene ble klassifisert som
BRCA
-mutated (Mut) eller BRCA villtype (wt), og antall inter-, intra-kromosom, og totalt rearrangements ble sammenlignet. p-verdiene refererer til Mann Whitney analyse med Gaussian tilnærming. D. Sammenligning av den prosentandel av hver klasse av omleiring i hver prøve. Prøvene er klassifisert som
BRCA2
,
BRCA1
, og ikke-
BRCA
mutert, som i B.
Strukturell variasjon
for å identifisere kandidat strukturelle rearrangements, analyserte vi hele genomsekvens av CAPAN-en ved hjelp av Breakdancer [26]. Vi brukte en streng filtrering metode som bare er identifisert rearrangements støttes av minst ti leser (medianen dybde over genomet var 8.55x). Denne tilnærmingen identifisert 354 store strukturelle variasjoner i CAPAN-1, som var sub-klassifiseres som intrachromosomal delesjoner, insersjoner, inversjoner eller inter-kromosomale direkte eller inverterte trans (Fig. 1A). Det er ingen innsettinger ble påvist i denne analysen, siden de alle falt innenfor grensene for normal fragment størrelsesfordeling (1-1000 bp).
Gitt at CAPAN-1 er en BRCA2 mangelfull modell, undersøkte vi muligheten for at mediet dybde, kan hele genomet sekvensering brukes for å skille BRCA1 og BRCA2 mangel tumorer fra ikke-familiære former. Hittil har to BRCA2 mangelfulle svulster, to BRCA1 mangelfulle svulster, og to BRCA1 mangelcellelinjer også vært utsatt for middels dybde hele genomsekvensering, som en del av en større studie av primære brystsvulster og cellelinjer [27]. Vi har innhentet rådata fra denne studien [27], og behandlet det gjennom vår egen rørledning, som inkluderte analyse med breakdancer. På denne måten kunne vi direkte sammenligne frekvensen og type strukturelle rearrangements identifisert i CAPAN-en med både BRCA mangelfull og dyktig primære brystsvulster og cellelinjer (Fig. 1B-D). Av alle genomer studert, CAPAN-en viste de strukturelle rearrangements, både internt og intrachromosomal (Fig. 1B). Selv om prøvenummer under studien var relativt lav (n = 7
BRCA
muterte tumorer versus n = 15 ikke
BRCA
muterte tumorer) sammenligning av CAPAN-1 data med data fra
BRCA2
muterte primære brystsvulster og
BRCA1
muterte primære brystsvulster og cellelinjer gjorde foreslår en trend for BRCA mangelfulle prøver å vise større antall strukturelle rearrangements, (median antall for
BRCA
mutante svulster = 72 rearrangements, median nummer for ikke-
BRCA
muterte tumorer = 41, fig. 1C), i samsvar med de rollene som BRCA1 og BRCA2 i å opprettholde genomisk stabilitet. Selv om denne observasjonen var ikke statistisk signifikant (p = 0,1368, Mann Whitney), dette kan tilskrives den lave prøvestørrelsen. Videre, som mutasjoner i andre enn gener
BRCA1 Hotell og
BRCA2
påvirker HR, er det fullt mulig at noen av prøvene klassifisert som «ikke-
BRCA
» kunne også har en lignende HR mangel på
BRCA1 /2
muterte tumorer. Prosentandelen av det totale rearrangements i hver klasse ble også sammenlignet på tvers av
BRCA
-mutant og ikke-mutante grupper (Fig. 1 D). I CAPAN-1, som i de fleste av de andre genomer, intrachromosomal delesjoner var de mest hyppig klasse av omleiring. Men det var ingen klar type eller mønster av rearrangements som var bestemt til
BRCA
-mutant celler, basert på denne lite sett av prøver.
En rekke grove strukturelle rearrangements har tidligere blitt identifisert i CAPAN-en ved hjelp av spektral karyotype (SKY) analyse [21]. Imidlertid er oppløsningen av SKY analyse relativt lav, og i mange tilfeller koordinere posisjonene til mange av de antatte rearrangements identifisert med denne formen for analyse kan ikke forutsies med noen stor tillit. Gitt dette, vi bare prøvde en komparativ analyse av NGS data med SKY data hvor koordinere posisjoner SKY spådd rearrangements kunne gjøres innenfor ~ 10 Mb. Denne sammenlignende analyse antydet at seks av de tidligere identifiserte rearrangementer kan også bli identifisert ved hjelp av hele genomet sekvensering, men ved høyere oppløsning (tabell 2). En ytterligere kompleks omleiring mellom kromosomene 6, 8, og 17 hadde tidligere blitt foreslått av SKY analyse, men ikke i tilstrekkelig detalj for å belyse den nøyaktige områder av hvert kromosom som er involvert. Vår analyse også foreslått komplekse trans mellom kromosomer 6 og 8, og mellom 8 og 17 (tabell 2).
Interessant nok elleve av de identifiserte interchromosomal rearrangementer identifisert i CAPAN-1 viste seg å falle sammen med fremkallende regioner på begge stoppunkter, potensielt tyder genet fusjonsbegivenheter (Tabell 3). Ingen av disse fusjonene har tidligere blitt rapportert i Cancer Genome Census [28]. En ytterligere 42 rearrangementer ble innenfor et gen eller oppstrøms- regulatoriske områder ved en stoppunkt, som også kan ha skadelige virkninger (Tabell S3). En av disse rearrangements hadde en stoppunkt i et gen,
ZNF521
, som nylig ble identifisert som gjenstand for translokasjon i akutt lymfatisk leukemi [29]. En ytterligere 118 gener syntes å bli påvirket av intrachromosomal rearrangements (tabell S4).
Exome enkelt nukleotid variant (SNV) og Indel oppdagelse
For å identifisere SNVs og små innsetting /sletting ( Indel) hendelser i den kodende sekvensen av CAPAN-en, brukte vi SAMtools [30] for pile-up analyse av high-dybde exome sekvensen og påfølgende SNV ringer. Små indels (1-6 bp) ble identifisert ved hjelp av en tilpasset rørledning (se Methods). Større Indel Funnet ble oppnådd ved hjelp Pindel [31]. I første omgang ble det varianter filtrert for å ekskludere de oppdaget i en dybde på mindre enn ti leser per eksemplar. SNVs og indels referert som generelle befolknings polymorfismer i dbSNP ble også sett bort fra, som vi var stort sett interessert i identifisering av sannsynlige kreftspesifikke endringer.
I likhet med flertallet av tumorcellelinjer utvunnet, ikke CAPAN-en ha en tilpasset normal cellelinje fra samme pasient som kan brukes til å hjelpe med å identifisere kreftspesifikke endringer og fjerne artefakter som følge av både prøveproduksjon og oppstilling. I lys av dette, har vi utviklet en prosess med filtrering for exome resequencing, basert på kryss sammenligning med data fra den analoge prøveopparbeidelse og analyse av fire normale genomet HapMap prøver (NA11881 (hann), NA12761, NA12813, og NA12892 (kvinnelig )) (tabell S5). Ved hjelp av disse HapMap prøvene, var vi i stand til å fjerne gjenstander som følge av både prøveproduksjon (f.eks variasjon i hybridisering effektivitet) og justering (f.eks homologe regioner).
Analyse av data fra exome resequencing av HapMap prøvene aktivert oss til å sette grenser for homozygosity (variant leser 88% eller 10% totalt) og heterozygositet (variant leser 33-67% totalt) varianter. Disse terskelverdier ble anvendt for å filtrere de identifiserte SNVs og indels i CAPAN-1 genomet. Videre, som vi var interessert i å identifisere kandidattumorspesifikke mutasjoner, oversett vi alle mutasjoner som også ble avdekket i de HapMap prøvene, som et tilnærmet normalisering for sannsynlig germline variasjon.
Som en ytterligere grad av stringens vi også disse er vurdert kopi nummeret endres over CAPAN-en genom, som definert av aCGH analyse. Dette er spesielt relevant for høyt rearrangerte og aneuploide genomer, for eksempel CAPAN-1. Basert på vår erfaring, bruk av regionspesifikke filtre for sekvense dybde muliggjør mer pålitelig variant identifikasjon. Åpenbart heterozygote variantene kalles i løssalgs regioner vil trolig være falsk (mest sannsynlig på grunn av forskyvning), og andre steder, leser antall bærer variant allel kan svinge forskjellig avhengig av kopiantall status. Derav sannsynlighetsterskler ble påført på både SNV og Indel oppdagelse, som krever et minimum av 10 leser per genomisk kopi. I tillegg leser minst tre variant var nødvendig å ringe en SNV og minst syv variant leser for indels, per genomisk kopi. Den resulterende katalog av SNVs og indels identifisert i CAPAN-en er beskrevet i tabellene S6 og S8, henholdsvis.
Karakterisering av koding SNVs
Brønn throughput kandidat gensekvensering studier i CAPAN-en har tidligere identifisert tre homozygot SNVs i
KRAS
,
SMAD4 Hotell og
MAP2K4
. Ved hjelp exome sekvensering, var vi i stand til å oppdage alle disse tre endringer:
KRAS
c.35G T mutasjonen som forårsaker klinisk relevant p.G12V aminosyresubstitusjon [32], [33], c .1028C G SNV i
SMAD4
som resulterer i en tidlig stopp kodon [34] og
MAP2K4
c.661G T mutasjon i CAPAN-en, noe som fører til en kreft-assosiert protein avkutting [35]. Utseendet til alle tre av disse mutasjonene i den endelige filtrerte listen over exome varianter, ga tillit til våre analyse rørledninger (Tabell S6).
Ved hjelp av høy-dybde exome sekvense identifiserte vi totalt 608 SNVs i CAPAN -1 som påvirker 1270 forskjellige transkripsjoner (tabell 4). De fleste mutasjoner (61%) ble funnet i ikke-kodende regioner (ikke-kodende gener eller introner), eller var synonyme varianter. Tjuefire prosent av de berørte transkripsjoner ble endret av ikke-synonyme koding endringer. Totalt ble det ikke synonymt SNVs oppdaget i 206 forskjellige gener, 56 av disse var homozygot (Tabell S6). Tolv gener fått premature stoppkodoner, hvorav fire var homozygot (
GRIA3
,
GRM1
,
MAP2K4
,
SMAD4
). Betydelig, antallet av mulige somatiske koder mutasjoner detektert for CAPAN-1 i denne studien svært gunstig sammenlignet med de som er vist i tidligere studier som undersøker de tumorcellelinjer COLO-829 (172 ikke-synonyme SNV) [36] og NCI-H209 (94 ikke-synonyme SNV) [24]. Begge disse tidligere studier identifisert somatiske mutasjoner ved sammenligning med en tilpasset normale blod-DNA kontroll fra den samme pasient, noe som tyder på at vår bruk av HapMap exomes er et effektivt alternativ for identifisering av somatiske mutasjoner i CAPAN-1, og andre «orphan» cellen linjer
Tre av romanen potensialet avkorting mutasjoner ble valgt for validering av Sanger-sekvensering.
GRM1 product: (
c.C1458A
, p.Y486 *),
SMAP2 product: (
c.C764G
, p.S255 *), og
GLT6D1 product: (
c.G593A
, p.W198 *). Alle tre ble vist seg å være sanne SNVs, og zygosity oppdaget av exome sekvensering ble også bekreftet av Sanger-sekvense: homozygot for
GRM1
, heterozygot for
SMAP2 Hotell og
GLT6D1
(fig. 2A-C).
GRM1
koder for en metabotrop glutamatreseptor, avvikende ekspresjon av dette har blitt foreslått å spille en rolle i utviklingen av melanom [37]. SMAP2 er en ARF1 spesifikk GTPase aktiverende protein som er involvert i clathrin avhengig membran trafficking [38].
GLT6D1
genet koder for en som ennå ukarakterisert glykosyltransferase-6-domene som inneholder protein.
A. Kromatogram som viser stopp-gain SNV i
GRM1
oppdaget for CAPAN-en. Protein og genomisk referansesekvenser er vist ovenfor kromatogrammet. Den SNV er uthevet i blått i referansesekvensen, og påvirket resten blir understreket. B. Som A, for
SMAP2
. C. Som A, for
GLT6D1
. D. Sammenligning av enkeltbasesubstitusjon frekvenser i CAPAN-en, basal-lignende bryst svulst, NCI-H209, Colo-829, og U87 MG genomer. E. Sammenligning av hele genomet og exome spesifikke basesubstitusjon frekvenser observert i CAPAN-en.
Alle de nye SNVs identifiserte her ble kryss-referert med en rekke elektroniske databaser (sile [39 ], [40], Mutation forsmak [41], [42], DAVID [43], [44], CGC [28], [45]) for å forutsi deres evne til å modifisere protein funksjon. En av de mest interessante kandidatene var en homozygot c.
C162A
mutasjon i
FZD10
, et medlem av frizzled genet familie som koder Wnt ligandbindende reseptorer [46]. Homozygot
c.C162A
variant påvist i denne studien fører til en aminosyre substitusjon ikke synonymt (p.N54K) på en svært bevart rester innenfor den antatte Wnt ligand-bindingssetet (FZ domene) [47] [48]. FZD10 er en positiv regulator av Wnt-βCatenin-TCF signalveien, har vist seg å være oppregulert i primær kolorektale tumorer [49], og Wnt-beta catenin signalering er kjent for å være avvikende i noen pankreas adenokarsinomer [50].
Tre homozygote varianter var til stede i tumor suppressor
DCC product: (
Slettet i Kolorektal Carcinoma)
, som koder for et netrin reseptor som er nødvendig for celledifferensiering [51], og også induksjon av apoptose i fravær av ligand [52]. Mutasjoner og tap av
DCC
tidligere har vært implisert i bukspyttkjertelkreft, så vel som en rekke andre tumortyper [52], [53]. En av de tre nye varianter detektert i CAPAN-1 ble plassert i donorspleisesetet av intron 20-21, fire baser nedstrøms for det kritiske motiv GT. De to andre variantene ga opphav til ikke-synonyme protein mutasjoner (p.L1042 M og p.K1411T). Selv om ingen av disse sistnevnte ikke-synonyme mutasjoner har tidligere blitt rapportert, er begge plassert nær rester av interesse: p.F1039S, mutert i adenokarsinom [54]; og p.Y1418, en kritisk rester fosforylert av Fyn, og nødvendig for DCC funksjon [55].
kryssreferanser av SNVs påvist i CAPAN-en med Kreft Gene Consensus (CGC) [28], [45] identifisert tolv gener som tidligere har vist seg å være mutert ved andre rester i cancercellelinjer eller primære svulster. Ingen av de varianter som er identifisert i CAPAN-1 i denne studien er tidligere beskrevet. Men de fleste av disse endringene var ikke-koding eller synonyme endringer (Tabell S7). En heterozygot ikke synonymt mutasjon ble observert i genomet stabilitet sjekkpunkt faktor
Ataxia telangiectasia mutert product: (
ATM
). Imidlertid varianten rest (p.R1585S) ligger utenfor eventuelle kjente funksjonelle domener, og det er derfor vanskelig å forutsi de funksjonelle konsekvenser av denne endringen. En annen roman heterozygot ikke synonymt mutasjon ble identifisert i
TPR product: (
translocated Arrangøren omegn), som koder for et protein som samhandler med kjernefysiske pore kompleks. Denne mutasjonen (p.V779I) omfatter en konservert rest innenfor et kjent motiv som er felles for kromosom segregering proteiner, selv om valin til isoleucin substitusjon identifisert her er sannsynlig å være nøytral.
Mønstre av basesubstitusjon
Vi ønsket å vurdere om mønsteret av enkle basis erstatninger i CAPAN-en reflektert som av andre kreft genomer. De tidligere publiserte human cellelinje genomer, Colo-829 [36], og NCI-H209 [24] hver utstillingen et karakteristisk mønster av base erstatninger, representant for UV og tobakk kreftfremkallende eksponering, henholdsvis. Vi oppnådde data fra disse studiene, i tillegg til den av glioblastoma cellelinje U87 MG [56], og en basal-lignende brysttumor [57], for sammenligning med CAPAN-1. Komparativ analyse av disse sekvenser antydet at CAPAN-en ikke utviste en tydelig mønster av basesubstitusjoner eller en unik signatur er representativ for en bestemt mutagen. De fleste av de kodende substitusjoner (~45%) i CAPAN-1 var i C T /G A, selv om disse ikke var så dominerende som observert i COLO-829-celler hvor C t overganger ved dipyrimidine områder, som indikerer UV eksponering , dominerer [36] (fig. 2D). På bakgrunn av det begrensede antall kreft genomer som har blitt sekvensert til dags dato, mønsteret av basesubstitusjoner observert for CAPAN-1 mest likner på U87 MG og basal-lignende brystkreft, bare avviker betydelig i prosentandelen av A G /T . C mutasjoner (fig. 2D)
Vi har også sammenlignet mønsteret av base erstatninger i CAPAN-en på hele genomet versus exome. Vi observerte at mønsteret var stort sett den samme i koding og ikke-kodende regioner, bortsett fra at C T /G A mutasjoner var representert ved en høyere frekvens i exome, med samtidige lavere antall A C /T G erstatninger (fig. 2E).
Karakterisering av koding indels
Som for SNVs, nye indels identifisert i CAPAN-en cellelinje ble filtrert i henhold til å kopiere nummeret. Vi bemerket at 93 gener ble påvirket av små indels, alt fra en til seks basepar (tabell S8). Andre delesjoner ble identifisert i forhold til innsettinger (tabell 5), som ville være forventet fra bruk av gapped-justeringsmetoder. 18 av de indels (ni innsettinger, ni slettinger) var homozygote varianter, mens 62 var heterozygote (27 innsettinger, 35 slettinger). I likhet med den SNVs, ble variant effekter klassifisert i henhold til transkript (163 tvers over de 93 gener), og mesteparten av indels (72%) ble påvist i ikke-kodende regioner. Bare 13% av indels forårsaket frameshifts og 15% berørte spleise-sider. Kjennetegnet
BRCA2 c.6174delT
mutasjon i CAPAN-1 [14], [15] var en av de 15 genene scoret som blir påvirket av rammeskifte koding slettinger.
En undergruppe av høy grad av tillit koding frameshifts ble validert ved PCR og konvensjonell Sanger-sekvensering, ved hjelp av et biologisk replikere genomisk DNA-prøve. Åtte nye frameshifts (homozygot:
PAPLN
, Heterozygot:
EPHB2
,
LRRC7
,
DDIT4L
,
ADD3
,
SF1
,
C17orf57
, og
ZNF599
) til stede i CAPAN-en, men ikke påvist i HapMap genomer ble bekreftet av Sanger-sekvensering, i tillegg til ytterligere 17 frameshifts og 10 tre base pair indels felles for både CAPAN-en og HapMap. Alle de nye frameshifts, så vel som de i-ramme indels, ble bekreftet av Sanger-sekvensering (Fig. 3A-D, og data ikke vist). Fem av de lav rente frameshifts som ikke klarte å passere de strenge filtre kan ikke bekreftes, støtter gyldigheten av vår analyse. Noen av de gener som påvirkes av frameshifts, for eksempel
EPHB2
, er tidligere blitt forbundet med tumorgenesen i andre organer, [58], øke muligheten for at et antall av disse kan representere nye driver mutasjoner.
A. Kromatogram som viser sletting av C (markert med blått) i
PAPLN
oppdaget for CAPAN-en. Den genomiske referansesekvensen er vist ovenfor kromatogrammet. Pilen indikerer plasseringen av slettingen. B. Som A, for sletting av C i
EPHB2
. C. Som A, T C SNV og sletting av T i
DDIT4L
. D. Som A, sletting av AG i
ZNF599
. E. Sammenligning av andelen indels av 1, 2, 3, eller 4 bp lengde som er flankert av homologi i CAPAN-en, Colo-829, Colo-829BL, PD3689a, og PD3690a. Homologi er definert som å ha den samme sekvens som de innskutte eller slettet baser enten umiddelbart 5 «eller 3» for Indel, representert ved eksemplene.
Sekvens sammenheng med indels
det er en hypotese at mangler ved homolog rekombinasjon, for eksempel de som følge av tap av BRCA2-funksjon, kan føre til en økning i små delesjoner [10], [59]. Disse kan være flankert av repetitive sekvenser, hvis alternative prosesser av DNA dobbel tråd pause reparasjon, slik som ikke-homologe ende sammenføyning eller enkelt-tråd gløding er involvert i gjenopprettelsen [10], [15], [59]. På bakgrunn av dette undersøkte vi den umiddelbare sekvens sammenheng med de små indels detektert i CAPAN-1-genom, og sammenlignet disse med de to
BRCA2
-deficient tumorer sekvensert i Stephens datasettet [27], i tillegg til
BRCA
-proficient Colo-829 og Colo-829BL matchet par [36]. Indels ble kategorisert etter lengde (1, 2, 3 eller 4 + bp), og scoret for om flankerende sekvens enten 5 «eller 3» for Indel var identisk med den innsatte sekvensen /slettet (Fig. 3E). I CAPAN-1 /HapMap sammenligning, mer enn 60% av indels detektert i CAPAN-1 var identiske med den flankerende sekvens. Dette er betydelig mer enn det som forventes ved en tilfeldighet alene (50, 12.5, 3 og 0,8% henholdsvis for en 1, 2, 3, og 4 bp Indel) og var betydelig større enn observert i in COLO-829 /kolon 829Bl sammenligning, der formodentlig HR er aktiv. CAPAN-1 utstillinger en større frekvens av indels forbundet med homologi enn COLO829 tross for mye høyere dybden av genomisk sekvens generert for COLO829. Derav observasjoner gjort for CAPAN-en er lite sannsynlig å være et artefakt som følge av forskjeller i sekvense dybde. Videre er sammenhengen mellom indels og flankerende homologi forblir høy for alle lengder av indels i CAPAN-1, noe som står i kontrast til de andre cellelinjer (Fig. 3E).
BRCA2
-deficient tumorprøver PD3689a og PD3690a har lavere frekvenser av indels flankert av homologi, selv om det er mulig at disse prisene er underrepresentert på grunn av den lave sekvens dybde brukt i sine analyser (Fig. 3E) . Til sammen tyder dette på observasjon at
BRCA2
-deficient tumorceller kan være disponert for en hyppigere forekomst av indels i korte repetitive sekvenser.
Diskusjoner
Her har vi generert den første omfattende genomsekvensanalyse av en
BRCA2
-deficient cellelinje. Den representerer også den første slik sekvens av en mye brukt cellelinje avledet fra en tumor i bukspyttkjertelen.