Abstract
Bakgrunn
Bevis tyder på at spontane doublet mutasjoner i normale mus vev generelt oppstå fra chronocoordinate hendelser. Disse chronocoordinate mutasjoner iblant reflektere «mutasjon dusjer», som er flere chronocoordinate mutasjoner som spenner over mange kilobaser. Imidlertid er lite kjent om mutagenese av dublett og multiplett mutasjoner (domuplets) i kreft hos mennesker. Lungekreft står for ca 25% av alle kreftdødsfall. Heri, analyserer vi epidemiologi av domuplets i
EGFR Hotell og
TP53
gener i lungekreft.
EGFR
genet er et onkogen som dubletter er generelt driver pluss driver mutasjoner, mens
TP53
genet er en tumor suppressor gen med et mer typisk situasjon hvor dubletter stammer fra en sjåfør og passasjer mutasjon.
metodikk /hovedfunnene
EGFR
identifiserte mutasjoner ved sekvensering ble samlet inn fra 66 publiserte artikler og vår oppdaterte
EGFR
mutasjon database (www .egfr.org).
TP53
mutasjoner ble samlet inn fra IARC versjon 12 (www-p53.iarc.fr). For
EGFR Hotell og
TP53
dubletter, ingen klart signifikante forskjeller i rase, ble observert etnisitet, kjønn og røykestatus. Dubletter i
EGFR Hotell og
TP53
gener i menneske lungekreft er forhøyet om åtte- og tre ganger, henholdsvis i forhold til spontane dubletter i mus (6% og 2,3% mot 0,7% ).
Konklusjon /Betydning
Selv om ingen karakteristiske er definitive, de samlede egenskapene til dublett og multiplett mutasjoner i lungekreft er konsistent med en undergruppe avledet fra chronocoordinate hendelser i
EGFR
genet: i) de åtte rammeskifte dubletter (tilstede i 0,5% av alle pasienter med
EGFR
mutasjoner) er gruppert og produsere en netto i-frame endring; ii) ca. 32% av dubletter er svært nær hverandre (≤30 nt); og iii) multipletter inneholde to eller flere tett plasserte mutasjoner.
TP53
mutasjoner i lungekreft er svært nær hverandre (≤30 nt) i 33% av dubletter, og multi inneholder vanligvis to eller flere svært tett linjeavstand mutasjoner. Arbeid i modellsystemer er nødvendig for å bekrefte betydningen av chronocoordinate hendelser i lunge og andre kreftformer
Citation. Chen Z, Feng J, Buzin CH, Sommer SS (2008) Epidemiology of Doublet /plett Mutasjoner i lungekrefttilfellene : Bevis for at et delsett Oppstår ved Chronocoordinate Events. PLoS ONE 3 (11): e3714. doi: 10,1371 /journal.pone.0003714
Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, USA
mottatt: 04.08.2008; Akseptert: 10. oktober 2008, Publisert: 13.11.2008
Copyright: © 2008 Sommer et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Institution.
konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Kreft er en heterogen, multi-trinn, kompleks genetisk sykdom som følge av akkumulerte mutasjoner. Kreft generelt ble ansett å oppstå ved akkumulering av anslagsvis 5-7 forårsakende mutasjoner [1], [2]. Nylig har imidlertid Vogelstein og andre har vist i bryst og kolorektal kreft som individuelle tumorer akkumuleres ~90 somatisk muterte gener [3]. Imidlertid, et mye mindre antall (anslått til å være ~11) er sannsynlig å være involvert i tumordannelse i en gitt tumor. Oppbyggingen av så mange medvirkende mutasjoner er vanskelig å forklare utelukkende av frekvensen av flere uavhengige mutasjonshendelser. Opphopning av mutasjoner i visse kreftformer kan gjenspeile en mutator fenotype med globalt tilfeldige mutasjoner [4] – [6]. Sekvensiell utvalg tilbyr en annen forklaring [7], [8]. En mutasjon som forårsaker over-replikasjon, noe som gir opphav til en klon, som videre over-replikerer på grunn av en andre mutasjon, etc. Nylig eksistensen av mutasjons dusjer ble rapportert, øke muligheten for «kreft i et øyeblikk» hvis spredt mutasjon dusjer forekomme . Mutasjons dusjer ble funnet etter analyser av intragenic doublet mutasjoner avslørte at de var gruppert og chronocoordinate [9].
Vi viste at flertallet av dubletter i
EGFR
genet har en annen mutasjon mønster relative til singlets og bestå av driver pluss driver mutasjoner, på grunn av sekvensielle eller chronocoordinate mutasjoner, putatively etterfulgt av funksjonell utvalg av to individuelt suboptimale mutasjoner [10]. I tillegg kjøpte andre mutasjoner (f.eks T790M) i fire
EGFR
dubletter har vært rapportert etter behandling med gefitinib og erlotinib og forbundet med stoffet motstand og sykdom tilbakefall [11], [12]. I motsetning til de fleste
TP53 Hotell og
Laci
dubletter vise driver pluss passasjer mutasjoner i lungekreft og i normal Big Blue mus vev, henholdsvis. Men epidemiologi og mekanismene bak mutagenese av dubletter og flere mutasjoner er uklare.
For å belyse hyppigheten av dubletter og tydelig mutasjon mønster og spektrum i
EGFR
genet, epidemiologi dublett mutasjoner i lungekreft er analysert og sammenlignet med dubletter i
TP53
genet. Heri, finner vi at røykestatus, rase, etnisitet, kjønn og alder ikke er risikofaktorer for dublett forekomst i
EGFR Hotell og
TP53
gener. Den relative hyppigheten av dubletter er høyere i human lungekreft enn i normalt vev mus. Eksistensen av OMIDI par (se Terminologi og Forkortelser i Materialer og Metoder) i
EGFR
, den høye frekvensen av allelisk versus forbindelse heterozygote dubletter, den høye frekvensen av tett adskilte dubletter, og gruppering i multipletter er i overensstemmelse med chronocoordinate mutasjoner som bidrar til minst en undergruppe av
EGFR Hotell og
TP53
dublett og multiplett mutasjoner funnet i menneskelig lungekreft.
Resultater
Epidemiologi av dublett mutasjoner i EGFR og TP53 gener i lungekreft
Analyse av røykestatus, kjønn og etnisitet ikke avsløre en betydelig forskjell i dublett frekvens i
EGFR
gen (tabell 1, tabell S1). Gjennomsnittsalderen for pasienter med singleter og dubletter er lik (61,4 ± 11,3
vs
65,8 ± 10,3).
Resultatene for
TP53
genet i lunge kreft er lik med ett unntak. Hyppigheten av
TP53
dubletter er vesentlig høyere i asiater enn i kaukasiere (3,2%
vs
1,8%, P = 0,03) (Tabell 1, Tabell S2), men dette er ikke signifikant når korrigert for multippel sammenligning (seks Fishers eksakte tester utført for
EGFR
og
TP53
gener). Ytterligere data er nødvendig for å vurdere dette punktet.
Totalt 98/1627 (6,0%) av EGFR mutasjoner og 54/2387 (2,3%) av TP53 mutasjoner i humane lungekrefttilfellene er dubletter, en mye høyere frekvens enn som ble observert i
lacl
genet i Big Blue mus (8 ganger og tre ganger henholdsvis) (tabell 2).
Dubletter tendens til å klynge i EGFR og TP53 gener i lungekreft: «half-life of mutasjon avstand» er 9 bp og 15 bp, henholdsvis
Spontan
Laci
dubletter (0,7% av totalt antall mutasjoner) er gruppert med en avstand montering en eksponensiell fordeling og viser en lignende mutasjon mønster for å singletter, noe som indikerer en chronocoordinate aktivitet [13], [14]. Basert på den dublett avstanden mellom to mutasjoner,
EGFR
dubletter kan deles inn i to grupper: den proksimale gruppe ( 100 bp, gjennomsnittlig avstand mellom 22,8 ± 24,4-bp) og den distale gruppen (mer enn 809 bp , gjennomsnittlig avstand 12,3 ± 5,1 kb) (tabell S1). Analogt til
Laci
dubletter, en undergruppe [40% (39/98)] for
EGFR
dubletter oppstår i samme ekson med proksimale mellomrom viser en eksponensiell (R
2 = 0,9979 ) i stedet for en kvasi-uniform fordeling (fig S1). Halvparten av dubletter har mutasjoner adskilt av 9 bp eller mindre (det «halveringstid på mutasjon mellomrom»; se Terminologi i materialer og metoder).
Avstanden distribusjon for
TP53
dubletter i lunge kreft oppstår i samme ekson (43%, 23/54) viser også proksimale mellomrom ( 86 bp, gjennomsnittlig 20,2 ± 20,9 bp) og passer til en eksponentiell fordeling (R
2 = 0,979) (tabell S2, figur S1) med en halveringstid på mutasjon avstand på 15 bp. Dubletter forekommer i forskjellige eksoner ha distal avstands (131-4504 bp, gjennomsnittlig 1317,9 ± 1000 bp) adskilt av et intron. En tilsvarende avstanden som den i lungekreft ble funnet for
TP53
dubletter innen samme ekson i bryst og kolorektal kreft, med en halveringstid på mutasjon avstand mellom 24 og 16 bp respektivt (tabellene S4 og S5) .
Dermed om lag en tredjedel av
EGFR Hotell og
TP53
dubletter er høyt gruppert (≤ 30 bp) og alle dubletter oppstår innen en enkelt ekson har et internasjonalt mutasjon avstanden som er eksponentielt fordelt i stedet for den forventede kvasi-uniform fordeling, i samsvar med chronocoordinate hendelser i
lacl
i normal mus vev.
de OMIDI parene er sterke bevis for klynge chronocoordinate mutasjoner
Det store flertallet av spontan menneskelig germlime eller somatiske muse MIDI er OMIDIs (
FIX
, Big Blue); ja, om lag halvparten er enkle basisslettinger [15] – [18]. I motsetning til dette, er det en svært lav andel av OMIDIs (0,26%, 4/1526) og nonsense-mutasjoner (0,13%, 2/1526) i
EGFR
singletter, i samsvar med en sterk seleksjon for mutasjoner som endrer, stedet for å slette, funksjon. Åtte av 98 (6%)
EGFR
dubletter inneholde et par rammeskifte mutasjoner (OMIDI parene, se forkortelser i Materialer og metoder). Alle åtte av de OMIDI parene er nær hverandre (tabell 3, figur S2), med det netto resultat at en i-ramme mutasjon. Gitt en OMIDI mutasjon, en andre tilfeldig mutasjon 3 «for den første (enten IMIDI eller OMIDI) vil gjenopprette leseramme bare 1/3 av tiden, og en sub-fraksjon av det tredje fortsatt protein avkutting fordi en nonsense-mutasjon inntreffer før til den andre mutasjon. Totalt 0,49% av rapporterte
EGFR
mutasjoner (8/1627) er gruppert OMIDI par uten avkorting mutasjon som skjer før den andre OMIDI. Disse åtte OMIDI parene er forventet å ligge på samme allel; ellers vil sammensatte heterozygote OMIDI dubletter føre til to allele trunkeringer, eliminere alle
EGFR
gen-funksjon. I mellomtiden, både av de grupperte OMIDIs bør også skje i rask rekkefølge (chronocoordinate mutasjoner) i det samme cellesyklusen, fordi frekvensen av sekundære mutasjoner som forekommer tilfeldig i en spredning-manglende celle som følge av et enkelt OMIDI er sjeldne. De resterende 14 slettinger (i eksoner), 9 indels og 3 dubletter er alle i-ramme (IMIDI) mutasjoner (tabell 2, Tabell S1).
mutasjoner i enkelt OMIDI pair rapportert i
TP53
genet er 2309 bp fra hverandre, i forskjellige eksoner (tabell S2, ID # 14373), og, i motsetning til OMIDI par i
EGFR
genet, ikke sammen gjenopprette leserammen.
EGFR multi er konsistent med en singlet og en svært gruppert chronocoordinate andre mutasjon
Fire trillinger og en firling i
EGFR
ble funnet med en frekvens på 0,3% (5 /1627) av lungekreft med mutasjoner før behandling med tyrosinkinaseinhibitor (TKI) (tabell 4). Det er av interesse at par av mutasjoner i hver av de trillinger og tre mutasjoner innenfor quadruplet er tett gruppert med proksimale mellomrom (3-60 bp), i likhet med dubletter i
lacl
i normale mus vev. Den tredje mutasjon er plassert i et annet ekson med distal mellomrom. Dataene er konsistente med sekvensiell utvalg av to mutasjoner der en av mutasjonene er en chronocoordinate dublett eller trilling.
TP53
multi (6 trillinger og en firling) også står for 0,3% ( 7/2387) av totale mutasjoner (tabell S3). Fem multi (71%, 5/7) bor i samme ekson eller to eksoner, i samsvar med en mutasjon og en chronocoordinate dublett. Syv multi hadde mutasjoner adskilt av 15 avstands regioner. Av disse ble seks svært gruppert (≤30 nt) og ni var innenfor 100 nukleotider eller mindre. Åtti prosent (16/20) av flere mutasjoner i brystkreft og 76% (25/33) i tykktarmskreft også oppholde seg i ett eller to eksoner (Bord S6, S7).
En sammenligning av OMIDI parene og tett linjeavstand dublett og multiplett mutasjoner i
EGFR
og
TP53
gener er vist i tabell 5. hyppigheten av OMIDI par i
EGFR
genet er ca. 10 ganger større enn i
TP53
genet (og en OMIDI par i
TP53
genet ikke resulterer i en netto i-frame mutasjon), reflekterer hyppigere utvalg av mutasjoner som endrer, fremfor å slette, EGFR protein funksjon. Hyppigheten av tett linjeavstand mutasjoner i dubletter og multi i begge gener ligner
Alle preget EGFR dubletter er allel. En betydelig undergruppe av chronocoordinate mutasjoner gir en alternativ forklaring
På forsiden verdi, foreslår allelism data som sjåfør /driver mutasjoner i
EGFR
må være på det samme molekylet [10]. Men eksistensen av en vesentlig delmengde av chronocoordinate mutasjoner gir en alternativ forklaring. Seksten heterozygot
EGFR
dubletter fra tre forskjellige studier har blitt analysert ved kloning eller allel-spesifikk amplifikasjon (tabell S1) [10], [19], [20]. Påfølgende sekvensering av produktene viste at alle disse lene var enten dobbelt mutert eller vill-type, som indikerer at i hvert tilfelle ble begge mutasjoner plassert på samme allel. Dersom doublet parene resultat av uavhengige hendelser, kan halvparten forventes å være sammensatte heterozygoter. Observasjonen av 100% allelism (16/16) vs. null sammensatte heterozygoter (p = 0,002) kan gjenspeile det, funksjonelt, er føreren /driver mutasjoner som kreves for å være på samme molekylet selv om EGFR protein danner dimer [10] . Men dataene er også i overensstemmelse med 50% chronocoordinate hendelser, putatively under tråd replikasjon eller lapp reparasjon, og 50% uavhengige sekvens mutasjoner uten et krav om at begge mutasjoner være på det samme molekyl (8 av 8 alleliske mutasjoner observert når 4 av 8 viser forventet tilfeldig;.. p≤0.08)
Dessverre, til vår kunnskap, er ikke utført allel analyse på heterozygote
TP53
dubletter
Diskusjoner
Vi presenterer den første analysen av epidemiologien av dubletter i lungekreft. Røyking status, rase, etnisitet, kjønn og alder er ikke risikofaktorer for dublett forekomst i lungekreft. Den høye frekvensen av grupperte dubletter, eksponentialfordelingen av avstand, forekomst av i-frame grupperte OMIDI parene, den alleliske natur dubletter, og gruppering av multipletter i
EGFR Hotell og
TP53
er forenlig med et betydelig mindretall av chronocoordinate mutasjoner i kreft hos mennesker. Men det er begrensninger for hver av de ovennevnte observasjoner (se nedenfor).
Vi viser at dubletter er hyppigere i
EGFR Hotell og
TP53
gener i menneske kreft enn i spontane somatiske mutasjoner i normal mus vev. Innenfor rammen av utvalgsstørrelse, betyr dublett frekvens ikke åpenbart avhenge av røykestatus, kjønn, etnisitet eller alder.
TP53
genet er mutert i omtrent halvparten av alle tumorer og kan benyttes som en «mutagen test», det vil si de relative frekvensene av de forskjellige typer av mutasjonen kan brukes som et epidemiologisk verktøy for å utforske bidrag av eksogene mutagens vs. endogene prosesser i bryst kreft [21], [22]. Vi antok at høyere mutasjon priser som forventes på røykerne ville oftere produsere doublet mutasjoner. Men det er ingen signifikant forskjell mellom røykere og ikke-røykere, i samsvar med dubletter og multi som følge av endogene prosesser.
Data er i samsvar med chronocoordinate mutasjoner (med begrensninger)
Flere aspekter av data er konsistente med en undergruppe av
EGFR Hotell og
TP53
dubletter oppstår fra choronocoordinate hendelser snarere enn fra hypermutability (tilfeldig fordelt mellomrom) eller sekvensiell utvalg. Om 32-35% av dubletter funnet i
TP53 plakater (35%, 19/54) og
EGFR plakater (32%, 31/98) gener er enten OMIDI par eller svært gruppert dubletter atskilt med ≤30 nt. Det er imidlertid begrensninger for hver slutning som må utelukkes i det videre arbeidet.
Den viktigste verdien av den foreliggende analysen er å generere data som begrenser våre hypoteser, og ved Occam
«
s barberhøvel, generere en enkel hypotese (undergruppe av chronocoordinate hendelser) i samsvar med flere data.
(1) de OMIDI parene er det beste beviset for chronocoordinate mutasjoner. For de fleste gener, de fleste av spontane MIDI er OMIDIs, men i
EGFR
genet, OMIDIs er sjeldne, i samsvar med den generelle utvalg for endret funksjon snarere enn mangel på funksjon. Det er bemerkelsesverdig at de åtte
EGFR
dubletter innehold OMIDI parene alle er tett adskilte mutasjoner som resulterer i en netto i leseramme mutasjon, og dermed produsere en EGFR-protein med potensielt forandres, snarere enn fraværende, funksjon. Imidlertid har ingen eksperimentelle bevis for et protein som inneholder en av disse doublet mutasjoner blitt demonstrert. Det mest fornuftige forklaringen på denne forekomsten er gjennom chronocoordinate mutasjoner som er valgt sammen for endret protein funksjon. En alternativ forklaring er at OMIDI parene kan liksom være sekvensielle, selv om tilfeldige mutasjoner innen noen få nukleotider i genomet må være ekstremt usannsynlig.
(2) Den relativt høy frekvens av grupperte doublet mutasjoner i
EGFR
gen er i samsvar med chronocoordinate mutasjoner. Eksponentialfordelingen av avstanden mellom de to mutasjoner i
EGFR Hotell og
TP53
dubletter i samme eksoner (R
2 = 0,98). Er svært lite sannsynlig ved en tilfeldighet
En simulering ble utført tidligere for hvert av
TP53
eksoner 5-9 for å teste nullhypotesen om at mutasjoner i
TP53
dubletter er uavhengige hendelser, og at fordelingen av avstanden mellom de to mutasjonene er kun avhengig av spekteret av mutasjoner i
TP53
gen og størrelsen av mutasjonen target [13]. Den første mutasjon av hvert simulerte dublett ble trukket tilfeldig basert på den observerte fordeling av singlet mutasjoner i en gitt ekson. Bruke sing utdeling fra TP53 IARC database (release 8) står for skjevhet som kan skyldes tett linjeavstand hot spots. Den andre mutasjon i doublet ble trukket tilfeldig basert på en jevn fordeling over hele TP53 kodende sekvensen for det ekson, ettersom det er sannsynlig å være en «hitchhiker» (passasjer) mutasjon, i stedet for en sjåfør mutasjon for svulsten.
mutasjonen mellomrom i de simulerte dubletter ble sammenlignet med 402 faktiske
TP53
dubletter i IARC database fra alle typer kreft. Resultatene viste at to mutasjoner i dubletter ikke er uavhengige arrangement med statistisk sammenligning av de observerte og forventede fordelinger, og indikerte at flere dubletter forekom med en mutasjon avstand på mindre enn 30 nukleotider enn ventet ved en tilfeldighet (P = 0,03, 0,02, 0,0006, og 0.01 for eksoner 5-8). Disse resultatene er i overensstemmelse med forekomsten av chronocoordinate mutasjoner i det menneskelige
TP53
genet. En alternativ forklaring på den gruppering av dubletter er at de kan representere noen som ennå unappreciated funksjonelle begrensninger.
(3) allel natur dubletter er konsistent med chronocoordinate mutasjoner. Blant 98 doublet parene som er rapportert i litteraturen, bare noen få har blitt analysert for å bestemme hvorvidt de er tilstede på samme eller forskjellige alleler. Blant 16 doublet par testet etter kloning eller allel-spesifikk amplifikasjon, ble alle 16 par funnet å være til stede på den samme allel. Men for de resterende doublet par, hvor kloning eller allel-spesifikk forsterkning ikke ble utført, muligheten for at mutasjonene var til stede på ulike alleler kan ikke utelukkes.
(4) Den relativt høy frekvens av multipletter med to eller flere grupperte mutasjoner og en ekstra mutasjon på en fjerntliggende sted argumenterer også for en chronocoordinate mutasjons hendelse pluss en uavhengig enkelt mutasjons hendelse. Igjen, kan en alternativ forklaring bære funksjonelle begrensninger på de gruppert mutasjoner.
I samlet, disse dataene er konsistent med et bidrag på grupperte chronocoordinate mutasjoner til kreft hos mennesker. Et overskudd av dubletter eller multipletter med et delsett av gruppert fordeling skjer oftere enn forutsagt ved en tilfeldighet i en rekke organismer, inkludert riboviruses, DNA-virus, prokaryoter, gjær og eukaryote cellelinjer og vev [23], [24].
data~~POS=TRUNC støtte driver pluss passasjer TP53 dubletter i lungekreft
Om 22% av de andre mutasjoner i dubletter er forventet å være stille om de er «passasjer» mutasjoner, snarere enn «driver» mutasjoner [25]. I
TP53
dubletter, er det fem taus og to intronic nucleotide endringer (13%, 7/54), ikke signifikant forskjellig fra 23,5% lydløs nucleotide endringer som forventes å oppstå med tilfeldige passasjer mutasjoner (p = 0,46 ) [26], [27]. Silent nucleotide endringer (18%, 4/22) i
TP53
multi er også nær 23,5%. Sammen utgjør disse dataene antyder at
TP53
dubletter og multi består av en sjåfør pluss passasjer mutasjon mønster, i motsetning til sjåføren /sjåfør mønster funnet i
EGFR
dubletter [10].
Doublet mutasjoner er assosiert med mutasjon dusjer i mus [9]. Ankomsten av massivt parallell sekvensering kan lette analysen av tilstrekkelige mengder prøver å definere eventuelle dubletter og deretter avgjøre om disse dubletter er assosiert med mutasjoner dusjer i kreft. De ikke-vilkårlige clustering mutasjoner i mutasjons dusjer bør gi mer definitive data for forekomsten av chronocoordinate mutasjoner i kreft hos mennesker. Bidraget av mutasjons dusjer til kreft gjenstår å fastslå.
Materialer og metoder
Terminologi og forkortelser
Mutasjon spekteret.
De relative frekvensene av mutasjoner på bestemte steder.
Mutasjon mønster.
De relative frekvenser av ulike typer mutasjoner, f.eks C til T overganger kontra T til C overganger.
Singlet.
en enkelt mutasjon identifisert innen et gen [13].
Tandem-basemutasjon (TBM).
en mutasjon som resulterer i baseforandringer på tilstøtende nukleotider [28], [29].
Doublet.
To mutasjoner identifisert innen et gen, inkludert en blanding av TBM og ikke-TBM mutasjoner.
plett.
Tre eller flere mutasjoner identifisert innen et gen, med unntak av situasjonen der alle mutasjoner er tilstøtende. Multi kan omfatte en blanding av TBM og ikke-TBM mutasjoner.
Domuplets.
En mutant som enten er en dublett eller en multiplett. Omtrent 1% av
Laci
mutante plakk er domuplets [9]
MIDI
Microinsertion, sletting, eller Indel..; en innsetting, sletting eller Indel som resulterer i en gevinst eller tap på 1 til 50 nukleotider [10].
IMIDI.
I-frame MIDI
OMIDI.
Out-of-frame MIDI
Half-life av mutasjon avstand.
fra eksponensiell tilpasning til dataene, intervallet av mutasjonen avstand som tilsvarer intervallet omfatter halvparten av resterende mutasjoner i prøven. Dette er analogt med den halveringstiden til en radioisotop.
Chronocoordinate mutasjon.
Multiple mutasjoner som forekommer i den samme cellesyklus og i hurtig rekkefølge, typisk i løpet av sekunder til minutter [13].
mutasjon dusj.
Chronocoordinate flere mutasjoner som går over flere kilobaser [9].
Silent mutasjon.
En nøytral mutasjon som ikke endrer proteinstruktur, inkludert synonymt kodende region endringer. Det erkjennes at sporadiske mutasjonstyper overlapper hverandre, for eksempel, kan en stille mutasjon aktivere en kryptisk spleisesetet eller kan inaktivere normal spleisesetet hvis den forstyrrer spleisedonorkonsensussekvensen [30]. I praksis svært få slike overlappinger ble funnet.
Prøver og mutasjonsanalyse
For å undersøke mekanismen og karakteristikker av dubletter og multipletter,
EGFR
mutasjoner identifisert ved sekvensering var samlet inn fra 66 publiserte artikler og vår oppdaterte
EGFR
mutasjon database [10], [31] (www.egfr.org).
TP53
mutasjoner ble samlet inn fra IARC versjon 12 (www-p53.iarc.fr) og ekskludert mutasjoner i lungefibrose og i lungekreft hos pasienter eksponert for røykfylt kull utslipp, radon, sennepsgass, asbest, tungmetaller og atombombe stråling (gammastråler). Vi har også utelatt to artikler der flere mutasjoner omfattet 50% av de totale mutasjoner, mest sannsynlig på grunn av PCR-artefakter, siden flere mutasjoner generelt utgjør bare ~3% av totalt antall mutasjoner.
TP53
mutasjoner i bryst og kolorektal kreft også ble hentet og avstanden fordeling av dubletter /multi ble analysert.
Statistical Analysis
Mutasjons mønstre og andre kategoriske count distribusjoner ble testet for signifikante forskjeller ved Fishers eksakte test eller sorterte R × C beredskaps tabeller ved hjelp av «Fisher-Freeman-Halton» test gjennomført av StatXact statistisk analyse programvarepakke (CYTEL Software Corporation, Cambridge, MA).
Hjelpemiddel informasjon
Figur S1.
En undergruppe av dubletter viser proksimale avstand og passer til eksponentiell fordeling i EGFR og p53-gener i lungekreft. Panel A viser separasjon (i basepar) mellom de to mutasjoner i EGFR proksimale dubletter (n = 37). De separasjonsavstander ble delt i tre grupper, med mellomrom på 1-41 bp, 42-82 bp, og 83 til 123 bp, og plottet ved midtpunktet av hver gruppe (20, 60, og 100, henholdsvis). Separasjon er her definert som antallet nukleotider mellom, men ikke inkludert, de to mutasjoner i en dublett. For MIDI, blir separasjons definert som antallet nukleotider mellom, men ikke inkludert, starten av den første og andre MIDI. Panel B viser avstanden (i basepar) mellom de to mutasjoner i p53-nære dubletter (n = 23). De separasjonsavstander ble delt i tre grupper, med mellomrom på 1-31 bp, 32-62 bp, og 63-93 bp, og plottet ved midtpunktet av hver gruppe (15, 30, og 45, henholdsvis).
doi: 10,1371 /journal.pone.0003714.s001 plakater (0,62 MB PPT)
Figur S2.
Dubletter i EGFR-genet som danner OMIDI parene Den villtype (wt) EGFR sekvens i ekson 19 fra nukleotider 2227 til 2280 er vist. De åtte OMIDI parene i lungekreft er diagrammed å vise slettinger (i magenta), innsettinger (i grønt) og en region som er duplisert (i gult). Legg merke til at to av dubletter består av to delesjoner hver, fem dubletter bestå av en delesjon pluss en Indel, og en dublett har en duplisering (innsetting) pluss en Indel. I hvert fall er det leserammen gjenopprettet (se netto sletting)
doi:. 10,1371 /journal.pone.0003714.s002 plakater (0,03 MB DOC)
Tabell S1.
Supplerende Tabell 1
doi: 10,1371 /journal.pone.0003714.s003 plakater (0,07 MB XLS)
Tabell S2.
Supplerende Tabell 2
doi: 10,1371 /journal.pone.0003714.s004 plakater (0,07 MB XLS)
tabell S3.
Supplemenatary Tabell 3
doi: 10,1371 /journal.pone.0003714.s005 plakater (0,03 MB XLS)
Tabell S4.
Supplerende Tabell 4
doi: 10,1371 /journal.pone.0003714.s006 plakater (0,08 MB XLS)
Tabell S5.
Supplerende Tabell 5
doi: 10,1371 /journal.pone.0003714.s007 plakater (0,11 MB XLS)
Tabell S6.
Supplerende Tabell 6
doi: 10,1371 /journal.pone.0003714.s008 plakater (0,04 MB XLS)
Tabell S7.
Supplerende Tabell 7
doi: 10,1371 /journal.pone.0003714.s009 plakater (0,06 MB XLS)
Takk
Vi takker Wenyan Li og Jiesheng Chen for DNA sekvensering.