PLoS ONE: Kvantifisering av normal celle Brøk og Kopier nummer Nøytral LOH i kliniske Lung Cancer prøver ved hjelp av SNP Array data

Abstract

Bakgrunn

Technologies basert på DNA-mikromatriser har potensial til å gi detaljert informasjon om genomiske avvik i kreftceller. I praksis en stor hindring for kvantitativ påvisning av avvik er heterogeniteten av kliniske tumorvev. Siden svulstvev alltid inneholder genetisk normale stromale celler, kan dette føre til en manglende evne til å oppdage avvik i kreftceller.

Principal Finne

Ved hjelp av SNP array-data fra 44 ikke-småcellet lungekreft prøvene vi har utviklet en bioinformatiske algoritme som nøyaktig modeller fraksjonene av normale og kreftceller i kliniske kreftprøver. Andelen av normale celler i kombinasjon med SNP array-data kan brukes til å påvise og kvantifisere kopiantall nøytral tap-av-heterozygositet (CNNLOH) i tumorceller både i råolje tumorvev og i prøver anriket for tumorceller med laser capture mikrodisseksjon.

Konklusjon

Genome-wide kvantitativ analyse av CNNLOH bruke CNNLOH kvantifikator metoden kan bidra til å identifisere tilbakevendende avvik bidrar til kreftutvikling i kliniske kreftprøver. I tillegg kan SNP-gruppe basert analyse av CNNLOH blitt viktig for påvisning av avvik som kan brukes til diagnostisering og prognostiske formål

Citation. Göransson H, Edlund K, Rydåker M Rasmussen M, Winquist J, Ekman S, et al. (2009) Kvantifisering av normal celle Brøk og Kopier nummer Nøytral LOH i kliniske Lung Cancer prøver ved hjelp av SNP Array data. PLoS ONE 4 (6): e6057. doi: 10,1371 /journal.pone.0006057

Redaktør: Jörg Hoheisel, Deutsches Krebsforschungszentrum, Tyskland

mottatt: 18 februar 2009; Godkjent: 05.06.2009; Publisert: 26 juni 2009

Copyright: © 2009 Göransson et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien var en del av et åpent forskningssamarbeid støttet og delfinansiert av Astrazeneca, Alderley Park, UK. Arbeidet ble også støttet av Det medisinske fakultet og farmasi (Uppsala universitet), Uppsala Universitet hopsital, Akademiska Laboratory, Beijer fundament, Wallenberg Consortium North og Swegene. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, og heller ikke i beslutningen om å publisere manuskriptet. Andrew P. Thomas som er seniorforsker ved Astrazeneca deltok i revisjonen av det intellektuelle innholdet

Konkurrerende interesser:. Den medforfatter Andrew P. Thomas er ansatt i Astrazeneca. Anders Isaksson og Andrew P. Thomas holde lager i Astra Zeneca.

Innledning

bioinformatiske algoritmer er utviklet for å bruke SNP rekke opplysninger til å identifisere genomiske avvik som DNA kopinummerendringer og tap-av -heterozygosity (LOH), det vil si strekninger av DNA med utelukkende homozygot markører [1] – [8]. Det er imidlertid en vesentlig ulempe ved disse fremgangsmåter at genetisk heterogenitet i tumorprøver, forårsaket av blandingen av kreft og stromale celler, blir ofte ikke tatt hensyn til. Som en konsekvens aberrasjoner er ofte ikke påvist i prøver med en stor andel av genetisk normale celler. Dette kan delvis forklare hvorfor, til tross for opphopning av store mengder genomiske data, er fortsatt liten den kliniske betydningen av slike analyser for diagnostiske formål. Tumorvev representerer en blanding av tumor- og ikke-tumorceller, dvs. inflammatoriske celler, stromale fibroblaster og celler i blod- og lymfekar [9]. Den fraksjon av normale celler overstiger ofte brøkdel av tumorceller i pasientprøver som er lagret i biobanker (figur 1A). Denne prøven heterogenitet sterkt påvirker kopiantall analyse. Så langt vi kjenner til er det ingen estimater på hvordan sensitiviteten for påvisning av genomiske avvik avhenger av hvor stor andel av normale celler i kliniske kreftprøver. En grunn kan være vanskeligheter med å estimere tumor vs. normal celle-forhold histologisk ved mikroskopi i heterogene tumorprøver med varierende andeler av normale celler i forskjellige deler av prøven. Videre er det en mangel på enighet om hvordan tumor celleinnholdet i en solid kreft bør vurderes og kommenteres. Således er resultatene av dagens verktøy for påvisning av genomiske avvik i kliniske tumorprøver ofte usikker.

A) Hematoxylin-eosin farget frosne delen av en representativ NSCLC tilfelle analysert i denne studien (opprinnelig forstørrelse 40 x) . Svulsten Prøven består av en blanding av tumorceller hvit pil, stroma med en blodåre svart pil, betennelsesceller, dvs. lymfocytter rød pil, og en gjenværende lunge alveolus fylt med makrofager grønn pil. B) Sletting LOH. Normale celler er angitt med oval celleform. Det slettede region i tumorcellene (rektangulær celle form) er angitt med hvite sirkler. Skjematisk kromosomparene med bare informativ markører A for den svarte og B for den røde chromosme. Under hvert kromosom genotypen i området av slettingen er indikert. Celler med forskjellige kopitall genotyper er merket N

normal, T

2 N, T

1N, og T

0N. N indikerer at cellen er normalt, og T at det sis en tumorcelle. Indeksene for tumorcellene indikerer DNA-innhold i regionen med slettingen. Siden disse er alle celletyper i utvalget proporsjonene oppsummere til ett. C) Kopier nøytral LOH. I dette tilfelle tumorcellene har tatt 2n DNA innhold. Men noen tumorceller er homozygot (i dette tilfellet BB) for den regionen av interesse (T

hom) og den andre typen er heterozygot AB (T

het). Summen av fraksjoner av celler lik én.

En nylig utviklet verktøyet tar prøven heterogenitet hensyn til identifisering av eksemplar nummer tilstander [10]. Den er designet for studier med parede prøver (tumor og normal). I praksis er imidlertid parede prøver ofte ikke er tilgjengelige for Større materialer.

I en annen studie Nancarrow et al visualisere det forventede mønster av allel frekvenser avhengig av varierende andeler av normale celler i tumorprøve ved hjelp av simuleringer [11 ].

en annen lovende analytisk verktøy, AsCNAR, er i stand til å identifisere LOH, selv når en av to blandede cellelinjer bare er til stede i en andel på ca. 20% [12]. Nylig Assie et al beskrevet en algoritme som tar svulst heterogenitet i betraktning i å identifisere genomiske avvik i prøver med 40-75% av kreftceller [13].

Studier tyder på at kopiantall nøytral LOH kan være en mekanisme for inaktive av tumor suppressor gener [14]. Flere studier og våre egne data tyder på at CNNLOH er mer vanlig enn tidligere antatt [15], [16]. Tatt sammen betyr dette at CNNLOH kan være viktig for å bestemme visse kreft fenotyper. For å analysere CNNLOH på en genom-bred skala i tumorcellene i heterogene prøver vi fokusert på å 1) å utvikle en algoritme for å kvantifisere den andel av normale celler i prøven, og 2) for å kvantifisere CNNLOH hele genomet i tumorcellene. En slik kvantitativ analyse har potensial til å bli et viktig verktøy for molekylær kreftdiagnostikk.

Resultater

En strategi for kvantifisering av CNNLOH i heterogene tumorprøver

For å kvantifisere CNNLOH i heterogene tumorprøver den allel-spesifikke signal bidrag fra forskjellige typer celler må estimeres. Figur 1 illustrerer en typisk blanding av celler i frosne snitt av en ikke-småcellet lungekreft (NSCLC) tumorprøve og gir en skjematisk fremstilling av de forskjellige typer av celler og genotyper som kan være til stede i tilfelle av en genomisk delesjon eller CNNLOH. Andre genomiske avvik, inkludert de som gir opphav til høyere ploidinummer avvik, kan også skje på samme locus som sletting eller CNNLOH, ytterligere kompliserer bildet. Imidlertid kan sannsynligheten for slike hendelser kan forventes å være lav, og i denne studien de har blitt antatt å være ubetydelig i forhold til effektene av slettinger og CNNLOH.

fraksjon av normale celler kan for noen typer tumorer bli målt på en enkel måte. I hematologiske tumorer brøkdel av normale celler kan måles ved hjelp av strømningscytometri ved anvendelse av informative overflatemarkører. Imidlertid enkeltcellesuspensjoner for strømningscytometri er vanskelig å få tak i fra solide svulster. Alternativt kan automatiske eller manuelle metoder for identifisering av normale celler ved å telle dem

in situ sammenligning basert på molekylære markører eller morfologi anvendes. Disse metodene krever avansert bildeteknikker eller tidkrevende arbeid for et trenet histopathologist. I denne artikkelen bruker vi signalintensitet fra de to SNP alleler å anslå brøkdel av normale celler og bruke denne informasjonen til å beregne hvor stor andel av kreftceller med CNNLOH.

Kvantifisering av andelen av normale celler fra SNP genotyping array-data

i prøver der andelen normale celler er vanskelig å oppnå på andre måter, setter vi ut å anslå brøkdel av normale celler fra SNP data bare. Som vist på fig. 1B fraksjonen av celler med 2N DNA (C

2N) i regioner med delesjoner er lik summen av de normale celler (N

normal) og tumorcellene med 2N DNA (T

2N). Grunnlaget for CNNLOH kvantifikator metode er å bruke allel-spesifikke signaler A og B for hvert locus for å oppnå den eksperimentelle Allele B frekvens (ABF), som en normalisert forhold av B /(A + B) se METODER. En avledning og en grafisk illustrasjon er tilgjengelig andre steder [17]. De ABfs av heterozygote informative markører i komplekse tumorprøver er avhengig av kopiantall og cellulære sammensetning av prøven. I et første skritt vi satt ut for å identifisere andelen C

2N celler ved å sammenligne de eksperimentelle ABfs i et vindu påfølgende SNPs i regioner med mono-allel slettinger med simulerte data. Simuleringene ta hensyn til faktorer slik som gjennomsnitt heterozygositet, tumorcelle kopiantall, eksperimentell variasjon og sammensetningen av diploide celler og tumorceller. Figur 2 illustrerer hvordan histogrammer til de observerte ABfs blir sammenlignet med simulerte histogrammer med forskjellige fraksjoner av C

2N ved hjelp av den euklidske avstand. Histogrammet med den minste avstand til den observerte histogrammet identifiserer den tilsvarende C

2 N (se fig. 2 og metoder).

To eksempler på observerte ABF verdier langs kromosomene. Windows på minst 140 consequtive SNP markører brukes til å samle allel-spesifikk informasjon langs kromosomet. ABF verdier i hvert vindu er illustrert som en observert histogram. I det neste trinn blir det observert histogrammet blir sammenlignet med hundrevis av simulerte histogrammer hvor brøkdel av heterozygote celler som har blitt variert. Den simulerte histogram med den korteste euklidske avstanden til den observerte histogrammet identifiserer den mest sannsynlige andel av heterozygote celler i prøven (X%). Sammenligningen av histogrammer brukes både for beregning av andelen av diploide celler (C

2N) i regioner hvor tumorceller har delesjoner og andelen av heterozygote celler (C

het) i genomiske regioner med 2N-tumorceller. C

2 N og C

het deretter bruke for estimering av brøkdel av normale celler og kvantifisering av CNNLOH.

N

normal er ikke hentet direkte fra estimatet på C

2 N. Men siden de normale cellene kan forventes å ha to av hver autosome deres bidrag til ABF er forventet å være like stor for alle autosomer, mens den ytterligere bidrag T

2N celler kan variere med det tumor heterogenitet for hvert kromosom . Derfor, i prøver der kopiantall tap oppdages på flere kromosomer den laveste estimat av C

2 N for et kromosom har den minste bidraget fra 2N tumorceller. I mange tilfeller der slettingen har forårsaket en spredning fordel bidraget til den minste C

2 N fra 2N tumorceller vil med tiden være nær null. Derfor i tilfeller hvor informasjon fra flere kromosomer er tilgjengelig kan det være berettiget å anslå N

normal som den minste C

2 N.

Validering av SNP utvalg basert beregninger gjort av forhold til manuell telling av normale celler

Vi søkte metoden til 60 ikke-småcellet lungekreft prøver (se metoden). Førtifire med seksti prøver (73%) med de vilkårlige kriterier som i det minste to områder på to forskjellige kromosomer varierte ikke mer enn 5% i deres C

2N anslag og som kan brukes for å tilveiebringe et estimat av N

normal (se METODER). Kriteriene er satt til å ta hensyn til den mulige effekten av konstitutive allele mønstre som ligner CNNLOH. De fleste av de 16 sakene der det ikke estimatet kan fås ikke har to strykninger.

For å validere estimater for normal cellefraksjon basert på SNP data, en tilfeldig undergruppe av de 60 NSCLC prøvene var valgt for forsiktig og omfattende mikroskopisk telling av normale og kreftceller i frysesnitt (se METODER). Sju av disse tilfellene overlappet med de 44 sakene der N

normal kan anslås, Tabell 1 viser anslag over brøkdel av normale celler hentet ved hjelp av SNP array-data og manuell telling basert på morfologi for disse prøvene. Det er god overensstemmelse mellom resultatene oppnådd ved de to metodene, noe som indikerer at SNP baserte metoden gir nøyaktig informasjon om brøkdel av normale celler i kreftprøver.

Kvantifisering av kopiantall nøytral LOH i lunge kreftprøvene

det er nødvendig å kvantifisere den fraksjon av normale celler til stede i en tumorprøve før informasjonen fra SNP rekke analyse kan benyttes til å anslå den fraksjon av tumorceller med 2N DNA som har LOH, dvs. CNNLOH. CNNLOH = T

hom /(T

hom + T

het). (Se fig. 1B). I dette tilfelle er det den heterozygot tumorceller T

het som sammen med de normale celler vil endre Allele B frekvensen av de homozygote tumorceller med LOH. For CNNLOH allelet B hyppigheten av informative markører avhenger av heterozygote celler C

het. Simulerte histogrammer som tar varierende fraksjoner av heterozygote celler i betraktning ble sammenlignet med histogrammer basert på ABF verdier fra et bevegelig vindu med et fast antall markører (se fig. 2 og metoder). Den simulerte Histogrammet mest lik den observerte histogrammet, identifiseres den tilsvarende fraksjon av heterozygote celler, C

het. Hvis brøkdel av normale celler N

normal er kjent, kan CNNLOH beregnes, siden en = N

normal + T

hom + T

het. For å demonstrere verdien av CNNLOH kvantifikator metoden vi har brukt den til et sett av NSCLC prøvene (se METODER). Genom kvantitative målinger av CNNLOH er vist i fig. 3. Det kan bemerkes at det er tilbakevendende regioner med høy grad av kopiantallet nøytral LOH. Et eksempel på kromosom 11 er vist i fig. 3. Fremtidig arbeid vil være fokusert på å belyse viktigheten av kopiantall nøytral LOH i slike områder for tumorutvikling. Til sammenligning CNNLOH ble også analysert i 60 normale referanseprøver (se fig. S1).

A) Kvantitativ informasjon om svulst LOH spenner fra svart 0% til rød 100% for de 22 autosomer for 43 ikke-småcellet lungekreft prøver hver representerer én rad. Slettinger er angitt med grønn og presiseringer i blått. Regionene hvor mer enn 10% av prøvene i en normal henvisning sett hatt CNNLOH høyere enn 0,5 ble fjernet fra plottet (se metoder). Svarte pilen indikerer et eksempel på en region på kromosom 11 med en høyere frekvens av kopiantall nøytral LOH (52%) enn den maksimale frekvens på 10% i normale referanse sett

Kvantifisering av CNNLOH. – sammenligning mellom FISH og SNP data

for å studere nøyaktigheten av kvantifisering av CNNLOH vi ønsket å sammenligne resultatene til de som ble oppnådd med en uavhengig metode. Gunnarsson et al har målt tilstedeværelsen av små slettinger på 13q14 i tumorcellepreparater fra pasienter med kronisk lymfatisk leukemi (KLL) med fluorescens in situ hybridisering (FISH) [18]. I to tilfeller kreftceller hadde kjøpt to eksemplarer av kromosom 13 med en intern 13q14 delesjon. Således, i slike tilfeller andelen av CLL celler med null og en FISH signal representerer de homozygote og heterozygote tumorceller hhv. Et estimat av den CNNLOH på kromosom 13 utenfor det slettede området på 13q14 kan fås som den andel av celler med null signal på 13q14 dividert med summen av andelene med null og en signal. På grunn av for få områder med delesjoner kunne ikke oppnås den andel av normale celler fra SNP data. I stedet flowcytometri data fra Gunnarsson et al 2008 gitt denne informasjonen. Dermed ble andelen av normale celler fra flowcytometri og SNP array-data for de to prøvene brukes til å kvantifisere CNNLOH. Tabell 2 viser estimater av CNNLOH innhentet av de to metodene. Det kan bemerkes at anslagene bare avviker med 4 og 6% i de to utvalgene, noe som indikerer at måling av CNNLOH er korrekt.

Kvantifisering av CNNLOH er robust overfor variasjoner i utvalget renhet

Et viktig krav for kvantifisering av CNNLOH er at fremgangsmåten skal være robust og ikke påvirkes av den fraksjon av normale celler i prøven. For å teste ytelsen av algoritmen varieres vi brøkdel av normale celler i en tumorprøve ved å anrike for tumorceller. I fem tilfeller 6 000-10 000 tumorceller ble valgt ved hjelp av laser mikrodisseksjon (se METODER). Standard Affymetrix SNP rekke analyse ble utført på DNA fra disse tumor-beriket forberedelser. Den fraksjon av normale celler og tumor LOH for kopitall nøytrale områder ble kvantifisert og resultatene ble sammenlignet med resultatene fra urene tumorprøver (fig. 4). Målingene av CNNLOH i de rå prøvene synes å være svært konsistent med de i microdissected prøvene. For å kvantifisere resultatene av CNNLOH deteksjon valgte vi å telle antall kromosomsegmenter i fig. 4 som hadde tumor LOH høyere enn en vilkårlig satt terskel, i dette tilfelle 0,5 i begge prøvene. Denne prosedyren gir et grovt estimat av evnen til å oppdage CNNLOH. Tabell 3 viser forholdet mellom antall segmenter som ble avdekket i microdissected prøven i forhold til hele utvalget. Forholdet ligger i nærheten av en for alle prøver som indikerer at omtrent like mange segmenter er detektert uavhengig av fraksjon av normale celler som varierte mellom 1% og 26%. Det kan hevdes at brøkdel av normale celler er så lav at det er vanskelig å observere noen forskjell mellom par av prøvene. Men studerer robustheten kopi nummer deteksjon det kan bemerkes at i tre par prøver (13A, 296A og 319A) var det en dramatisk reduksjon (opp til 122 ganger) i antall segmenter detektert som bærer kopi nummer avvik i hele prøven (se Tabell 3). Oppsummert ser analyse av CNNLOH å være robust, samtidig som kopiantall deteksjon kan bli sterkt påvirket av selv en andel av normale celler i størrelsesorden 1-26%, som er beskjeden for mange typer av tumor kliniske prøver.

Fem tumorprøver 13A, 234A, 296A, 319A og 367a ble analysert for svulst LOH bruke både DNA fra Dypfryst deler av hele svulsten og fra laser microdissected deler av svulsten seksjoner med beriket svulst innhold. Graden av svulst LOH er indisert for 200 kb chromosmal segmenter i farger som spenner fra svart (0%) til mørk rød (100%) langs de 22 autosomer. Segmenter med kopi nummer avvik, er angitt med slettinger (grønn) og presiseringer (blå). Merk i et forstørret utsnitt av kromosom 7 at CNNLOH målingene er approxiamately lik i parene av hele og microdissected tumorprøver.

Utførelse av CNNLOH deteksjon på simulerte data av blandinger av normal og svulst celler

CNNLOH kvantifikator metoden som presenteres her kan identifisere CNNLOH og kvantifisere brøkdel av kreftceller som har CNNLOH. Fremgangsmåten synes å være robust overfor variasjoner i den tumorcelleinnholdet i kliniske prøver. Det vil imidlertid også være interessant å sammenligne ytelsen til andre metoder. For dette formål SNP-array-data ble oppsamlet fra tumorceller i et microdissected lungekreft prøven og fra lungekreft vevet utsiden av tumoren fra den samme pasient. Basert på denne informasjonen vi simulerte data fra blandinger av normale og kreftceller. For å måle resultater i form av sensitivitet og spesifisitet vi brukte LOH oppdaget av paret analyse av tumorprøve og normal kontroll ved hjelp dChip i kopi nummer 2 regioner som gullstandarden som definerte CNNLOH. Vi ønsket å sammenligne CNNLOH kvantifikator metoden til andre metoder også bruker allel-spesifikk informasjon. Disse fremgangsmåter har vist seg å gi bedre resultater genotype-baserte metoder [13]. AsCNAR er en slik metode, men i dag tilgjengelig gjennomføringen ikke er fleksibel nok til å bruke på denne type simulerte data. På den annen side den somatics metoden ble utviklet for data fra Illumina SNP-plattform, men kan tilpasses for å analysere simulerte data basert på data fra Affymetrix plattformen. Derfor valgte vi å sammenligne ytelsen til CNNLOH kvantifikator metoden med somatikken (se METODER for detaljer). Sensitivitet og spesifisitet av metodene for å variere blandinger av normale og tumorceller er vist i figur 5AB. Det kan bemerkes at CNNLOH kvantifikator har en skarp økning i følsomhet, over 40% tumorceller, er at på grunn av terskelen av CNNLOH ringer som svarer til en brøkdel av 35% tumorceller. CNNLOH kvantifikator har en høyere følsomhet på ca. 90% sammenlignet med 60% for somatics for brøkdeler av tumor som er større enn omtrent 50% (se fig. 5A). Spesifisitet er generelt høyere for CNNLOH kvantifikator forhold til somatics (se fig. 5B). Sensitiviteten av somatics var lavere enn det som tidligere har vært rapportert for data basert på SNP-array-data fra Illumina plattformen [13]. Vi antok at somatics algoritmen utfører forskjellig på data generert av de to plattformene. I Gunnarsson et al de samme DNA-preparater fra KLL svulster ble analysert på begge 250K arrays fra Affymetrix og 317K arrays fra Illumina [18]. Vi analyserte begge datasettene fra 9 CLL tumorer med somatics og fant at algoritmen identifisert mer ved hjelp av CNNLOH Affymetrix data. Forholdet mellom lengden av de detekterte CNNLOH regioner med Affymetrix data sammenlignet med Illumina dataområdet 1,9 til 36 (se tabell S1). Disse ytterligere regioner av CNNLOH identifisert ved hjelp av de Affymetrix dataene kan i stor grad være falske positive på grunn av den større eksperimentelle støy. Et slikt stort antall av falske positiver ville være forenlig med lav følsomhet av somatics i påvisning av CNNLOH i de simulerte data basert på Affymetrix data (se fig. 5A).

data svarende til forskjellige fraksjoner av normale og tumor cellene ble simulert ved hjelp av data fra normale celler og tumorceller microdissected fra samme lungekreft tumor. Ytelsen av de to algoritmene ble evaluert som følsomhet (A) og spesifisitet (B) sammenlignet med CNNLOH oppdaget av dChip i en sammenkoblet analyse av SNP array-data for normale og kreftceller.

Metoder

Etikk uttalelse

Denne undersøkelsen ble gjennomført i henhold til de prinsipper som er nedfelt i Helsinkideklarasjonen, og ble godkjent av regional etisk vurdering styret i Uppsala (referansenummer 2006/325). Behovet for å innhente individuelt samtykke fra hver pasient ble frafalt av etisk vurdering bord, siden de fleste av pasientene i studiepopulasjonen ( 90%) var døde ved starten av prosjektet, gjorde forskningsresultatene ikke innebære noen medisinsk risiko , og resultatene kan ikke endre informasjon til pasienter, pårørende eller endringsledelse. Prosedyren er helt enig med den svenske etisk rapport loven.

tumorprøver, histologisk estimering av tumorcelleinnholdet og DNA forberedelse

Fersk frossen menneskelige NSCLCs ble hentet fra Uppsala Fresh Tissue Biobank og brukes i samsvar med den svenske biobank lovgivning. De vevsprøver utgikk fra pasienter fra en kohort definert ved at de ble registrert inn /kreftregister i Uppsala Örebro lunge som å ha NSCLC, hadde en frossen vevsprøve i vevet bank og ble diagnostisert mens live. Sak status ble bekreftet av histopatologiske gjennomgang og studiet av medisinske poster. Hematoxylin-eosin farget frysesnitt (4 mikrometer) ble fremstilt fra de frosne oktober-innvevde svulstvev blokker og anmeldt mikroskopisk ved et kirurgisk patolog. Seksti tilfeller med en anslått tumor celleinnhold over 50% ble inkludert i studien. For en undergruppe av disse prøvene (tabell 1) vi utført en grundig manuell telling av tumor og normale celler ved lysmikroskopi å bruke nett i høy effekt forstørrelses felt (HPF). Minst 2000 celler ble tellet i 5-10 ulike områder av den frosne delen avhengig av størrelsen og heterogenitet av tumorprøve. For hver prøve genomisk DNA ble ekstrahert fra 5-10 frosne vevssnitt (10 mikrometer) ved hjelp av QIAamp DNA Mini Kit (Qiagen) i henhold til produsentens protokoll.

Laser Capture Microdissecion av lungekreft prøver

mikrodisseksjon ble utført som tidligere beskrevet med mindre modifikasjoner [19]. Fra 5 lungekreft prøver, 12 mikrometer tykke frysesnitt ble utarbeidet, overført til PALM membran-belagt glassplater, og lagret ved -80 ° C. Umiddelbart før mikrodisseksjon ble snittene tint og farget med hematoksylin i 2 minutter, fulgt av fiksering i en sink fiksativ i 1 minutt og dehydrering i 1 minutt i 70% og 95% etanol respektivt. Utnytte PALM Laser-Microbeam System, ble utvalgte kreft områder med 6000-10000 celler microdissected og overføres ved hjelp av en laser puls til 15 mL DNA-ekstraksjon buffer ATL (Qiagen) i hatten for en mikro tube. DNA-ekstraksjon ble deretter utført ved hjelp av QIAamp DNA Micro Kit i henhold til produsentens protokoll (Qiagen).

Analyse på Affymetrix 250K SNP arrays

Array eksperimenter ble utført i henhold til standard protokoller for Affymetrix Genechip ® Kartlegging 250K arrays (Gene Chip Mapping 500K analysen Manual (P /N 701930 Rev2.), Affymetrix Inc., Santa Clara, CA). I korthet, totalt genomisk DNA ble spaltet med et restriksjonsenzym (

Nsp1

), ligert til en passende adapter for enzymet, og utsatt for PCR-amplifikasjon ved bruk av en enkelt primer. Etter spaltning med DNase I, ble PCR-produktene som er merket med et biotinylert nukleotid-analog ved hjelp av terminal deoksynukleotidyltransferase og hybridisert til microarray. Hybridiserte prober ble tatt til fange av streptavidin-fykoerytrin konjugater og endelig arrays ble skannet. Kvalitetskontroll QC, genotype kall og kopiere antall analyser ble gjort i Affymetrix GeneChip® Genotyping Analysis Software (GTYPE) 4.1. Den dynamiske modellen (DM) algoritme ble anvendt for å utføre enkel prøve QC. QC spesifikasjon for 250K er en Call Rate 93% ved hjelp av algoritmen mislighold. Etterfølgende kopi nummer analyse ble utført ved hjelp av en skjult Markov Model tilgjengelig i Kopier nummer Analysis Tool (CNAT) 4.0.1 med følgende parameterinnstillinger: Transition forfall 5 Mb, Median normalisering og 0,3 Mb utjevningsfaktor. Referanse sett brukt besto av 96 CEU prøver fra HapMap prosjektet (www.hapmap.org/downloads/raw_data/affy500k/).

Kvantifisering av brøkdel av normale celler

Som et første trinn genomiske regioner utledes for å inneholde mono-allelisk delesjoner ble identifisert ved hjelp av Affymetrix Software CNA 4.0.1, som beskrevet ovenfor. For å estimere den fraksjonen av celler med 2N genomiske innhold, C

2N, ble allel-spesifikk informasjon som brukes. Den Affymetrix SNP rå data ble normalisert i programvaren dChipSNP ved hjelp av modellbaserte uttrykk fremgangsmåte og en bakgrunn subtraksjon metode som bruker mismatch sonder (PM /MM forskjell) [6]. De normaliserte signaler ble deretter anvendt for å beregne allelisk intensitetsforhold R

i for hver SNP (R

i = B /(A + B)). For å ta hensyn til at det samme antall av A- og B-allelene kan gi ulike signaler i analysen, den alleliske forhold ble normalisert til allel B-frekvenser (ABF) for en bestemt SNP locus i en gitt prøve av en lineær interpolasjon av de kjente allelfrekvensene for de tre genotyper (0, 0,5 og 1,0), som avledet og grafisk illustrert i Peiffer

et al

2006 [17]. I korte ABF for en gitt SNP

i

ble beregnet som følger: hvor R

i er alleliske intensitetsforholdet og m

AA, AB, BB er de midlere alleliske intensitetsforhold for en referanse befolkning, for den spesielle SNP. Referanse sett var den samme som beskrevet for kopiantall analyse ovenfor. Bare SNPs hvor en AB samtale var til stede i referansegruppen ble brukt. For SNP’er der ingen homozygote anrop var tilgjengelige, var den midlere AA eller BB-signal for alle SNP’er i prøvene i referansegruppen brukt i stedet.

Et histogram av allel-spesifikke Allele B frekvensinformasjon for markørene på hver autosome med kopi nummer tapet ble beregnet. Den observerte histogram ble sammenlignet med simulerte histogram for varierende fraksjoner av C

2 N. C

2 N av de mest lignende histogrammet er den som mest sannsynlig å ha gitt opphav til de observerte data (se fig. 2). Simuleringene beskriver variasjonen i ABF på grunn av variasjon i signalene fra A og B allelene ved å trekke A- og B-signalene fra normalfordelinger estimert fra regioner med kopitall 2. Den midlere og varians for fordelingene var (0, 0.015) for allel A og (0,995, 0,015) for allel B. Den gjennomsnittlige grad av heterozygositet ble beregnet fra kopitall 2 regioner til 36,7%. Simulerte ABF-verdier ble beregnet som summen av simulerte Allele B signaler dividert med summen av Allele A og B-signalene fra celler som utgjør den virtuelle prøven. For eksempel ved simulering av prøver med høyere fraksjoner av 2N-celler, er andelen av simulerte celler med både A- og B-signalene også økt. For å opprettholde den gjennomsnittlige grad av heterozygositet og for å oppnå stabile histogrammer de var basert på ABF verdiene fra ujevnt antall av 14 848 simulert SNP loci (se mer detaljert beskrivelse av valg av innstillinger i Tekst S1). Å velge en annen tilstrekkelig stort antall simulerte loci som ville produsere svært like histogrammer. Histogrammene ble normalisert til enhetsareal for å representere det forventede mønster for hver av de 200 trinnene som varierte brøkdel av C

2N-celler mellom 0 og 67%. Den minste Euklidsk avstand mellom den observerte histogram og histogrammer med varierende C

2 N identifisert brøkdel mest sannsynlig til å ha gitt opphav til den observerte Allele B frekvensmønster.

Legg att eit svar