PLoS ONE: Next-Generation Sequencing av RNA og DNA isolert fra parvise Fresh-Frozen og formalinfiksert parafin-Embedded Prøver av kreft hos mennesker og normalt vev

Abstract

formalinfiksert, parafininnstøpte (FFPE) vev er en uvurderlig ressurs for klinisk forskning. Men nukleinsyrer utvunnet fra FFPE- vev er fragmentert og kjemisk modifisert noe som gjør dem vanskelig å bruke i molekylære studier. Vi analyserte 23 fersk frosset (FF), 35 FFPE og 38 sammenkoblede FF /FFPE- eksemplarer, som representerer seks forskjellige typer menneskelig vev (blære, prostata og tykktarm karsinom, lever og tykktarm normalt vev; reaktiv mandel) for å undersøke potensialet bruk av FFPE-prøver i neste generasjons sekvensering (NGS) basert retrospektive og prospektive kliniske studier. To fremgangsmåter for DNA og tre fremgangsmåter for RNA-ekstraksjon fra FFPE-vev ble sammenlignet og ble funnet å påvirke nukleinsyre kvantitet og kvalitet. DNA og RNA fra utvalgte FFPE og sammenkoblede FF /FFPE- prøver ble brukt for exome og transkriptom analyse. Preparater av DNA Exome-Seq bibliotekene var mer utfordrende (29,5% suksess) enn for RNA-sekv biblioteker, antagelig på grunn av modifikasjoner i FFPE vev-avledet DNA. Bibliotekene kan fortsatt bli fremstilt fra RNA isolert fra to tiår gamle FFPE- vev. Data ble analysert ved hjelp av CLC Bio Genomics Workbench og avdekket systematiske forskjeller mellom FF og FFPE- vev-avledet nukleinsyre biblioteker. Til tross for dette, parvise analyser av DNA Exome-Seq data viste samstemmighet for 70-80% av variantene i FF og FFPE prøver lagret for mindre enn tre år. RNA-Seq data viste høy korrelasjon av uttrykk profiler i FF /FFPE- parene (Pearson korrelasjon på 0,90 +/- 0,05), uavhengig av lagringstiden (opptil 244 måneder) og vevstype. Et felles sett av 1,494 gener ble identifisert med uttrykk profiler som var signifikant forskjellig mellom sammenkoblede FF og FFPE-prøver uavhengig av vevstype. Våre resultater er lovende og antyder at NGS kan brukes til å studere FFPE- prøver i både prospektive og retrospektive arkivbaserte studier der FF prøver ikke er tilgjengelige

Citation. Hedegaard J, Thorsen K, Lund MK, Hein A-MK, Hamilton-Dutoit SJ, Vang S, et al. (2014) Next-Generation Sequencing av RNA og DNA isolert fra parvise Fresh-Frozen og formalinfiksert parafin-Embedded Prøver av kreft hos mennesker og normalt vev. PLoS ONE 9 (5): e98187. doi: 10,1371 /journal.pone.0098187

Redaktør: Zhuang Zuo, UT MD Anderson Cancer Center, USA

mottatt: 14 mars 2014; Godkjent: 10 april 2014; Publisert: May 30, 2014

Copyright: © 2014 Hedegaard et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet:. Den forfatterne bekrefter at alle data som underbygger funnene er fullt tilgjengelig uten restriksjoner. Tilgang til sekvensdata, som inneholder person identifiserende informasjon, trenger signatur på en kontrollert tilgang form, og kan nås på Den europeiske Genome-phenome Arkiv [25] med studien ID EGAS00001000737 følgende forespørsel til MOMA Data Access Committee. Expression matriser er tilgjengelig uten restriksjoner gjennom ArrayExpress [REF: www.ebi.ac.uk/arrayexpress] under tiltredelse. E-mtab-2523

Finansiering: Dette arbeidet ble støttet med tilskudd fra Den danske nasjonal Advanced Technology Foundation (https://hoejteknologifonden.dk/), John og Birthe Meyer Foundation og Den danske Kreftforeningen (https://www.cancer.dk/). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. Anne-Mette K. Hein og Bjarne Knudsen er ansatt av CLC bio, som er et QIAGEN selskap. Mette Katrine Lund og Mogens Kruhøffer er ansatt av AROS Applied Biotechnology. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer.

Innledning

Formalin fiksert, parafininnstøpte (FFPE) vevsprøver lagret i diagnostisk patologi arkiver representerer en uvurderlig biobank for retrospektiv klinisk forskning. I tillegg kan FFPE-prøver være nyttig i prospektive studier utelate innsamling av fersk frossen (FF) prøver. Dessverre, nukleinsyrer er vanskeligere å trekke ut fra FFPE vev på grunn av behovet for å fjerne parafin og for å motvirke kovalente protein-DNA-interaksjoner som følge av fikseringsprosessen. I tillegg fiksering forsinkelse (dvs. perioperative iskemisk tid), fiksering prosessen, fremstilling vev, parafin innebygging, og arkivering lagring bidra til fragmentering, tverrbinding og kjemisk modifisering av FFPE-vev-avledet nukleinsyrer. Disse endringene forstyrrer mange klassiske molekylære analyser som krever høy kvalitet nukleinsyrer. Fremskritt i neste generasjons sekvensering (NGS) teknologi gjør at etterforskningen av genomer, epigenomes og transcriptomes bruker begrenset prøvemateriale. Videre kan denne analysen utføres på en relativt beskjeden kostnad, tatt i betraktning den massive økning i mengden av informasjon som kan oppnås. Kraften i NGS å analysere i dybden stort antall korte sekvenser potensielt gjør dette til et ideelt teknologien til å gjelde de som regel fragmenterte nukleinsyrer som kan være hentet fra FFPE- prøver. Utviklingen av pålitelige NGS-baserte metoder for bruk med lav kvalitet FFPE- vev-avledet nukleinsyrer ville åpne diagnostisk patologi arkivene til high-throughput profilering, tilrettelegging omfattende retrospektive kliniske studier. På samme måte vil muligheten til å bruke FFPE-prøver for molekylær analyse i prospektive studier være til stor nytte, for potensielt å redusere eller til og med eliminere behovet for den kjedelige innsamling og lagring av cryopreserved kliniske prøver.

nukleinsyrer isolert fra FFPE- vev har tidligere hovedsakelig blitt undersøkt ved hjelp av PCR og microarray-baserte metoder, er det nå rapporter om anvendelsen av NGS til FFPE materiale. En av de første kom fra Schweiger

et al.

Som rapporterte NGS-basert analyse av DNA (DNA-Seq) isolert fra FFPE-prøver [1]. Forfatterne fant en god korrelasjon mellom matchet FF og FFPE brystkreftprøver fra en enkelt pasient ved analyse av genom kopi nummer endringer og variant frekvenser basert på lav-dekning hel-genomsekvense [1]. Deretter Wood

et al.

Kombinert pooling av prøver og reduksjon i mengden av innspill DNA for å studere genom-wide kopi nummer endringer i FFPE-prøver [2]. En ytterligere papir fra Schweiger gruppe viste at studier av genomisk varianter basert på sekvensering av DNA fra FFPE vev dratt nytte av økt dekning oppnås ved hjelp av målrettet resequencing, redusere virkningen av fiksering-indusert støy [3]. Nylig Tuononen

mfl.

Brukes målrettet DNA resequencing å screene FFPE- ikke-småcellet karsinom for klinisk viktig

EGFR

,

KRAS Hotell og

BRAF

mutasjoner og fant en signifikant sammenheng med resultatene av real-time PCR baserte analyser utført parallelt [4]. Spencer

et al.

Påført målrettet resequencing av 27 kreftrelaterte gener til 16 FF /FFPE sammenkoblet lunge adenokarsinomer og funnet, at på tross av påvisbare virkninger av fikseringsprosessen, like enkelt-nukleotid-varianter kan påvises med sikkerhet [ ,,,0],5]. Fanelli

et al.

Har rapportert en high-throughput sekvenseringsmetode for epigenetisk profilering basert på chip-seq, FFPE- prøver fra en mus leukemi modell og fra et begrenset utvalg av kreft hos mennesker (en seminom og seks brystcarsinomer) , som tillater analyse av histonmodifikasjonene og transkripsjonsfaktor bindende for et genom-wide skala [6], [7]. Gu

et al.

[8], [9] viser at lav-inngang utgjør FFPE vev-avledet DNA som kan brukes sammen med redusert representasjon bisulfitt sekvensering (RRBS) for å tillate studier av genom-DNA-metylering brede profiler i arkiv kliniske prøver.

Weng

et al.

var en av de første til å beskrive NGS-basert analyse av RNA (RNA-Seq) isolert fra FFPE prøver [10]. Disse forfatterne rapporterte sammenlignbare uttrykk resultater fra dyp sekvensering av miRNAs stammer fra paret FF og FFPE- nyrecellekarsinomer. Videre fant de en høy korrelasjon å sammenligne resultatene fra NGS med de som ble oppnådd i parallell ved hjelp av microarray og RT-PCR-metoder. Nylig, Meng

et al.

Rapportert vellykket bruk av ligation baserte miRNA sekvense til kreftprøver lagret opp til 9 år [11]. Mens det er kjent fra studier ved bruk av tradisjonelle molekylære teknikker som mindre RNA-molekyler som miRNA er bedre i stand til å motstå formalinfiksering [12], er det en generell forventning at lengre RNA-molekyler sannsynligvis vil være mer utsatt for fragmentering og modifikasjoner, og dermed gjøre dem dårlige maler for RNA-Seq. En NGS-basert studie av lengre RNA-molekyler har blitt rapportert av Sinicropi

et al.

Som fant at RNA-Seq data fra FFPE- primær brystkreft var av tilstrekkelig kvalitet til å aktivere biomarkører [13]. Adiconis

et al.

Rapporterte en komparativ analyse av fem metoder for RNA-Seq påført lav kvalitet RNA (slik som den som er isolert fra FFPE vev) og lav mengde RNA [14]. Nylig, Norton

mfl.

Brukt RNA-Seq ni sett med FF og FFPE brystkreft prøver lagret i opptil fire år og funnet god korrelasjon mellom de sammenkoblede FF og FFPE- uttrykk profiler [15].

Vi utvider på disse studiene i form av antall og mangfold av menneskelige prøver undersøkt og rapporter en systematisk analyse av potensialet bruk av NGS-baserte profilering av menneskelige FFPE- prøver i retrospektive og prospektive kliniske studier. Vår studie omfatter (1) evaluering av ulike isolasjons strategier for nukleinsyrer fra menneskelige FFPE- prøver og matchende FF og FFPE- eksemplarer; (2) utarbeidelse av målrettet genom (DNA Exome-Seq) og hele transkriptom (RNA-Seq) sekvense biblioteker; og (3) omfattende analyse av NGS data oppnådd. Hovedmålene var å identifisere og karakterisere systematiske effekter av fiksering prosessen på de resultatene som oppnås samt kritiske parametere i arbeidsflyten fra kirurgi til analyserte NGS data. Tilgjengelige uttakssett ble evaluert med hensyn på rensing av RNA og DNA fra utvalgte FFPE-humane prøvene (normal lever, leverkreft, reaktive mandel, lungekarsinom, brystkarsinom, normal hud fra bryst, og blærekarsinom, med matchende FF prøver fra leveren og mandel prøver). Dette ble etterfulgt av evaluering av ekstrahering av RNA og DNA fra FFPE-humane prøver (kolorektalt karsinom, normal lever, blærekarsinom, og mandel) med forskjellige rutinemessige arkivlagringstider (opp til 244 måneder). Til slutt, DNA og RNA ble ekstrahert fra samsvarende FF og FFPE-prøver (humane blære, prostata og tykktarm karsinomer, så vel som fra normal tykktarm vev). Ekstrahert DNA og RNA ble anvendt for fremstilling av målrettet genomet (DNA Exome-Seq) og hele transkriptomet (RNA-Seq) sekvensering biblioteker og NGS data ble oppnådd, ble analysert, med fokus på oppdagelsen av systematiske effekter av fikseringsprosessen.

metoder og materialer

Etikk uttalelser

Alle forsøkene i denne studien ble utført på prøver av human opprinnelse valgt fra de frosne vev biobanker ved Aarhus universitetssykehus, Danmark og fra diagnose FFPE blokk arkiv ved institutt for patologi, Aarhus universitetssykehus, Danmark. Vevene ble fjernet i løpet av rutine kirurgiske inngrep og ble overskudd til diagnostiske krav. Prøvene ble anonymisert før anvendelse i denne studien. Studien ble godkjent av komiteen for helsefaglig forskningsetikk i Region Midtjylland og det danske Datatilsynet.

Kliniske prøver og store mål

Studie arbeidsflyt fra kirurgi til endelig analyse av NGS dataene er vist i fig S1 sammen med de viktigste parametrene som ble undersøkt. Prøvene ble valgt til å maksimere omfanget av variabler (f.eks lagringstid fordi innsamling og vev-type) med en forventet virkning på resultatene. Prøve sett er beskrevet i denne delen, i tabell 1 og i tabell S1. Studien inkluderte totalt 23 FF, 35 FFPE og 38 sammenkoblede FF /FFPE- eksemplarer, som representerer seks forskjellige typer menneskelig vev (blære, prostata og tykktarm karsinom, lever og tykktarm normalt vev; reaktiv mandel). Totalt 16 FF og FFPE prøver fra forskjellige vev ble valgt for første testing av DNA og RNA rensing (

testen satt

). For å studere effekten av vevstype og lagringstid etter fiksering, ble FFPE- kvartaler fra fire vev (kolorektal og blære carcinoma, og normal lever- og mandel) valgt, hver med fire lagringstider (2-3, 13-15, 60-62 og 241-244 måneder). Dette eksperimentet er merket

lagringstiden FFPE satt

. Den største eksperiment,

sammenkoblede FF /FFPE tykktarm satt

, inkludert 19 sammenkoblede FF /FFPE- kolorektal kreftprøver (både godartede og ondartede) og 13 FF prøver av matchende normal tykktarm vev som hadde blitt samlet inn 2 – 13 år tidligere. For å teste påvisning av spesifikke single nucleotide varianter, et sett med 11 kolon prøver ble valgt med kjente varianter i

KRAS Hotell og

BRAF product: (

kolon KRAS /BRAF-varianter deteksjon satt

). Videre syv sammenkoblede FF /FFPE- prostatakarsinom prøver samlet 2 – 11 år tidligere (

sammenkoblede FF /FFPE prostata satt

), åtte sammenkoblede FF /FFPE- blære carcinoma prøver samlet 5 – 9 år tidligere (

sammenkoblede FF /FFPE blære satt

) og 10 FF blære carcinoma prøver (

FF blæren signatur bevaring satt

) ble valgt for studien. DNA og RNA ble isolert fra hver prøve, og anvendes for å generere biblioteker for exome sekvensering og total-RNA-sekvensering. Det primære målet for de DNA Exome-seq eksperimenter var å sammenligne påvisning av genomisk variasjon i matchet FF og FFPE-prøver, inkludert både spesifikke varianter av klinisk relevans samt globale variasjoner. RNA-Seq eksperimenter ble utført for å tillate sammenligninger skal gjøres av den transkripsjonelle informasjon som er innhentet fra passet FF og FFPE-prøver, inkludert (1) global informasjon om transkripsjonen aktivitet; (2) spesifikke uttrykk nivåer i forhold til biologisk status (dvs. kontrast godartede og ondartede prøver i

sammenkoblede FF /FFPE colon satt

); og (3) beskrivelse av et uttrykk signatur for blære tumorprogresjon (i

FF blæren signatur bevaring sett Hotell og

sammenkoblede FF /FFPE blære satt

).

Rensing av DNA og RNA fra FF og FFPE vev

for å identifisere utvinningsmetoder som resulterer i optimal nukleinsyre kvalitet og kapasitet, ble RNA og DNA renset fra FFPE- blokker av

test satt

(tabell 1 og tabell S1) ved anvendelse av kommersielt tilgjengelige sett som beskrevet nedenfor. Opptil seks 10 um snitt ble skåret ut fra hver tumor blokk og anbragt i sterile 1,5 ml sentrifugerør klar for ekstraksjon. Rørene inneholdende snitt FFPE-seksjoner for RNA-rensing ble lagret ved -80 ° C inntil bruk. DNA og RNA renselser fra leveren og mandel prøver de samsvarende FF ble gjort ved hjelp av en QiaSymphony robot i kombinasjon med QIAsymphony DSP DNA Mini Kit og QIAsymphony RNA Mini Kit (begge fra QIAGEN). DNA ble renset fra FFPE-prøver ved hjelp QIAamp DNA FFPE Tissue (QIAGEN) og NucleoSpin FFPE DNA (Machery-Nagel) kits; RNA ble renset fra FFPE-prøver ved hjelp miRNeasy FFPE (Qiagen), NucleoSpin FFPE RNA (Machery-Nagel) og ExpressArt FFPE RNAready (Amp Tec) kits. For å teste parallell rensing av RNA og DNA fra det samme FFPE-seksjonene, ble det NucleoSpin FFPE RNA /DNA-kit (Machery-Nagel) og RecoverAll Total nukleinsyreisolering Kit for FFPE (Ambion) inkludert. Til slutt, for å teste automatiserte renseprosedyrer, DNA og RNA ble renset på en QiaSymphony robot ved hjelp av spesialiserte FFPE-programmer og den QIAsymphony DSP DNA Mini Kit og QIAsymphony RNA Mini Kit (QIAGEN), henholdsvis. Alle ekstraksjoner ble utført i tre eksemplarer, hvert på tre FFPE-seksjoner. På grunn av en begrensende mengde materiale, med utvinning fra bryst prøver Recover Alt ble gjort på bare duplikater. Rensinger ble utført ved å følge forhandlerens protokoller med den følgende modifikasjon: Deparaffinisation før DNA- og RNA-ekstraksjon ved hjelp av QIAamp FFPE-DNA og ExpressArt FFPE RNAready sett, henholdsvis, ble utført ved bruk av QIAGEN største Deparaffinisation løsning i stedet for xylen som inngår i de ferdige. Alle DNA-prøvene ble behandlet og RNase alle RNA-prøver ble DNase behandlet i løpet av rensingen. Etter rensing, ble alle prøvene vasket på UF-filterplater og eluert i QIAGEN s elueringsbuffer (EB, [10 mM Tris-HCl, pH 8,5]). Fragmenter profiler av renset RNA og DNA ble estimert ved on-chip elektroforese av en 1 mL prøve på en Agilent 2100 Bioanalyzer (Agilent Technologies). Siden bare dobbelt-trådet (ds) DNA er aktiv i TruSeq bibliotek formasjon, både den totale absorbansen ved 260 nM (NanoDropND-1000 spektrofotometer) samt et dsDNA-spesifikk analyse (qubit dsDNA BR Assay Kit /qubit 2,0 fluorometer, Invitrogen) ble brukes til å kvantifisere DNA konsentrasjon. RNA-konsentrasjonen ble bestemt ved hjelp av bare den totale absorbans ved 260 nM.

Denne første rensing ble etterfulgt av DNA og RNA ekstraksjon fra FFPE- vev som hadde blitt rutinemessig lagret i patologi arkiv for kortere eller lengre tid etter fiksering. Denne lagringstiden studien inkluderte fire vev: mandel (normal reaktiv), lever (normal ikke-neoplastisk), blære (karsinom) og kolon (karsinom). Hver vev var representert med fire FFPE- blokker lagret for 2-3, 13-15, 60-61 og 241-244 måneder, henholdsvis (Tabell 1 og Tabell S1). Bare de to mest lovende utvinnings kits ble brukt: DNA-rensinger ble gjort ved hjelp av QIAamp DNA FFPE Tissue og Ambion RecoverAll kits. RNA rensinger ble gjort ved hjelp av miRNeasy FFPE- og AmpTec ExpressArt kits. Alle ekstraksjoner ble utført i duplikat ved hjelp av tre vevssnitt.

Lagringstiden studien ble fulgt av rensing av DNA og RNA fra sammenkoblede FF /FFPE- prøver av tykktarmen (19 prøver), blære (8 prøver) og prostata ( 7 prøver) karsinom (tabell 1 og tabell S1). I tillegg ble 12 FFPE tykktarmskreft prøver med kjente mutasjoner i KRAS og BRAF inkludert (

kolon KRAS /BRAF-varianter deteksjon satt

, Tabell 1 og Tabell S1). Alle ekstraksjoner fra FF materiale ble utført ved anvendelse av QiaSymphony som beskrevet ovenfor. RNA ble ekstrahert manuelt fra FFPE- blokker ved hjelp av AmpTec ExpressArt kits og DNA ble ekstrahert semi-automatisk fra FFPE- blokker på QiaSymphony. RNA ble ekstrahert i to parallelle reaksjoner; en behandlet med DNase og den andre ble i tillegg behandlet med Exonulcease jeg som katalyserer fjerning av nukleotider fra enkeltkjedet (ss) DNA.

Forberedelse og sekvensering av DNA Exome-Seq biblioteker

genomiske DNA-bibliotek ble fremstilt fra FF- og FFPE-avledet DNA ved hjelp TruSeq DNA-bibliotek forberedelse kits (Illumina, etter gel-free-protokollen) etterfulgt av exome berikelse hjelp TruSeq exome kits (Illumina). gDNA bibliotek forberedelser ble gjort i henhold til produsentens manual med følgende modifikasjoner. (1) For å unngå kanteffekter, 1,2 ug av dsDNA ble behandlet ved bruk av et QIAGEN UF filterplate, vasket to ganger i buffer EB ([10 mM Tris-Cl, pH 8,5], QIAGEN) og resuspendert i 50 pl buffer EB før de brukes som innspill til TruSeq gDNA biblioteket forberedelse. (2) Et antall PCR-sykluser som benyttes for amplifisering av FFPE-avledede bibliotekene ble øket fra 10 til 11. (3) Etter den endelige perle-rensetrinn av de forsterkede gDNA bibliotekene ble 10 ul buffer EB tilsatt til bibliotekene, bringer det endelige volum opp til 40 mL. Størrelsesfordelingen av de gDNA bibliotekene ble estimert ved on-chip elektroforese (DNA 1000 DNA-chip) av en 1 pl prøve på et Agilent 2100 Bioanalyzer (Agilent Technologies). DNA konsentrasjon av bibliotekene ble estimert ved hjelp av KAPA Bibliotek Kvantifisering Kit (Kapa Biosystems). Kort, kvantifisering ble gjort ved hjelp av 10 ul reaksjonsvolumer som inneholder 6 mL KAPA reagens /primer mix og 4 mL 1.000.000 ganger fortynnede prøven etter den anbefalte framgangsmåten og de medfølgende standarder. Kvantifisering ble utført på tre uavhengige fortynninger av hver prøve. Exome målet ble utført på bassenger av opptil seks gDNA bibliotekene bruker 500 ng av hver gDNA bibliotek i henhold til produsentens anbefalinger. gDNA biblioteker fremstilt fra FF og FFPE-prøver ble ikke slått sammen. Etter den endelige perle-rensetrinn av den exome fanges opp og forsterkes gDNA bibliotek, ble 30 ul buffer EB tilsatt til bibliotekene, å bringe det endelige volumet til 60 mL. Størrelsesfordelinger av de fangede bibliotekene ble estimert ved on-chip elektroforese (Høy følsomhet DNA chip) av en 1 mL prøve på en Agilent 2100 Bioanalyzer (Agilent Technologies). DNA-konsentrasjonen av bibliotekene ble estimert ved hjelp av KAPA biblioteket Kvantifisering sett som beskrevet ovenfor. Den exome fanget gDNA bibliotekene ble slått sammen til 2 nm samlet aksjer, denaturert og fortynnet til 22:00 med pre-kjølt hybridisering buffer og lastet inn TruSeq PE v3 flowcells på en Illumina CBOT fulgt av indeksert parvise end sekvensering (101 + 7 + 101 bp ) på en Illumina HiSeq 2000 ved hjelp TruSeq SBS Kit v3 kjemi (Illumina).

mutasjonsstatus i BRAF og KRAS

KRAS Hotell og

BRAF

mutasjon analyse av de 11 prøvene i

kolon KRAS /BRAF-varianter deteksjon sett

ble utført som beskrevet [16]. Kort,

KRAS

kodon 12, 13 og 61 og

BRAF

V600E og kodon 442-474 ble undersøkt ved hjelp av Lightscanner (Idaho Technology). Prøver med divergerende smeltekurver ble ytterligere validert av Sanger-sekvensering på 3130x Genetic Analyzer (Applied Biosystems)

Forberedelse og sekvensering av RNA-Seq biblioteker

For å aktivere en grundig analyse av RNA-Seq data, kreves vi metoden som brukes for fremstilling av RNA-Seq biblioteker for å gi strand-spesifikke (directional) og parvise end informasjon samt legge til rette for multipleks sekvensering. På grunn av den forventede degradering av RNA fra FFPE-vev, bør biblioteket fremstillingsmetoden ikke være basert på utvelgelse av poly (A) +, da dette ville svekke bibliotek fremstilling eller i det minste resultere i en 3 «forspenning. Innhenting av total-RNA-Seq data vil videre legge til rette for en mer fullstendig oversikt over transkriptom. Når studien ble igangsatt i 2011, den eneste kommersialiserte kit oppfylle alle kravene var Ribo-Zero-teknologi (Epicentre, en Illumina selskap) for uttømming av rRNA fulgt av biblioteket forberedelse bruke ScriptSeq teknologi (Epicentre, en Illumina selskap). Cytoplasmatiske og mitokondrie rRNA ble fjernet fra total RNA ved hjelp av Ribo-Zero Magnetic Gold Kit (human /mus /rotte, Epicentre, en Illumina selskap) å følge produsentens instruksjoner. I korthet ble rRNA fjerning løsning tilsatt til 500 ng av total RNA og inkubert i 10 minutter ved 68 ° C, deretter 15 minutter ved romtemperatur. Prober hybridisert med rRNA ble fjernet ved tilsetning av RNA-probe blanding for å vasket magnetiske kuler, etterfulgt av inkubering i 5 minutter ved romtemperatur, blanding ved virvling, inkubering i 5 minutter ved 50 ° C, magnetisering og overføring av supernatanten til en RNase- gratis tube. Den rRNA utarmet RNA ble renset ved hjelp Agencourt RNAClean XP Kit (Beckman Coulter Inc., Brea, CA, USA). I korthet ble et 1,8 x volum av AMPure RNAClean XP perler tilsettes til rRNA utarmet RNA, etterfulgt av inkubasjon i 15 minutter ved romtemperatur, to 80% etanolvask og eluering i 30 ul RNase-fritt vann. Kvaliteten på rRNA utarmet RNA ble estimert ved on-chip elektroforese (Picochip) av en 1 pl prøve på et Agilent 2100 Bioanalyzer (Agilent Technologies). Savant Speed-vac (Thermo Fischer Scientific) ble anvendt for å redusere den gjenværende prøvevolumet til 9,5 pl, etterfulgt av syntese av retnings, parvise ende og indekserte RNA-Seq biblioteker ved hjelp av ScriptSeq v2 kit (Epicentre, et Illumina selskap) etter den anbefalte prosedyre. I korthet rRNA utarmet RNA var kjemisk fragmentert (med mindre alvorlig svekket RNA fra FFPE-vev ble anvendt i hvilket tilfelle ytterligere fragmentering ble utelatt), ved å følge prosedyren som er beskrevet i appendiks i ScriptSeq manuell og cDNA ble syntetisert fra en merket tilfeldig heksamer. CDNA ble terminal merket ved anvendelse av en 3»-endeblokkerte og merkede oligo- fulgt av MiniElute (QIAGEN) rensing. Di-merket cDNA ble deretter brukt som mal for PCR (10 sykluser for FF prøver, 13 sykluser for FFPE- prøver) ved hjelp av FailSafe PCR Enzyme (Epicentre, en Illumina selskap), en forover primer og en indeksert /strek revers primer. De forsterkede bibliotekene ble renset ved hjelp Agencourt XP Kit (Beckman Coulter). I korthet ble en 1,0x volum av AMPure XP-perler (Beckman Coulter) tilsatt til hver PCR-reaksjon, etterfulgt av inkubasjon i 15 minutter ved romtemperatur, ble to 80% etanolvask og eluering i 20 ul RNase-fritt vann. Kvalitetene av RNA-Seq bibliotekene ble estimert ved on-chip elektroforese (Høy følsomhet DNA chip) av en 1 mL prøve på en Agilent 2100 Bioanalyzer (Agilent Technologies). DNA konsentrasjon av bibliotekene ble estimert ved hjelp av KAPA Bibliotek Kvantifisering Kit (Kapa Biosystems) følger den anbefalte framgangsmåten og de medfølgende standarder. RNA-Seq bibliotekene ble slått sammen til to nM samlede aksjer, denaturert og fortynnet til 22:00 med pre-kjølt hybridisering buffer og lastet inn TruSeq PE v3 flowcells på en Illumina CBOT fulgt av indeksert parvise end sekvensering (101 + 7 + 101 bp ) på en Illumina HiSeq 2000 ved hjelp TruSeq SBS Kit v3 kjemi (Illumina).

Sekvensanalyse analyse~~POS=HEADCOMP

Den analytiske arbeidsflyt er beskrevet i denne delen og grafisk presentert i figur S2. Sammenkoblede de-multiplex fastq filene ble generert ved hjelp casava programvare (Illumina) og innledende kvalitetskontroll ble utført ved hjelp FastQC [17] eller casava.

Koblede de-multiplex fastq filer fra DNA-exome bibliotekene ble importert til CLC Genomics Workbench (CLC Bio, versjon 6.0.1) som kjører på CLC Genomics Server (CLC Bio, versjon 5.0.1). Adaptor sekvenser og baser med lav kvalitet ble trimmet og leser ble kartlagt til HG19.

fjerne dupliserte kartlagt leser

verktøyet ble brukt til å fjerne paret leser at har samme start- og sluttkoordinater og er dermed trolig PCR duplikater. Varianter ble påvist i exome data med CLC Bio Probabilistic Variant Caller ved hjelp av følgende parametere: Minimum dekning = 10; Variant sannsynlighet = 90,0; Maksimale forventede varianter = 4; Krav til lyder i begge retninger som støtter samtalen.

Koblede de-multiplex fastq filer fra RNA-Seq bibliotekene ble trimmet for strekninger med adapter sekvenser, blitt med i en enkelt lese hvis mulig etterfulgt av kvalitet trimming bruker kommandoer fra CLC Assembly Cell (CLC Bio, versjon 4.012.84829). Dette resulterte i tre forskjellige fastq filer: parvise end data, single-end data etter at han kom over sammenkoblede leser, og single-end data etter eliminering av en av de sammenkoblede leser på grunn av f.eks lav kvalitet. Alle tre typer fastq filer ble deretter importert porsjonsvis inn i CLC Genomics Workbench (CLC Bio, versjon 6.0.1) som kjører på en CLC Genomics Server (CLC Bio, versjon 5.0.1) med CLC Server Command Line Tools (CLC Bio, versjon 1.7.1). Den importerte høy kvalitet leser ble kartlagt mot genområder og transkripsjoner kommenterte av Human NCBI REFSEQ 30 oktober 2012 i to kjøringer av RNA-Seq analyseverktøyet for CLC Genomics Workbench. RNA-seq verktøyet ble kjørt med

Bruk referanse med merknader

alternativet. Med dette alternativet, leser er kartlagt mot sekvenser som tilsvarer de kommenterte genet og karakterutskrift sekvenser. I første løp, passer bare til fremover strand av genene ble akseptert (med strand-spesifikke fremover opsjon); i andre løp, leser som ikke ble kartlagt i første løp ble kartlagt slik at bare passer til det motsatte tråd av genene (ved hjelp av tråd spesifikke-bakover alternativ). For å estimere forurensning med rRNA, leser som ikke kartlegge det menneskelige transkriptom som definert av RefSeq, ble kartlagt tråd bestemt fremover mot menneske rRNA (HSU13369, HSU13369, HSU13369 og NC_012920) og un-kartlagt leser ble deretter kartlagt tråd bestemt bakover mot menneske rRNA.

Kartlegging rapporter

og

detaljert kartlegging Reports

ble generert fra hver RNA-Seq analyse for hver prøve, eksportert fra CLC Genomics Workbench i Microsoft Excel-format, som er lagret som individuelle tabulatorseparerte tekstfiler, og spesifikke data ble deretter ekstrahert og undersøkt. For hvert forsøk, gen-messig kartlegging matriser av både forover og bakover RNA-Seq analyserer mot den menneskelige transkriptom ble eksportert fra CLC Genomics Workbench som tabulatorseparerte tekstfiler for leting og statistisk analyse i R datamiljø (versjon 3.0.1 for Windows [18]). Disse gen-messig kartlegging matriser oppsummere kartlegging resulterer i kolonner med RPKM verdier og tellinger av leser kartlegging til forskjellige regioner, slik som genet, ekson, ekson-exon og exon-intron. Matriser av «total exon leser» tellinger ble valgt ut fra gensemessig kartlegging matriser og analysert i R pakken

Empirisk analyse av Digital genuttrykk data i R

(edger, versjon 3.2.3 [19] – [ ,,,0],23]) ved hjelp av multidimensjonal skalering (MDS) verktøy for utforskende analyse og de ulike tilgjengelige statistiske verktøy for identifisering av ulikt berørt gener. R pakke Hexbin ble brukt til å plotte RNA-Seq basert uttrykk profiler (base på RPKM verdier) av sekskantede binger. Tråd spesifisitet ble estimert som den fraksjon av det totale genet leser kartlegging i retning forover i forhold til det totale antall lyder kartlegging i begge retninger. Gener med færre enn 10 leser kartlegging i retning fremover ble utelatt. For å estimere brøkdel av dupliseres sekvenser i RNA-Seq data post kartlegging (fremover), ble BAM filer eksportert fra CLC Genomics Workbench og analysert ved hjelp av MarkDuplicates verktøy i Picard verktøy (Picard-tools-1,47, [24]).

Tiltredelse av data

Alle data som ligger til grunn funnene som er beskrevet i manuskriptet er fullt tilgjengelig uten restriksjoner. Tilgang til sekvensdata, som inneholder person identifiserende informasjon, trenger signatur på en kontrollert tilgang form, og kan nås på Den europeiske Genome-phenome Arkiv [25] med studien ID EGAS00001000737 følgende forespørsel til MOMA Data Access Committee. Expression matriser er tilgjengelig uten restriksjoner gjennom ArrayExpress [26] under tiltredelse E-mtab-2523.

Resultater

Vi studerte den potensielle bruken av FFPE-prøver i NGS-baserte retrospektive og prospektive kliniske studier, fokusert på deteksjon av systematiske effekter av fikseringsprosessen av variant samtaler i DNA-Seq og på ekspresjonsprofiler i RNA-Seq.

Legg att eit svar