Abstract
NCI-60 panel av 60 humane kreftcellelinjer av ni ulike vev av opprinnelse har blitt omfattende karakterisert biologiske, molekylære og farmakologiske studier. Analyser av data fra slike undersøkelser har gitt verdifull informasjon for å forstå cellulære prosesser og utvikling av strategier for diagnostisering og behandling av kreft. Her ble Affymetrix® Genechip ™ miRNA versjon 1 oligonukleotid mikromatriser benyttes for å kvantifisere 847 microRNAs for å generere et uttrykk datasett av 495 (58,4%) microRNAs som ble identifisert som uttrykkes i det minste en celle-linje i NCI-60 panel. Nøyaktigheten av mikroRNA målingene ble delvis bekreftet ved revers transkripsjon og polymerase chain reaction analyser. I likhet med det som er sett blant de fire eksisterende NCI-60 mikroRNA datasett, konkordansen av det nye uttrykket datasett med de andre fire var beskjeden, med gjennomsnittlige Pearson korrelasjonskoeffisienter på 0,37 til 0,54. Til tross for dette, ble sammenlignbare resultater med forskjellige datasett angitt i gruppering av de cellelinjer ved deres mikroRNA uttrykk, differensiell ekspresjon av microRNAs etter linjene «vev av opprinnelse, og korrelasjon av spesifikke microRNAs med doblingstiden for celler eller deres strålingsfølsomhet. Mutasjon status av cellelinjer for
TP53, PTEN Hotell og
BRAF
men ikke
CDKN2A
eller
KRAS
kreftrelaterte gener ble funnet å være forbundet med endringer i uttrykket av spesifikke microRNAs. Den mikroRNA datasettet som genereres her bør være verdifulle for de som arbeider i feltet av microRNAs samt i integromic studier av NCI-60 panel
Citation. Patnaik SK, Dahlgaard J, Mazin W, Kannisto E, Jensen T, Knudsen S, et al. (2012) Uttrykk for microRNAs i NCI-60 kreftcellelinjer. PLoS ONE 7 (11): e49918. doi: 10,1371 /journal.pone.0049918
Redaktør: Sumitra Deb, Virginia Commonwealth University, USA
mottatt: 6 august 2012; Godkjent: 15 oktober 2012; Publisert: 28.11.2012
Copyright: © 2012 Patnaik et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Arbeidet ble finansiert av Roswell Park Cancer Institute, Buffalo, New York, USA, og medisinsk prognose Institute, Hørsholm, Danmark. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:. Forfatterne har lest journalen politikk og har følgende konflikter: medforfattere JD , WM og SK er /var ansatte i Medical Prognose Institute, Hørsholm, Danmark, som fokuserer på utvikling og kommersialisering av microarray-basert teknologi for bruk i klinisk behandling for kreft. Men dette betyr ikke endre sin tilslutning til alle PLoS ONE politikk på deling av data og materialer. En av medforfatterne av dette manuskriptet, Sai Yendamuri (SY) er en PLoS ONE Editorial styremedlem. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer.
Innledning
Systematiske studier av settene med cellelinjer har gitt innsikt i biologiske prosesser og deres mekanismer , og har vist seg å være nyttig for å utforme diagnostiske og terapeutiske tilnærminger. For eksempel, fosfatase og tensin homolog (PTEN) -avhengige og-uavhengig tumor suppressor mekanismer har blitt identifisert ved hjelp av et panel av melanomcellelinjer [1], og genetiske markører for følsomhet for stoffet anti-kreft, trastuzumab (Herceptin ™) er avgrenset ved hjelp av et panel av brystkreftcellelinjer [2]. NCI-60 panel av 60 humane tumorcellelinjer av ulike histologier og ni forskjellige vev av opprinnelse ble utviklet av National Cancer Institute (NCI) i USA på slutten av 1980-tallet i den hensikt screening anti-kreft narkotika [3]. I løpet av de siste to tiårene, har NCI-60-celler blitt brukt til å teste mer enn 150.000 kjemiske forbindelser og naturlig produkt ekstrakter for medisiner [4]. Tallrike studier har profilerte cellene for fenotypiske egenskaper, for eksempel dobling tid, legemiddelutstrømningen, og strålingsfølsomhet, og for karakterisering av deres genomer og nivåene av RNA, proteiner og metabolitter [5], [6], [7]. Analyser av data integrert fra flere studier har også gitt betydelige innsikt av biologisk og klinisk betydning [8].
microRNAs, kort ikke-kodende RNA, spiller viktige roller i cellulære prosesser ved å målrette protein-kodende mRNA transkripter å hemme oversettelse eller føre sin degradering. Hos mennesker har 2.042 arter av modne microRNAs blitt identifisert som per den nyeste versjonen (19, august 2012) av miRBase mikroRNA sekvens depot [9]. Feilregulert ekspresjon av microRNAs forekommer i mange sykdommer, innbefattet kreft [10], og denne observasjonen har ført til flere studier som viser terapeutisk og biomarkør anvendeligheten av disse molekylene [11], [12]. Evaluering av microRNAs uttrykt i NCI-60 panel av cellelinjer som har vist seg nyttig for å identifisere blant annet, biologiske rollene til spesifikke microRNAs [13], [14], mekanistiske baser og biomarkør potensialet av microRNAs i medikamentsensitivitet [ ,,,0],15], [16], genetiske signaturer for sykdommer [17], [18], og de strukturelle fundamentet for mikroRNA regulatoriske nettverk [19], [20].
ekspresjon av microRNAs i NCI-60 cellene ble først kvantifisert i 2007 av Gaur, et al. [21] og Blower, et al. [22] i studier som henholdsvis undersøkt 241 og 321 arter av molekylene. Den aktuelle studien var designet for å utvide NCI-60 mikroRNA uttrykk profiler for å dekke de mange hundre microRNAs at siden har blitt oppdaget. Selv om denne studien har pågått, har to andre gruppene publiserte data kvantifisering 700 microRNAs i NCI-60 panel [23], [24]. Her, i tillegg til genereringen og karakterisering av en ny mikroRNA uttrykk datasettet, blir slike multiple datasett sammenlignes, og analyser som integrere informasjon om celleformering, mRNA-ekspresjon, onkogene mutasjoner, eller stråling følsomhet fra studier av cellelinjen panel er rapportert.
Materialer og metoder
Isolering av RNA fra cellene i NCI-60 Panel
for hver av de 60 cellelinjer av NCI-60 panel (tabell S1), en ml frosne celler (1-2 x 10
6) i cellelinje-spesifikk kulturmedium inneholdende 10% dimetylsulfoksyd ble oppnådd fra Therapeutics Program Developmental (DTP) av Division of Cancer Treatment og diagnostisering av NCI. Umiddelbart forut for RNA isolering,-celler ble tint i et vannbad ved 37 ° C i fem minutter og samlet opp ved sentrifugering ved 200 g i fem minutter ved romtemperatur. Isolering av total RNA fra celler ved hjelp av Mirvana ™ kit (Ambion®, Austin, TX) ble utført i randomiserte grupper av 12-24 cellelinjer i løpet av fire dager i løpet av 10 dager etter skaffe cellene. RNA-konsentrasjon ble målt ved absorbans spektrofotometri på en Nanodrop ™ 2000 instrument (Thermo Scientific®, Waltham, MA).
Kvantifisering av microRNAs ved revers transkripsjon-PCR (RT-PCR)
Nivåer av moden microRNAs
MIR-16
,
-21
,
-30a-5p
,
-106a Hotell og
-200b
i 50 ng total-RNA ble målt ved anvendelse av TaqMan ™ mikroRNA revers transkripsjon kit og RT-PCR-analyser (Applied Biosystems®, Foster City, CA) ifølge protokollene foreslått av produsenten. Identifikasjonsnumre for de mikroRNA assays var 391, 397, 417, 578, og 1800, respektivt. RT og PCR reaksjoner for alle RNA prøver ble utført sammen for hver mikroRNA analyse. Cycle kvantifisering (C
q) verdier ble beregnet som gjennomsnittet av C
q-verdier som er identifisert ved SDS-programvaren (versjon 2.3, Applied Biosystems®) for tre eksemplarer 40-syklus PCR reaksjoner som ble utført i en 7900HT termo (Applied Biosystems®)
Mikromatrise Hybridisering
Genechip ™ miRNA array (versjon 1;. Affymetrix®, Santa Clara, CA) plattformen ble brukt til å kvantifisere microRNAs totalt RNA isolert fra NCI-60 celler. En mikrogram RNA ble polyadenylert og ligert med biotinylerte 3DNA ™ dendrimerne bruker FlashTag ™ Biotin HSR RNA Merking Kit (Genisphere®, Hatfield, PA). Det merkede RNA, i et volum på 80 pl, ble oppvarmet til 99 ° C i 5 minutter og deretter til 45 ° C i 5 minutter for lasting på en matrise ved hjelp av materiale og fremgangsmåter tilveiebragt med den Affymetrix® Genechip ™ Hybridisering, Wash og flekk kit. RNA-matrise hybridisering ble utført med omrøring ved 60 omdreininger pr minutt i 16-18 timer ved 48 ° C på en 450 Affymetrix® lufthåndtering stasjon, hvoretter matriser ble vasket og streptavidin-fykoerytrin konjugat ble anvendt for deteksjon av bundne RNA videre matriser med Genechip ™ Systems 3000Dx2 (Affymetrix®) konfokal laser-scanning mikroskop. Signal verdier ble beregnet ved hjelp Affymetrix® Genechip ™ Command konsollprogramvaren. Data fra alle matriser hadde lav bakgrunnsstøy, en tilsvarende fordeling av-signaler for endogene RNA, og en lignende og konsentrasjonsavhengig signal fordeling for spesifikke RNA som ble tilsatt i RNA-prøver før de ble merket. Den rå signal data har blitt deponert med tiltredelse nummer E-mtab-327 i ArrayExpress database av det europeiske Bioinformatikk Institute [25].
Genechip ™ miRNA versjon 1.0 matrisen har 11 mikrometer store 46,228 probe-spots for 7,815 DNA oligonukleotidprober inkludert de mot 922 ikke-mikroRNA menneskelige RNA, 847 menneskelige microRNAs og 5,856 microRNAs av 70 andre arter. Sonder for å oppdage microRNAs er oppdaget på tabellen i fire. Matrisen har også 95 uspesifikke sonder, hver flekket opp til 94 ganger, som er binned av GC innhold. Signaler fra disse bakgrunns sonder brukes til å lage «manglende» eller «tilstede» deteksjons anrop. I alt ble 72 matrisehybridiseringer utført i ni grupper, hver med åtte rekker, i løpet av tre dager, med to, tre og fire batcher som er brukt på den første, andre og tredje dag, henholdsvis (tabell S1). Kvadruplikeres hybridizations ble utført i fire tilfeldig utvalgte cellelinjer for å vurdere teknisk replikerbarhet (tabell S1).
mikroarray data Processing
Rå datafiler fra de 72 rekkehybridiseringer ble behandlet sammen ved hjelp Affymetrix® miRNA QC Tool (versjon 1.0.33) med følgende trinn for som foreslått av Genisphere®: bakgrunn deteksjon, bakgrunnskorreksjon med den robuste multichip gjennomsnitt (RMA) metoden [26], quantile normalisering, og median polsk samandrag [27]. Kvalitetskontroll og inter-replikere korrelasjons-analyser ble brukt for å identifisere den beste av de fire replikater for fire av RNA preparater (fire cellelinjer) som ble analysert i kvadruplikat. Data fra de resterende tre gjentak ble ekskludert fra det endelige uttrykket datasett. På dette stadiet, uttrykket datamatrisen hadde signalverdier for 7635 menneske så vel som ikke-menneskelige RNA. Verdier for 324 ikke-mikroRNA RNA og 2.282 microRNAs med «fraværende» deteksjons samtaler for alle 60 cellelinjer ble deretter fjernet fra datamatrise. Uttrykk av RNA med signalverdier 4x gjennomsnittlig inter-kvartil spekter av signalverdier for alle RNA ble ansett som fraværende, og RNA som uttrykk var fraværende i alle cellelinjene ble deretter ekskludert fra videre analyser
. sammenligning med eksisterende NCI-60 mikroRNA Expression datasett
Pre-behandlet mikroRNA uttrykk datasett generert av Blower, et al. [22], Gaur, et al. [21], Liu, et al. [24], og Sokilde, et al. [23] ble henholdsvis oppnådd ved bruk av NCI sin CellMiner ™ webapplikasjon [28], DTP nettsted, forfatterne, og Gene Expression Omnibus av National Center for Biotechnology Information, USA, med tiltredelse nummer GSE26375. For datasettet fra Gaur, et al., Rad-navnene for microRNAs ble standardisert til de navnene som brukes i versjon 15 av miRBase database [9] som har blitt beskrevet tidligere [23]. Pearson korrelasjonskoeffisienter mellom untransformed mikroRNA måleverdier i disse datasettene og i en generert i denne studien ble beregnet ved hjelp av R.
Korrelasjons Analyser av Nivåer av microRNAs og deres mål mRNA
Raw genuttrykk data skaffes ved hjelp av Affymetrix® Genechip ™ HG-U133A DNA oligonukleotid mikromatriser for ekspresjon av mRNA i 57 av de 60 NCI-60-celle-linjer av denne studien kunne oppnås ved bruk av CellMiner ™ web-applikasjon. En liste over 10,392 konservert mRNA (unike gen symboler) spådd av TargetScan 5,1 algoritme [29] for å være mål for 153 konservert mikroRNA familier ble innhentet online på https://www.targetscan.org. MRNA uttrykk data var pre-prosessert ved hjelp av RMA metoden med Affy Bioconductor pakken [30] i R, for å få normalisert og logge
2-transformert microarray signalverdier. Et filter ble deretter brukt til å beholde verdier for bare de prober for hvilken prøven rekke signalverdier var ≥1. Av de 495 microRNAs vurderes uttrykt i denne studien, 192, som hører til totalt 121 konserverte mikroRNA familier, ble identifisert som målgruppe 6465 av 10,392 mRNA. Gene symboler av 6,465 mRNA ble konvertert til 10,612 Affymetrix® probe identifikatorer bruker biomaRt Bioconductor pakken [31] i R. Totalt 117,004 Pearson korrelasjonskoeffisienter mellom uttrykk nivåer av de 192 microRNAs og deres mål mRNA som oppdaget av 10,612 sondene var så beregnet i R. tosidige t-tester med Benjamini-Hochberg korreksjon for en falsk funnrate (FDR) på mindre enn 5% ble brukt for å vurdere betydningen av sammenhenger. Korrelasjoner ble også beregnet for 10 tilfeldige permutasjoner av klasse etiketter (identifiserer cellelinjer) av mRNA uttrykk datasett.
Annet
limma (versjon 3.10.0) Bioconductor pakke [32] ble brukt i R for analyse av differensial uttrykk hjelp av logg
2-transformerte uttrykk verdier. Statistiske analyser og grafisk plotting ble gjort ved hjelp av Excel ™ (versjon 12, Microsoft®, Redmond, Washington), Prism ™ (versjon 5.0c, GraphPad®, La Jolla, CA), og R (versjon 2.12.1). TM4 [33] MultiExperiment Viewer (versjon 4.6) ble brukt for hierarkisk clustering analyse med optimalisering for blad-bestilling. Med mindre annet er angitt, ble en P-verdi under 0,05 i statistiske tester brukes til å anse statistisk signifikans. Detaljer om korreksjon for multippel testing er utstyrt med resultatene av analysene der slik korreksjon ble anvendt.
Resultater
mikroRNA Expression Profilering av NCI-60 celler ved hjelp av Affymetrix® Mikromatriser
GeneChip® miRNA 1,0 mikromatriser fra Affymetrix® ble anvendt for å undersøke ekspresjon av 847 microRNAs i total-RNA fra 60 cellelinjer NCI-60 kreftcellelinje panel (tabell S1). Dette arbeidet ble utført over tre dager i totalt ni grupper av åtte RNA prøver hver (tabell S1). RNA anvendt for ekspresjon profilering ble oppnådd fra frosne celler, ligner på en tidligere studie av mikroRNA ekspresjon i NCI-60 panel [21]. Utbyttet av RNA 1-2 × 10
6 celler i cellelinjer varierte 11-60 ug (gjennomsnitt = 37; standardavvik [SD] = 11).
Teknisk replikerbarhet av uttrykket profilering metode ble bekreftet ved undersøkelse av hybridiserings-data for fire RNA-preparater, ett hver fra KM12, PC-3, RPMI-8226 og OVCAR-8-cellelinjer som ble analysert i kvadruplikat. Den gjennomsnittlige (og SD) av 75-prosentilene av log
2-transformert microarray signalverdier for kvadruplikeres sett for de 1,779 sonder (847 for microRNAs) kommenterte som menneske spesifikke var 3,58 (0,07), 3,61 (0,12), 3,62 (0,04) og 3,50 (0,10), respektivt. For 95-persentiler, var verdiene 9,43 (0,09) henholdsvis 9,60 (0,10) 9,66 (0,11) og 9,60 (0,21). Mean (og SD) av de 12 selvselv Pearson korrelasjonskoeffisienter for de fire cellelinjer var 0,98 ( 0,01), 0,97 (0,01), 0,98 ( 0,01) og 0,98 (0,01), henholdsvis. For hver cellelinje, ble kvadruplikat-hybridiseringer utført på forskjellige dager, bortsett fra at for OVCAR-8, ett par av de quadruplicates ble analysert i den samme batchen (tabell S1). Pearsons korrelasjonskoeffisient var 0,980 for dette paret av intra-batch replikater.
I det minste en av de 60 cellelinjene uttrykte 523 (63,4%) av 847 microRNAs detekterbare ved microarray plattform som angitt ved en betydelig høyere signalverdier fra de mikroRNA-spesifikke prober i forhold til ikke-spesifikke prober mismatch med lignende GC-innhold. Selv om inter-replikere sammenhenger beskrevet ovenfor vises utmerket, en nærmere undersøkelse viste at korrelasjoner ikke var bra ved lave microarray signalverdier. Dette er vist i figur S1 for fire inter-replikere sammenligninger. Siden dette indikert høye støynivåer ved lave signalverdier, ble et signal verdibasert filtrering gjort for å identifisere RNA som kan anses som å være mer nøyaktig kvantifisert. Følgelig uttrykket av RNA med signalverdier 4x gjennomsnittet (18,3) av inter-kvartil områder av signalverdier for alle hybridizations, ble (område = 13,3 til 26,3 SD = 2,7) regnes som fraværende. Tjueåtte microRNAs med uttrykk fraværende i alle 60 cellelinjer som per disse kriteriene ble ekskludert fra videre analyser. Dermed 495 (58,4%) av de 847 microRNAs påvisbare med microarray plattform ble ansett uttrykt og dataene for dem ble brukt for senere analyser.
Sammenheng mellom Array- og RT-PCR-basert mikroRNA Kvantifiseringen
for å i det minste delvis bekrefte nøyaktigheten av arraybaserte mikroRNA uttrykk målinger, RT-PCR ble brukt til å kvantifisere nivåer av microRNAs
MIR-16
,
-21
,
-30a-5p
,
-106a
, og
-200b
i 50 ng hver av RNA forberedelsene til 12 cellelinjer. De cellelinjer ble tilfeldig valgt og microRNAs ble vilkårlig plukket fra dem for hvilke minst halvparten av de cellelinjer hadde log
2-transformerte mikromatrisesignalverdi 5. Som vist i figur 1, de to sett av målinger for alle fem microRNAs hadde signifikante korrelasjoner (P 0,01) i Pearson tester, med absolutt korrelasjonskoeffisient ≥0.70. Verdiene av skråningen av lineære regresjonslinjer (minste kvadraters metode) varierte fra
–
0,40 (
MIR-16
) til
–
0,93 (
speil 21
) for fire microRNAs, noe som indikerer bedre detectability av microRNAs med RT-PCR-analyse. For
MIR-200b
, dette er også kjent med de fem RNA prøver med dårlig microarray signalverdier (2
1.
2-2
1.
7), men påvisbare RT-PCR C
q verdier i et godt utvalg (27,8 til 34,3). For
MIR-30a-5p
, helningen på regresjonslinjen var
-.
2,2, noe som tyder på bedre detectability med microarray plattform
Pearson korrelasjonskoeffisienter (
r
), P-verdier, og best sittende (minste kvadraters) linjer vises for RT-PCR C
q og logge
2-transformert microarray signalverdier for microRNAs
MIR-16
,
-21
,
-30a-5p
,
-106a
, og
-200b product: (n = 12).
Sammenligning med eksisterende NCI-60 mikroRNA Expression datasett
av de 495 microRNAs anses uttrykt i settet av 60 cellelinjer i denne studien, 135 (27%), 144 (29%), 299 (60%) og 359 (73%) ble også kvantifisert i 59 av de 60 cellelinjer i studier av Blower, et al. [22], Gaur, et al. [21], Liu, et al. [24], og Sokilde, et al. [23], respektivt. henholdsvis disse fire studiene brukte custom 40-mer DNA-mikromatriser, TaqMan ™ RT-PCR-analyser, Agilent® 60-mer DNA-mikromatriser (versjon 2), og Exiqon® låst nukleinsyre miRCURY ™ mikromatriser (Dx, versjon 9.2) for å vurdere uttrykket fra 321, 241, 723 og 955 microRNAs hhv. I Pearson korrelasjonsanalyser av ikke-transformerte uttrykk målinger av microRNAs felles for denne og Blower, Gaur, Liu eller Sokilde studier, var gjennomsnittlig (og SD) av Pearson koeffisientene var 0,44 (0,30), 0,47 (0,28), 0,54 (0,29) og 0,45 (0,34), respektivt. Fraksjonene av microRNAs med Pearson koeffisient 0,75 0,18, 0,16, 0,29 og 0,24, respektivt (figur 2). I alle fire sammenligninger, korrelasjonskoeffisienter var høyere for microRNAs med høy signalverdier enn for de med lave verdier (data ikke vist). Lignende analyser ble også utført for å sammenligne datasett av Sokilde, et al. og Liu et al. mot andre (figur S2). Når korrelere Sokilde datasett med viften, Gaur og Liu datasett henholdsvis gjennomsnittet (og SD) av Pearson koeffisientene var 0,37 (0,32), 0,39 (0,33) og 0,44 (0,30), henholdsvis. Verdier var 0,47 (0,31) og 0,42 (0,22) i sammenligninger av Liu datasett med viften og Gaur datasett, henholdsvis. Dermed dømme etter sammenhenger sett med eksisterende datasett, den «korrekte» av mikroRNA uttrykk datasett generert i den aktuelle studien er lik de som genereres i tidligere studier. På grunn av varierende sensitivitet og spesifisitet av de fem kvantifisering plattformer av disse studiene for ulike microRNAs ble en cross-platform sammenligning for celle linjer sammenhenger ikke utført.
Akkumulert frekvensfordelinger er vist for Pearson korrelasjonskoeffisienter (
r
) med en bin-størrelse på 0,025 for microRNAs kvantifisert i denne studien og i studier av Blower, et al. [22], Gaur, et al. [21], Liu, et al. [24], og Sokilde, et al [23]. Fordelingen av koeffisientene med uttrykket målinger av Liu et al. resampled er også vist.
mikroRNA Expression og vev av Origin
For å vurdere om mikroRNA uttrykk blant cellelinjer ble assosiert med vev av opprinnelsen av cellelinjer, uten tilsyn hierarkisk clustering basert på gjennomsnittet uncentered Pearson korrelasjon ble utført ved hjelp av log
2-transformmicroarray signalverdier for 495 uttrykt microRNAs (figur 3A). Gruppene av leukemi og melanomcellelinjene helt segregert i egne selvstendige klynger. Alle de sju, men en (HCT-116) tykktarmskreft cellelinjer for segregert i en selvstendig klynge. En tilsvarende robust gruppering av cellelinjene for de resterende seks vev av opprinnelse ble ikke sett. Den OVCAR-8 ovarian cancer cellelinje og NCI /ADR-RES cellelinje avledet fra den [34], så vel som M14 melanomcellelinje og MDA-MB-435 cellelinje avledet fra den [35 ], gruppert som naboer som forventet. Dette ble imidlertid ikke sett for det tredje paret av homologe cellelinjer i NCI-60 panelet, U251 cellelinje og dens derivat, SNB-19 [36]. DNA fingerprinting antyder at, sammenlignet med 94% -97% genetisk likhet av de to andre parene, er dette par linjer bare 81% lignende.
A
. Unsupervised gruppering av 60 NCI-60 cellelinjer ved log
2-transformerte mikroarray-signalverdiene til 495 uttrykt microRNAs er vist som et dendrogram. De ulike typer vev av opprinnelsen av cellelinjene er indikert med sin farge (
Pr.
, Prostata). Treet er trukket fra uncentered Pearson korrelasjoner, med gjennomsnittlig sammenhengene som brukes for å bli med klynger. Skalaen til venstre representerer node-høyder.
B
. Heat-kart, med sin pseudo-fargeskala under, Z skalert microarray signalverdiene av 60 cellelinjer for de sett av åtte microRNAs hver med lavest P-verdier i tester av differensial uttrykk i cellelinjer av et bestemt vev opprinnelsesland sammenlignet med alle de andre cellelinjer. Begge cellelinjer og microRNAs er gruppert etter vev opprinnelsesland. Z skalering ble gjort langs radene (av mikroRNA).
For å identifisere microRNAs forskjellig uttrykt i cellelinjer av et bestemt vev-opprinnelse i forhold til alle de andre cellelinjer, empirisk Bayes moderert t- statistikk og Benjamini-Hochberg korreksjon for FDR 5% ble brukt. Gruppene av cellelinjer fra CNS-cancer (n = 6), tarmkreft (n = 7), leukemi (n = 6), melanom (n = 9), eggstokk-kreft (n = 7) og nyrekreft (n = 8), henholdsvis, viste differensial ekspresjon av 83 (17%), 37 (7%), 137 (28%), 74 (15%), 14 (3%) og 3 (0,6%) av 495 microRNAs til stede i hele datasettet. Det er ingen differensielt uttrykte microRNAs kunne identifiseres i grupper på cellelinjer fra bryst (n = 6), NSCLC (n = 9) eller prostata (n = 2) kreft om gruppene hadde 10 (2%), 24 (5% ) og 4 (0,8%) microRNAs som P-verdier var 0,05 uten justering for falsk oppdagelse. Den varme kart i figurene 3B og S6 viser ekspresjon av åtte microRNAs for hver av de ni gruppene av cellelinjene med de laveste P-verdiene. Detaljert statistikk for de 72 totale microRNAs er gitt i tabell S2.
mikroRNA Expression og stråling følsomhet
Amundson, et al. har undersøkt den gammastråling følsomheten av 59 av de 60 cellelinjer av denne undersøkelse for å kvantifisere syv forskjellige strålingsoverlevelses parametere [37]. Parametrene omfatter SF2, SF5 og SF8, brøkdel av cellepopulasjonen som overlever etter eksponering for 2, 5 og 8 Gy av stråling, henholdsvis. For å sjekke om de NCI-60 cellelinjer kan assortert i to stråling-sensitive og -resistente grupper av tilsvarende størrelse, som har blitt gjort for narkotika følsomhet (for eksempel [6], [38], [39]), en ikke-parametrisk metode ble brukt for å estimere Gaussian kernel tettheter av stråling responsdata etter log
2 transformasjon og z-poeng normalisering. En bimodal fordeling med omtrent like store sensitive og resistente grupper ble ikke observert for noen av de syv strålings overlevelse parametre (figur S3). Stråle parametrene ble derfor betraktet som avhengige variabler og Pearson korrelasjon analyser av log
2-transformert parameterverdier med log
2-transform mikroRNA uttrykk verdier ble utført. Skjønt signifikante korrelasjoner med absolutt Pearson koeffisient 0,5 ble ikke sett på fire av de strålingsfølsomhets parametre, de var til stede for 30 (6%), 27 (5%) og 33 (7%) av 495 uttrykt microRNAs av denne undersøkelse for SF2, SF5 og SF8 henholdsvis (figur S4). Imidlertid korrelasjonene for alle tre parametre ble i stor grad drives av de seks sterkeste strålingsfølsomme leukemicellelinjer NCI-60 panel. Når leukemi linjer ble ekskludert fra korrelasjonsanalyser, ekspresjon av ingen av de 495 microRNAs korrelerte med absolutt Pearson koeffisient 0,5 for noen av de tre strålefølsomhets parametere. Lignende resultater ble sett da mikroRNA ekspresjons-datasett av Liu et al. og Sokilde, et al. ble analysert (figur S4). .. Som er oppført i tabell S3, 10, fire og 14 microRNAs i datasettene i den aktuelle studien, Liu, et al, og Sokilde, et al, henholdsvis, hadde absolutt Pearson koeffisient 0,4 i minst ett av SF2, SF5 og SF8. MicroRNAs
la-7i
,
MIR-142-5p Hotell og
MIR-193b
var felles for de resultatene med de tre datasettene.
Association of microRNAs med Onkogen Mutasjoner
mutasjonsstatus av 24 onkogener er kjent for 59 av de 60 cellelinjer av denne studien [40]. For noen av genene –
BRAF
,
CDKN2A product: (
p16
),
KRAS
,
PTEN
, og
TP53
– onkogene mutasjoner eksisterer i 10 av cellelinjene, som gjør det mulig for en sammenligning av mikroRNA ekspresjonsnivåer mellom gruppene av mutant og vill-type cellelinjer. Ved hjelp av empirisk Bayes moderert t-statistikk og Benjamini-Hochberg korreksjon for FDR 5%, microRNAs
Mir-29b Hotell og
MIR-769-3p
ble funnet å være de eneste to microRNAs som ble uttrykt forskjellig mellom 47 mutant
PTEN Hotell og 12 villtype
PTEN
linjer (P 0,01 for begge microRNAs). I en tilsvarende analyse, microRNAs
MIR-34a Hotell og
MIR-34a * product: (
MIR-34a-3p
) ble funnet å være de eneste to microRNAs som var forskjellig uttrykt mellom 43 mutant
TP53 Hotell og 16 villtype
TP53
linjer (P 0,01 for begge microRNAs). Differensial uttrykk for fire
PTEN Anmeldelser – eller
TP53
-associated microRNAs er avbildet i figur 4. For
BRAF
genet, som 11 cellelinjer bærer mutasjoner , 40 microRNAs ble uttrykt forskjellig, med
MIR-146a Hotell og
MIR-509-3p
overexpressed og
MIR-149 Hotell og
mR-192b
underexpressed mest (tabell S5). Dette høye antallet forskjellig uttrykt microRNAs kan være fordi åtte av 11
BRAF
mutante cellelinjene er melanomcellelinjer. Ingen forskjellig uttrykt microRNAs ble identifisert i slike analyser for
CDKN2A
(33 mutante cellelinjer) eller
KRAS plakater (11 mutante cellelinjer).
Prikkplott med medianer og inter-kvartil områder er vist for uttrykket av microRNAs
Mir-29b, -34a
,
-34a * Hotell og
-769-3p
i 59 NCI-60 cellelinjer gruppert ved mutasjon status for
PTEN
eller
TP53
gener.
Sammenheng mellom nivåer av microRNAs og deres mål mRNA
ble påvist signifikante sammenhenger mellom uttrykk for microRNAs og mRNA for 3483 (3%) av 117,004 mulige par av microRNAs og sine mål mRNA som spådd av TargetScan algoritmen. De 3,483 parene besto av 167 microRNAs og 1,232 målet mRNA med unike genet symboler. Blant de 3,483 signifikante sammenhenger, 1997 (57%) var negative og 1486 (43%) var positive (figur S5). I motsetning til dette, var gjennomsnittlig og SD for antall signifikante korrelasjoner sett med 10 vilkårlige permutasjoner av mRNA-ekspresjon datasettet for å bytte celle linjer identifikatorer var 21,3 og 6,6, respektivt. Med Benjamini-Hochberg korreksjon for FDR under 5%, ble en middelverdi av 174 forventet. Videre er verdiene av 117,004 korrelasjonskoeffisienter som oppnås med den mRNA-ekspresjon datasettet var signifikant forskjellig i Wilcoxon Rank Sum tester (P mindre enn 2 x 10
-16)
diskusjon
uttrykket av 847 microRNAs i NCI-60 panel av humane tumorcellelinjer ble undersøkt i denne studien bruker Affymetrix® Genechip ™ miRNA 1.0 DNA oligonukleotid mikromatriser å generere et datasett av 495 microRNAs identifisert som uttrykkes i det minste en av de 60 linjene i panelet. Således studien utvider mikroRNA dekning av tre av de fire eksisterende NCI-60-ekspresjon datasett. Disse settene ble uavhengig generert ved hjelp av ulike høy gjennomstrømning plattformer – bestillings 40-mer DNA microarray, TaqMan ™ RT-PCR, Agilent® 60-mer mikromatriser DNA, eller Exiqon® låst nukleinsyre miRCURY ™ microarray – for å vurdere nivået av 321, 241, 723 eller 955 microRNAs, henholdsvis [21], [22], [23], [24]. Som vist i figur 2 og S2, er korrelasjonen av mikroRNA uttrykk målinger blant de fem datasettene beskjeden, med gjennomsnittlige Pearson koeffisienter varierer 0,37 til 0,54.