PLoS ONE: dbCerEx: En Web-basert database for analyse av livmorhalskreft Transcriptomes

Abstract

Bakgrunn

Cervical kreft er rangert som den nest mest farlig plager blant kvinner over hele verden. I de siste to tiårene, har microarray teknologi blitt brukt til å studere gener involvert i malignitet fremgang. Men i de fleste av de publiserte studiene microarray, bare noen få gener ble rapportert forlater heller en stor mengde data ubrukte. Også har RNA-Seq data blir mer standard for transkriptom analyse og er mye brukt i studier av kreft. Det er en økende etterspørsel etter et verktøy for å hjelpe de eksperimentelle forskere som er opptatt av å utforske livmorhalskreft genterapi, men mangler datakompetanse for å få tilgang til og analysere høy gjennomstrømning genuttrykk data.

Beskrivelse

Den dbCerEx databasen er designet for å hente og behandle genuttrykk data fra livmorhalskreft prøver. Det inkluderer genom bredt uttrykk profiler av livmorhalskreft prøver, samt en web-verktøyet til klase gener med liknende uttrykk mønstre. Denne funksjonen vil hjelpe forskerne gjennomføre ytterligere undersøkelser for å avdekke nye genet funksjoner.

Konklusjon

dbCerEx database er fritt tilgjengelig for ikke-kommersiell bruk på https://128.135.207.10/dbCerEx/, og vil bli oppdatert og integrert med flere funksjoner som trengs

Citation. Zhou L, Zheng W, Luo M, Feng J, Jin Z, Wang Y, et al. (2014) dbCerEx: En Web-basert database for analyse av livmorhalskreft Transcriptomes. PLoS ONE 9 (6): e99834. doi: 10,1371 /journal.pone.0099834

Redaktør: I. Kong Jordan, Georgia Institute of Technology, USA

mottatt: 12 november 2013; Godkjent: 19 mai 2014; Publisert: 11 juni 2014

Copyright: © 2014 Zhou et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien er støttet av National Natural Science grunnlegger av Kina (Program No. 31202013), Specialized forskningsfond for doktorgradsutdanning av høyere utdanning i Kina (Program Nei 20120146120007), grunnleggende forskning midler til sentrale universiteter (Program No.2011QC075). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. Den kommersielle selskap (Yichang Humanwell Pharmaceutical Co., Ltd,), sammen med eventuelle annet knyttet til sysselsetting, rådgivning, patenter, produkter under utvikling eller markedsført produkter etc., har erklært at ingen konkurrerende interesser og Financial utlevering. Dette endrer ikke forfatternes tilslutning til PLoS ONE politikk på deling av data og materialer.

Innledning

livmorhalskreft redegjøre for de nest mest gynekologisk kreft død tilfeller over hele verden, og denne situasjonen er verre i utviklingsland på grunn av mangel på tilstrekkelig organiserte screeningprogrammer. Det antas at humant papillomavirus (HPV) infeksjoner er de viktigste årsakene til invasiv livmorhalskreft [1].

hel-genom uttrykk profilering har revolusjonert i måten vi studerer sykdom og grunnleggende biologi. Siden 1997 har antall publiserte resultater basert på en analyse av genuttrykk microarray data vokst fra 30 til over 5000 publikasjoner per år [2]. DNA mikroarray teknologier sikte på samtidige målinger av ekspresjonen av tusener av gener i en enkelt eksperiment. I løpet av de siste årene har denne teknologien tilrettelagt bedre forståelse av de komplekse og heterogene molekylære egenskapene til kreft og bidratt til bedre behandling i kreft. For eksempel vil HOXC10 genet først ble identifisert tilhører de 171 signifikant oppregulert gener i livmorhalsen plateepitelkarsinom (SCC) i forhold til normale livmorhalsen prøver fra DNA microarray, som senere ble identifisert som en viktig formidler av invasjonen i livmorhalskreft [3]. Arkiv RNA prøver av 25 pasienter ble hybridisert til Stanford microarray sjetonger for å bygge en syv-genet scoring system [4]. Dette genuttrykksmønstrene kan bidra til å identifisere pasienter med livmorhalskreft som kan behandles med strålebehandling alene. De spesifikke uttrykk profiler av kandidatgener ble valgt til å identifisere historiske undergrupper av livmorhalskreft [5]. Videre har en rekke kandidat biomarkører og terapeutiske mål er identifisert i andre kreftformer.

Men for de fleste av de publiserte studiene microarray, bare undergrupper av gener har blitt rapportert å demonstrere forfatternes hypotese. Den komplette microarray datasettene er lagret i en usystematisk måte, og nyttig bare for de med beregningskompetanse. Også har RNA-Seq data blir mer standard for transkriptom analyse og er mye brukt i studier av kreft. Mens for de fleste av de eksperimentelle forskere, er det også være vanskeligheter med å utnytte disse kreft microarray databaser og RNA-Seq data for å løse biologiske spørsmål. For eksempel, hvis en ny gen av interesse har en korrelert (positiv eller negativ) uttrykk mønster med en apoptose-relatert gen, betyr det at de kan dele den samme reguleringsmekanisme, noe som kan gi potensial forskning forslaget for romanen genet.

Her presenterer vi dbCerEx, en database med genuttrykk profiler generert fra DNA microarray eksperimenter og RNA-Seq data. Databasen er utstyrt med en integrert web-basert verktøy, som har gjort dataene lett tilgjengelig for livmorhalskreft forskningsmiljø. Ifølge denne metoden, kan de eksperimentelle forskerne identifisere nye livmorhalskreft relaterte gener og utforske relasjonene mellom dem.

Bygg og innhold

microarray og RNA-Seq data

microarray expression data (GSE matrix-filer) og plattform merknad (GPL-filer) ble hentet fra Gene Expression database Omnibus (GEO) [6] via en R [7] /Bioconductor [8] GEOquery «pakke [9]. RNA-Seq data ble hentet fra Kreft Genome Atlas (TCGA) Portal [10], som inneholder klinisk informasjon, genomisk karakterisering data og høy sekvensanalyse av tumor genomer. Dataene ble deretter log (base 2) transformert og median sentrert. For å unngå beregningsfeil under beregning, raden som inneholdt «NA» verdi ville bli utelatt.

Forsøkene ble behandlet via ulike plattformer (tabell 1). For å gjøre uttrykket data søkbare uavhengig av plattformene, ble sondene remapped offisielle genet symboler. Men i stedet for genet symbol tilordning informasjon, enkelte GPL-filer tilgjengelig bare NCBI GenBank [11] eller NCBI Refseq [12] deponeringsnummer tilordning til prober. For å løse dette problemet, ble den «gene2refseq «og» gene2accesion «filer hentet fra NCBI ftp server via ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/. En Perl-skript ble brukt til å kartlegge genet symboler til disse GenBank eller RefSeq deponeringsnummer, og til slutt til microarray prober. Genuttrykket flate filer ble lagret for senere å aksessere.

Forhåndsdefinert Gene Set

En viktig funksjon i denne databasen er at det gjør det mulig å søke tilsvarende genet kandidater med gener de studerer på grunnlag av de uttrykk mønstre. Å stole på denne metoden, kan forskere finne mekanismer mellom disse genene, som kan bli en lovende metode for å oppdage nye genfunksjon. De gensettene forhåndsdefinert i databasene ble hentet fra ulike kilder og delt inn i to hovedkategorier: Gene Ontologi (GO) [19] og Pathway. Som vist i tabell 2, GO sett består av biologisk prosess, Molecular funksjoner og Cellular Component. Mens Pathway Settet består av KEGG [20], BIOCARTA (www.biocarta.com) og REACTOME [21]. Menneskelige arter av genet sett ble brukt i dette arbeidet.

Gene Expression Cluster Analysis

unsupervised hierarkisk clustering algoritmen ble innført for å finne lignende gener basert på uttrykk mønstre. Dette forsøket ble behandlet ved hjelp av en kombinasjon av avstand beregninger og bindinger. I denne studien, avstanden fra genet x til gen y definert som en-r

xy, der r

xy representerer Pearson Korrelasjon av genet x og y:

Database Implementering

dbCerEx database er et web-basert verktøy som kombinerer en MySQL (https://www.mysql.com/) database management system [MySQL 5.5.32 (Felles Server) med InnoDB motor]. Front-end webgrensesnitt forsterkes av en java script rammeverk, Bootstrap 2.3.1 (https://getbootstrap.com/). PHP [versjon 5.3.10] (https://www.php.net/) applikasjoner motta spørringen fra brukeren, er koblet til databasen for å samle inn data, ring eksterne Perl og R-skript for å behandle statistisk analysere og generere HTML sider som viser resultatene.

Utility og diskusjon

dbCerEx database er levert av en web-basert grensesnitt. Brukere kan starte søket ved å skrive inn en interessert gen i den øverste input-boksen, og klikk deretter på Søk-knappen. Et gen listen vil bli vist på en ny side for alle gener relatert til innspill genet søkeord. Brukere kan velge et gen fra listen i henhold til beskrivelsen å gjøre uttrykket analyse.

Ved å klikke på et gen, en generell oppsummering inkludert fullt navn, aliaser og eksterne lenker som HNGC, Entrez Gene, Ensembl. MIM og Genecard for dette genet vil bli vist. På samme side, er brukerne lov til å sette parametrene uttrykksanalyse i livmorhalskreft. Brukere kan legge inn en interessert gen satt for hånd eller fra genet settliste som KEGG, BIOCARTA, REACTOME og Gene ontologi. Brukere kan velge datasett fra de ferdigbygd livmorhalskreft uttrykk datasett fra microarray og RNASeq, eller bare gi en GEO sjonsnummer. Ved å klikke på Send søk-knappen, vil prøvene for det valgte datasettet bli oppført. Brukere kan velge alle eller noen interesserte prøver å gjøre uttrykket analyse.

En heatmap viser hierarkisk clustering av gener og prøvene vil bli vist (figur 1). I tillegg vil en heatmap som inkluderer betydelig positivt eller negativt korrelerte gener med den interesserte genet også bli tilbudt (figur 2). Pearsons korrelasjon og p-verdi vil bli vist som en tabell på høyre side av heatmap.

De genene som har betydning Pearson korrelasjon med den interesserte genet ble valgt til å plotte en heatmap. Samplere er i kolonnen, og bestilt av uttrykk for interesserte genet.

Konklusjon

Vi presenterer dbCerEx, en database som inneholder livmorhalskreft genuttrykk profiler. I tillegg gir det en roman verktøy for genekspresjon likheten søk innenfor visse interesserte gensettene. Det antas at dbCerEx er en kraftig plattform for bioinformatikk oppdagelse som bringer livmorhalskreft microarray data og RNA-Seq data og analyse av livmorhalskreft forskningsmiljøet innen rekkevidde.

Tilgjengelighet og Krav

Den dbCerEx database nettsted er gratis tilgjengelig som en web-applikasjon på. https://128.135.207.10/dbCerEx/

Legg att eit svar