Abstract
Formål
Denne artikkelen foreslår å karakterisere kontinuum av tykk- og endetarmskreft (CRC) bruker flere tekstur har hentet fra multispektrale optiske mikroskopi bilder. Tre typer patologiske vev (PT) er vurdert: benign hyperplasi, intraepitelial neoplasi og karsinom
Materialer og metoder
I den foreslåtte tilnærmingen, interesseområdet inneholder PT først hentet fra multispektrale. bilder ved hjelp av aktiv kontur segmentering. Denne regionen er så kodet med tekstur funksjoner basert på Laplace-of-Gaussian (LOG) filter, diskrete wavelets (DW) og grå nivå co-forekomst matriser (GLCM). For å vurdere betydningen av teksturelle forskjeller mellom PT typer, er en statistisk analyse basert på Kruskal-Wallis test utført. Nytten av tekstur har deretter evalueres kvantitativt i form av deres evne til å forutsi PT typer med ulike Klassifiserings modeller.
Resultater
Foreløpige resultater viser betydelige strukturforskjeller mellom PT typer, for alle tekstur funksjoner (
p
-verdi 0,01). Individuelt, GLCM tekstur har utkonkurrere logg og DW funksjoner i form av PT typen prediksjon. Imidlertid kan en høyere ytelse oppnås ved å kombinere alle tekstur funksjoner, noe som resulterer i en gjennomsnittlig klassifisering nøyaktighet på 98,92%, sensitivitet på 98,12%, og spesifisitet på 99,67%.
Konklusjoner
Disse resultatene demonstrere effektiviteten av å kombinere flere tekstur funksjoner for å karakter kontinuum av CRC og skille mellom patologisk vev i multispektrale bilder
Citation. Chaddad A, Desrosiers C, Bouridane A, Toews M, Hassan L, Tanougast C (2016) Multi Texture Analyser av tykktarmskreft Continuum Bruke multispektrale Imagery. PLoS ONE 11 (2): e0149893. doi: 10,1371 /journal.pone.0149893
Redaktør: Masaru Katoh, National Cancer Center, JAPAN
mottatt: 27 november 2015; Godkjent: 05.02.2016; Publisert: 22 februar 2016
Copyright: © 2016 Chaddad et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet:. Dataene er tilgjengelig i S1 (https://figshare.com/s/5e9c65848bb0aa1f4032 eller DOI: 10,6084 /m9.figshare.2076220).
finansiering:. forfatterne har ingen støtte eller finansiering for å rapportere
konkurrerende interesser: forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP (CRC) er en vanlig kreft å ha en økende forekomst i mange utviklede land.. Det er den tredje vanligste nylig diagnostisert kreft, sto for 8% av nye tilfeller hvert år, og også den tredje vanligste årsaken til kreftdød i både menn og kvinner [1]. Anslagsvis 26,270 menn og 24,040 kvinner døde av tykktarmskreft i 2014, som rapportert av American Cancer Society. Kirurgisk fjerning av den primære tumoren med kurativ hensikt er mulig i bare 70% av pasientene [2, 3]. Dessverre, opptil 30% av CRC pasienter som gjennomgår kirurgisk reseksjon av primærtumor erfaring en påfølgende tilbakefall innen tre år, med en median tid til døden av 12 måneder [4]. Imaging studier er ofte brukt for å evaluere pasienter for screening og iscenesettelse av tykktarmskreft. Tverrsnitt imaging teknikker som computertomografi (CT) [4], magnetisk resonans imaging (MRI) [5] og mikros gi anatomiske og morfologiske informasjon om strukturen og mønstre av svulsten [6]. I denne informasjonen, bilde tekstur, og spesielt tekstur heterogenitet, er et fremtredende trekk ved CRC som manifesterer seg som områder med høy celletetthet.
En fersk beregnings trenden har vært analyse av høyoppløselige hele lysbildene produsert fra digital patologi lysbilder [7, 8]. Texture funksjoner hentet fra slike bilder fungere som en inngang til viktige beregningsprogrammer som dataassistert diagnose fra patologi. En tidlig studie av Esgiar et al. viste at entropi tekstur har hentet fra grå-nivå co-forekomst matriser (GLCM) var i stand til å skille mellom normal og kreftvev [6]. En oppfølgingsstudie av de samme forfatterne innlemmet fraktale dimensjoner inn i funksjon analyse for å bedre sensitivitet og spesifisitet av klassifisering [9]. Ved hjelp av fargekanal histogrammer, GLCM og strukturelle trekk, Kalkan et al. oppnås en nøyaktighet på 75,15% i klassifiseringen av fire typer av kolon vev: normal, kreft, adenomatøse og inflammatoriske [10]. Jiao et al. foreslått en metode for automatisk gjenkjenning tykktarmskreft, ved hjelp GLCM for tekstur utvinning og støtte vektor maskiner (SVM) for klassifisering. Denne fremgangsmåten oppnådd en nøyaktighet på 96,67% i skille mellom kreft og ikke-kreft-bilder [11]. Hilado et al. brukte 2D diskret wavelet (DW) forvandle funksjoner for å klassifisere hele lysbildet tykktarmskreft bilder til normale, kreft og adenomatøse polypp tilfeller rapporterer en 91,11% nøyaktighet [12]. Francesca et al. brukte hele svulsten tekstur funksjoner, beregnet ved hjelp av Laplace-of-Gaussian (LOG) filtrene til å vurdere heterogenitet av CRC [4]. I en senere undersøkelse, Rao et al. Regnes logge tekstur funksjoner for å diskriminere mellom CRC pasienter med og uten levermetastaser [13]. Ulike tilnærminger med lokale beskrivelsene er også foreslått, inkludert metoder basert på skala-invariant funksjonen transform (sile) [14], form sammenheng [15], og histogrammer av orientert gradient (HOG) beskrivelsene [16]. Fordi de er avhengige av viktige punkter som kan variere fra ett emne til et annet, viktig punkt-baserte SIFT og form sammenheng har metodene er ikke alltid egnet for vurdering av celleforandringer fra optiske mikroskopi systemer. Likeledes er fremgangsmåter basert på HOG ikke er invariante for rotasjoner i mikroskopiske bilder. Det er derfor gode argumenter som støtter bruk av rotasjons-invariant tekstur funksjoner som stammer fra GLCM, logg filtre og DW for dette spesifikke problemet.
Som en generell metodikk, patologiske vev (PT) som følge av celleforandringer i CRC, slik som benign hyperplasi (BH), intraepitelial neoplasi (IN) og karsinom (Ca), kan oppdages fra klassiske optiske mikroskopi systemer bruker en rekke bildebehandlingsteknikker [17-19]. Denne studien foreslår å modellere kontinuum av CRC bruke rike, informative tekstur har innhentet fra multispektrale optiske mikroskopi bilder. Den diskriminerende evne struktur funksjoner kan oppleves fra figur 1, hvor histogrammet av piksel intensiteter er vist for bilder av BH, IN og Ca typer. Det kan sees at BH, IN og Ca vev oppviser merkbart forskjellige belastningsprofiler, støtter ideen om at en slik egenskap kan anvendes for å skille mellom disse PT-typene. Nyheten av dette arbeidet ligger i den komparative analysen og kombinasjon av tre forskjellige tekstur funksjoner basert på GLCM [17], log [4] og DW [20], for å forutsi PT typer. Som det vil bli vist i våre eksperimenter, ved hjelp av multi-tekstur informasjonen kan forbedre deteksjon og klassifisering av patologiske vev, og gi en mer helhetlig forståelse av sammenhengen mellom CRC og vev heterogenitet. De potensielle konsekvensene av dette arbeidet på forbedring av medisinsk behandling er todelt. I kombinasjon med standard screening tilnærminger for CRC, kan den foreslåtte metoden bedre deteksjon av sykdommen i en tidlig fase, og dermed øke sjansene for vellykket behandling. Ifølge American Cancer Society, er 5-års relativ overlevelse ca 90% når CRC kan oppdages før den har spredd seg [21]. Klassifiseringen av celleforandringer i patologisk vev er også viktig å vurdere utviklingen av CRC og velg passende løpet av behandlingen. Ved å bruke tekstur funksjoner, gir vår metode en effektiv måte å karakterisere vev egenskaper på cellenivå. Måling av stofflighet informasjon på ulike tidspunkter kan hjelpe spore sykdommen progresjon og vurdere effektiviteten av en gitt behandling
(a) hyperplasi.; (B) intraepitelial neoplasi; (C) Carcinoma; (D, E og F) Histograms showet piksel intensitet distribusjoner for hver type.
Materialer og metoder
Denne studien ble godkjent av Institutional Review Board of Anatomisk patologi (Anapath ) Avdelingen i CHU Nancy-Brabois Hospital. Gjennomgangen styret fravikes behovet for skriftlig informert samtykke fra deltakerne. En del av dataene ble brukt i tidligere studier [18, 22, 23]
Det foreslåtte rammeverk, som er vist i figur 2, består i en serie av fem trinn:. 1) prøvepreparering og bildeopptak, 2) ROI segmentering, 3) tekstur funksjonen utvinning, 4) PT typen klassifikasjon, og 5) ytelse evaluering. En detaljert presentasjon av hvert trinn er gitt i de følgende avsnittene.
(a) Optisk mikroskopi system, farging, seksjonering og skanning. (B) multispektrale bildet oppkjøpet via et CCD-kamera på en rekke visuelle spektrale band. (C) Aktiv kontur segmentering algoritme for opptegning Rois. (D) GLCM, logger og DW bilde tekstur funksjonen utvinning. (E) Overvåket klassifisering for automatisk prediksjon av unormale vevstyper fra nye prøver.
Prøvepreparering og bilde oppkjøpet
CRC data ble samlet inn fra Anatomisk patologi (Anapath) avdeling ved CHU Nancy-Brabois Hospital. Vevsprøver ble oppnådd fra sekvensiell resections av kolon fra 30 pasienter med kolorektal kreft. Deler av fem mikrometer tykkelse ble trukket ut og farget med den mye brukte haematoxylin og eosin (H E) flekker, for å redusere bildeprosesseringskravene. Bilder ble tatt ved lav forstørrelse (× 40) ved hjelp av en optisk mikroskop montert med en kostnad kombinert enhet (CCD) kamera. En flytende krystall fleksibel membran-filter (LCTF) ble plassert i den optiske bane mellom lyskilden og CCD-kameraet, som gir en båndbredde nøyaktighet på 5 nm og en regulerbar bølgelengde gjennom det synlige spektrum 500-650 nm [24]. Denne teknikken, kjent som hyperspektral eller multispektrale bildebehandling [25], kan ta bilder av vevsprøver på ulike spektrale frekvenser. I denne studien ble 16 multispektrale band ervervet i bølgelengdeområdet 500-650 nm, med 9.375 nm trinn mellom suksessive band.
Data fra 30 CRC pasienter (10 BH pasienter, 9 hos pasienter og 11 Ca pasienter) ble oppnådd for analyse, noe som gir en total på 160 BH bilder, 144 IN bilder og 176 Ca bilder. Dataene er tilgjengelige i S1 Zip (https://figshare.com/s/5e9c65848bb0aa1f4032 eller DOI: 10,6084 /m9.figshare.2076220). Identifiseringen av hver PT type fra multispektrale bilder ble gjort av en senior histopathologist, bekrefter diagnosen. Endelig, bildene ble denoised bruker en gjennomsnittlig filter og rescaled til en oppløsning på 512 × 512 piksler.
Aktiv kontur basert segmentering
Aktiv kontur segmentering ble brukt til å identifisere vev grenser i bildet. Dette segmentering teknikk, som beveger seg en dynamisk kurve iterativt mot objekt konturer i bildet, er godt tilpasset avgrense uregelmessige former [26, 27]. Selv om det kan oppnå en høy grad av nøyaktighet, kan det også lider av lange driftstider. For å akselerere segmenteringsprosessen, begrenset vi antallet iterasjoner basert på empiriske beregninger [17]. En multi-skala tilnærmingen ble anvendt for å ytterligere redusere kjøretider ved å utføre en initial oppdeling til en grov oppløsning av 64 x 64 piksler, og deretter raffinering denne løsningen ved en høy oppløsning på 512 x 512 piksler. Ved hjelp av denne teknikken, ble segmentations oppnådd på mindre enn et minutt med en standard PC (Intel Core i5 3,4 GHz prosessor med 32 GB RAM). Merk at runtime ytelsen kan forbedres via alternative spesialiserte beregnings teknologier, for eksempel en rørledning algoritme basert på FPGA (FPGA) -teknologi [28].
Ground sannhets segmentations, en segmentering per prøve, ble oppnådd manuelt ved hjelp av 3D Slicer [29] og validert av to patologer. Et eksempel på en bakke sannhet segmentering er gitt i Fig 3. ground truth Bildene ble brukt til å evaluere resultatene av den aktive kontur segmentering (fig 4), basert på følgende beregninger: Dice likheten koeffisient (DSC), falsk positiv rate ( FPR) og falsk negativ rate (FNR). DSC måler graden av korrespondanse (likheten) mellom bakken sannhet og segmentert Rois, og er definert som (1) der
En
og
B
er piksel sett tilsvarende undersøkelser på bakken og segmenterte regioner henholdsvis.
(a) Originalbilde bilde~~POS=HEADCOMP. (B) segmentert bilde. (C) den merkede bilde. Merket område (c) tilsvarer avkastningen brukes til tekstur funksjonen utvinning.
Top rad bildene svarer til (a) BH, (B) og (c) Ca typer. Bottom-rad bilder (a»), (B») og (c») viser avkastningen oppnådd på disse bildene av den aktive kontur segmentering metoden.
FPR og FNR er to mål på over og under segmentering, og er beregnet som følger: (2) (3) der inneholder pikslene som ikke er i bakken sannhet satt
En
Texture funksjonen utvinning
Tre. typer tekstur filtre, basert på loggen, DW og GLCM, ble brukt til segmentert ROIs i hvert spektral band. Texture funksjoner ble deretter ekstrahert fra de filtrerte bildene ved å bruke spesialiserte kvantifikator funksjoner (fig 2).
Logg basert Texture.
Laplace av Gaussian (LOG) filter kan sees på som en kombinasjon av en gaussisk utjevning operatør med en kjerne av bredde sigma (
σ
) og en isotrop filter, den Laplace, som måler andre romlige deriverte i bildet. Loggen er vanlig å påvise kanter og blobs på ulike skalaer. For hver segmentert ROI, ble en logg filter påføres med
σ
verdier på 0,5 (fin tekstur type), 1,5 (medium tekstur type) og 2,5 (grov tekstur type). Regionen ble deretter kvantifisert ved å beregne gjennomsnitt (
A
), standardavvik (
SD
) og Entropy (
Ent
) av sine loggverdier. Den teoretiske rammen av denne teknikken er beskrevet i detalj i vedlegg B av Ganeshan et al [30]. La
f product: (
x
,
y
) være loggen verdien av en piksel (
x
,
y
) i den segmenterte området
Ω
. For entropi beregning, diskretiserer vi fordelingen av loggen verdier i 256 like store intervaller og betegne som
Ω
k
undergruppe av piksler i
k
-te intervall. Loggen kvantifikator funksjoner kan defineres som følger: (4) (5) (6)
For hver prøve, vi oppnådd et sett med ni tekstur: (7) der
f
,
m
, og
c
representerer fine, medium og grov tekstur.
Texture basert på Discrete Wavelet (DW) Transform.
DW Transform (DWT) analyserer et bilde ved å dekomponere det inn i en grov tilnærming via low-pass filtrering og en detaljert komponent via high-pass filtrering. Dekomponeringen utføres rekursivt på lav-pass tilnærmingen koeffisienter som oppnås ved hvert nivå, inntil det nødvendige antall iterasjoner er nådd [31]. Fire nedbrytings retninger (sub-band) regnes: horisontal (0 °, D
h), første diagonal (45 °, D
d), vertikal (90 °, D
v) og andre diagonal (135 °, D
d). Dekomponeringen på hvert nivå
i
gir en tilnærmelse matrise (bilde) A
jeg og tre detalj matriser, nemlig Dh
i (horisontal koeffisient matrise), Dv
i (vertikal koeffisient matrise) og Dd
i (diagonal koeffisient matrise).
en ett nivå 2D DWT dekomponering ble brukt på hver ROI, koding regionens tekstur som en lavfrekvent komponent A
1 og tre høyfrekvente komponenter: D
d1 (diagonal detalj), D
v1 (vertikal detalj), og D
h1 (horisontal detalj) (fig 5). Tre kvantifikator funksjoner, måle entropi (
f
1DW), energi (
f
2DW) og varians (
f
3DW), ble brukt til den gjennomsnittlige DWT koeffisientene matrise (dvs. gjennomsnittet av A
1, Dh
1, Dv
1 og Dd
1 matriser) av Daubechies (db), Coiflet (skaut) og Symlet (sym) filtre, henholdsvis. For hver prøve ble 9 DW-baserte tekstur har erholdt, som svarer til den følgende funksjon vektoren: (8)
R tilsvarer rader, C svarer til kolonnene, l og h er indeksen av lav og høy pass filtrere henholdsvis 2ds1 og 1ds2 er down-sample kolonner og rader henholdsvis, og {x} er convolution operatør.
Texture basert grå nivå co-forekomst matrise.
Forslag ved Haralick i [32], den grå-nivået samtidig forekomst matrise (GLCM) er en effektiv tekstur analysemetode som benytter andre-ordens statistikk for å karakterisere egenskapene til to eller flere bildeelementverdier som opptrer på bestemte steder i forhold til hverandre. Formelt GLCM matriser representerer sannsynlighetene
P
d
,
θ product: (
i
,
j
) av overgangen fra en piksel med intensitet
jeg anbefale til en piksel av intensitet
j
atskilt med en oversettelse vektor definert av retning
θ Hotell og offset
d product: ( også kjent som avstand). Gitt et 2D-bilde
Jeg
størrelse
N
×
N
, co-forekomst matrise
P
d
,
θ product: (
i
,
j
) kan defineres som (9) der
dx Hotell og
dy
spesifisere avstanden mellom bildeelement av interesse og dets nabo langs x-aksen og y-aksen av et bilde, respektivt. Den GLCM matrise har en størrelse på
Ng
×
Ng
, der
Ng
er antall av gråtoner i bildet.
Vi pakket ut GLCM funksjoner som følger. Et histogram utjevning ble først brukt på den segment ROIs kodet med 256 gråtoner. GLCM matrikser ble deretter beregnet på grunnlag av fire forskyvninger (1, 2, 3 og 4 piksler) og fire faser (0 °, 45 °, 90 °, 135 °). Ved hjelp av denne teknikken, fikk vi 16 GLCM matriser av størrelse 256 × 256 for hver segmentert ROI. Texture funksjoner ble deretter beregnet ved å anvende 12 kvantifikator funksjoner på hver GLCM matrise, og gjennomsnittet av verdiene over de 16 GLCM matriser. De 12 kvantifikator funksjoner, foreslått av Haralick et al. [32] og Clausi D. [33], er rapportert. Texture funksjoner basert på kvantifisering av GLCM verdier kan uttrykkes som følgende vektor. (10)
Statistiske analyser og klassifiseringskriteriene
En statistisk analyse basert på Kruskal-Wallis test ble gjennomført ut for å måle viktigheten av tekstur funksjoner for å skille mellom de tre PT typer. Funksjoner som har en
p
-verdi på 0,01 eller mindre ble ansett som statistisk signifikant. Merk at denne analysen ikke brukes for funksjonsvalg, og følgelig ikke skjevhet følgende klassifisering trinnet
Fire klassifiseringsmetoder ble testet. Lineær diskriminant analyse (LDA) [34], naive Bayes (NB) [ ,,,0],35], beslutningstrær (DT) [36] og nærmeste naboer (NN) klassifiserer [37]. I LDA, blir sannsynlighetsfordelingsfunksjonene (PDF) av klasser antatt å være multivariate Gaussisk med forskjellig midlere men samme kovariansmatrisen, og Bayes klassifisering benyttes til å velge den klassen med maksimal sannsynlighet for hver testprøve. Naive Bayes anser funksjoner som uavhengig av hverandre, gitt sin klasse, og beregner PDF parametrene av disse funksjonene for hver klasse. En univariate Gaussian PDF antas for alle funksjoner. DT-klassifisering deler sett av treningsprøvene rekursivt, ved å anvende en terskel på valgte funksjoner, inntil alle bladnoder er tilstrekkelig rent (dvs. de inneholder prøver av den samme klasse) eller et maksimalt antall nivåer oppnås. I dette arbeidet ble Gini-indeksen brukes som mål på renhet [38]. NN finner
K
opplæring prøver nærmest en gitt prøve, basert på den euklidske avstand, og tildeler testprøven til de mest hyppige klasse av sine nærmeste naboer. Med utgangspunkt i tidligere tester, ble en verdi på
K
= 10 brukes for antall nærmeste naboer
Klassifiserings resultatene evalueres ved hjelp av tre beregninger:. Presisjon, følsomhet og spesifisitet [39]. Nøyaktigheten måler andelen av testprøver korrekt klassifisert ved fremgangsmåten. Følsomhet beregner, for hver klasse, forholdet mellom antallet sanne positive (dvs. positive prøvene klassifisert som positive ved hjelp av metoden) og totalt antall positive prøver. Resultatene oppnådd for hver klasse verdiene blir så gjennomsnitt proporsjonalt med antallet sampler i den tilsvarende klasse. Likeledes er spesifisiteten andelen av negative prøver som er klassifisert som negativ ved fremgangsmåten. I tillegg er arealet under mottakeren opererer karakteristiske kurven (AUC) som anvendes for å evaluere klassifiseringsresultatene for ulike beslutningsterskler. AUC-verdier oppnås ved å plotte kurven for sanne positive hastighet (dvs. følsomhet) mot falske positive (dvs. 1-spesifisitet), for forskjellige beslutningsterskler, og å måle det totale areal under kurven. En høyere AUC-verdien indikerer en bedre klassifikator.
En 10-fold kryssvalidering tilnærming ble benyttet for å få objektive beregninger av klassifikator ytelse. I denne tilnærmingen, er dataene første inndelt i 10 like store prøvesettene. Hvert sett holdes deretter ut etter tur for validering, mens de resterende eksempler er brukt til trening [40]. Den gjennomsnittlig ytelse, beregnet i løpet av disse 10 folder, er rapportert.
Resultater
Segmentering
Tabell 1 viser segmentering nøyaktighet i form av DSC, FPR og FNR innhentet av aktiv kontur segmentering metode, for bilder av de tre PT typer. Vi observerer DSC-verdier i området fra 86,31% -88,21%, med den beste ytelsen oppnås for Ca regioner. Videre ble utvalgene av 5,03% -7,61% og 16,11% -20,26% oppnådd for FPR og FNR, henholdsvis de laveste verdiene som tilsvarer i regioner (FPR = 5,03%) og Ca regioner (FNR = 16,11%). Disse resultatene bekrefter muligheten for aktiv kontur segmentering å nøyaktig trekke ut Rois, særlig regioner som tilsvarer Ca.
Texture analyse
gjennomsnitt og standardavvik av log-baserte tekstur egenskaper, oppnådd ved forskjellige filter skalaer, er vist i tabell 2. En Kruskall-Wallis-test ble anvendt for hver funksjon for å bestemme om dens fordeling av verdier varierer mellom PT typer. I denne test er nullhypotesen at gjennomsnittlig rangering av verdiene er den samme for hver type.
p
-verdier som oppnås for hver funksjon er gitt i den siste kolonnen i tabell 2. Med unntak av
En
c
, var gjennomsnittlig rang av loggfunksjoner er vesentlig høyere i Ca enn iN og BH (
p
-verdi 0,0001). Likeledes, var gjennomsnittlig rangering av IN er høyere enn BH, med unntak av funksjoner
En
c Hotell og
Ent
f
. Dette støtter ideen om at PT typer har forskjellige teksturegenskaper og som har basert på loggen kan brukes til å skille mellom disse typer vev unormalt.
En tilsvarende analyse ble utført for GLCM funksjoner (tabell 3) og DW funksjoner (tabell 4). For GLCM, var gjennomsnittlig rangering av funksjoner
f
1,
f
2
f
4
f
8
f
11 og
f
12 er vesentlig høyere i Ca enn i og BH typer. I motsetning til den gjennomsnittlige rangeringen av funksjonen
f
ni
er høyere i IN forhold til BH og Ca. I tillegg, var gjennomsnittlig rangering av funksjoner
f
5
f
6,
f
7 og
f
10 ble funnet å være betydelig høyere i BH enn iN (
p
-verdi 0,0001). For funksjoner hentet med DW transform, fant vi at funksjonene
f
1DW_db, og f
1DW_sym hadde en høyere gjennomsnittlig rang for IN enn BH og Ca typer, og at den gjennomsnittlige rangeringen av funksjoner
f
1DW_coif, f
2DW_db,
f
2DW_coif,
f
2DW_sym,
f
3DW_db,
f
3DW_coif og
f
3DW_sym var høyere i BH enn i og Ca typer (
p
-verdi 0,001) .
Totalt sett viser analysen potensialet i loggen, GLCM og DW tekstur funksjoner for å differensiere mellom PT typer. Videre, siden alle tekstur funksjoner ble funnet å være statistisk signifikant (
p
-verdi 0,01)., Alle av dem ble brukt for klassifisering (dvs. ble ingen funksjon utvalg steg som utføres før klassifisering)
Klassifisering
De tre sett med tekstur funksjoner (dvs.
F
LOG,
F
DW og
F
GLCM) ble evaluert i en klassifisering setting, bruke dem som innspill til LDA, NB, DT og NN classifiers. Forestillingen, i form av nøyaktighet, sensitivitet og spesifisitet, innhentet av disse classifiers for hver funksjon sett er rapportert i tabell 5. De beste klassifisering nøyaktighet oppnås for LOG, DW og GLCM er 81,17% (DT klassifiserer), 90,00% (LDA klassifikator ) og 94,37% (LDA sorter), respektivt.
Enes evne til klassifiserere for å diskriminere mellom par av PT-typer, ulike beslutningsterskler ble evaluert ved bruk av AUC metrisk. Resultatene, vist i tabell 6 og figur 6, viser at alle de tre settene med tekstur funksjoner er nyttige for å skjelne mellom alle par av PT typer, med AUC-verdier i området fra 98% til 100%. Videre Tabell 7 gir forvirring matrise oppnådd for de tre typer tekstur egenskaper. Vi ser at for alle teksturtyper, er den høyeste nøyaktighet oppnås for Ca (167/176 riktig klassifisert Ca prøver å bruke GLCM), og forekommer den hyppigste klassifiseringsfeil mellom BH og typer.
Den blå, svart og rød linje er for BH vs. IN, BH vs. Ca, og IN vs. Ca hhv. (A) Texture basert på loggen filter. (B) Texture basert på DWT filter. (C) Texture basert på GLCM.
For ytterligere å forbedre klassifiseringen ytelse, sammenkjedet vi funksjonene som stammer fra alle tre typer tekstur, noe som gir en vektor av 30 tekstur funksjoner. Ved bruk av denne tilnærmingen, erholdt vi en nøyaktighet på 98,92%, en sensitivitet på 98,12%, en spesifisitet på 99,67%, og en AUC på 100% ved bruk av LDA klassifikator (tabellene 5 og 6). Den ytelsesforbedring oppnås med multi-tekstur funksjoner kan også observeres i forvirringen matrise av tabell 7, med 157/160 av BH, 143/144 av IN, og 175/176 av Ca prøver riktig klassifisert.
randomisering test
randomiserte permutasjon tester ble brukt for å ytterligere kvantifisere betydningen av koblingen mellom bilde teksturer og PT typer. Flere forsøk ble gjennomført for å beregne klassifiseringen nøyaktighet fra tilfeldig permut PT typen etiketter. Denne tilnærmingen muliggjør kvantifisering av null fordeling av tekstur trekk klassifisering nøyaktighet, dvs. gitt null-hypotesen at funksjoner inneholder ingen informasjon angående PT typer, se permutasjon testing [41]. Analysen ble utført som før, bortsett fra at typen etiketter ble tilfeldig permuted før evaluering, og dermed generere en empirisk null distribusjon over klassifiserings resultater fra flere studier (1000 ganger). Som forventet er det null distribusjon toppet seg rundt klassifiseringsverdier tilsvarende tilfeldig gjette. f.eks nøyaktighet = 33,25% (median = 32,86%) for tekstur funksjoner basert på log filter, 33,81% (median = 33,75%) for funksjoner basert på DW, 33,83% (median = 33,95%) for de funksjoner som stammer fra GLCM, og 33,91% (median = 33,93%) for alle funksjonene (kombinerte funksjoner), (tabell 8). Disse fordelingene kan brukes til å beregne empirisk
p
-verdier for klassifisering resultatene oppnådd i forsøkene i kapittel 3, f.eks Tabell 5, som er i betydelig rekkevidde.
Diskusjoner
En multispektrale bildebehandling rørledningen ble presentert, i hvilke områder av interesse (Rois) representerer unormale vev blir automatisk segmentert via en effektiv multioppløsnings aktiv kontur metode. Denne metoden viste seg å være nøyaktig, med hensyn til en ekspert merket bakken sannhet, skaffe Dice likhetsverdier mellom 86,31% og 88,21%.
I en sammenlignende studie, vi evaluerte nytten av tre typer teksturer for å klassifisere patologisk vev knyttet til CRC. Individuelt, alle teksturer føre til klasse nøyaktighet over 80%, selv om GLCM basert teksturer gitt best resultater med en nøyaktighet på 94,37%, sensitivitet på 95,63% og spesifisitet på 100% (tabell 5). Sammenligning av resultater på tvers av PT typer, observerte vi at Ca prøvene har lavest feilrate, og at de fleste feil oppstod mellom BH og IN typer (Tabell 7). Vi observerte også at å kombinere alle tre teksturtyper (for totalt 30 funksjoner) gir best ytelse, med en nøyaktighet på 98,92%, sensitivitet på 98,12%, spesifisitet på 99,67% og AUC på 100% (tabell 5, 6 og 7 ). Dette indikerer at forskjellige tekstur har inneholde utfyllende informasjon, som kan kombineres på en synergistisk måte for å forbedre analysen.
Figur 7 viser korrelasjonen mellom de funksjonsverdiene som finnes i de tre PT typer, for hver type struktur . For logge basert tekstur egenskaper, er de høyeste korrelasjonsverdier observert mellom middels og grove teksturer av IN og Ca typer (Fig 7A). En tilsvarende sammenheng mønster er funnet mellom wavelet funksjoner i IN- og Ca typer (Fig 7B). I motsetning til dette er mindre korrelasjon observert mellom forskjellige GLCM funksjoner (fig 7C), noe som kan forklare deres relativt høye klassifisering nøyaktighet. Across PT typer, er lave korrelasjonsverdier observert mellom funksjoner, spesielt for LOG og GLCM teksturer. Igjen, støtter denne kjøre hypotesen om at tekstur funksjonene kan brukes til å karakterisere og identifisere patologiske vev i multispektrale CRC bilder.
(a) Texture funksjon basert på LOG filter,
En
,
Ent Hotell og
SD
er gjennomsnittlig, entropi og standardavvik på henholdsvis;
f
,
m Hotell og
c
er indeksen for fine, medium og grov tekstur hhv. (B) Texture funksjon basert på diskret wavelet der
f
en
,
f
2
,
og f
3
er henholdsvis Entropy, Energi og varians;
d
,
c Hotell og
s
er indeksen for Daubechies, Coiflet og Symlet wavelet hhv. (C) Texture funksjonen utvinning fra GLCM der
f
en
,
f
2
,
f
3
,
f
4
,
f
5
,
f
6
,
f
7
,
f
8
,
f
ni
,
f
10
,
f
11
og f
12
er indeksen for energi, entropi, Korrelasjon, kontrast, Inverse forskjell, Sum-varians, Sum-gjennomsnittet, Difference entropi, Cluster skygge, Cluster tendens, Maximum sannsynlighet, og forskjellen varians hhv.
til slutt ser vi at flere studier i litteraturen har skissert fordelene ved å bruke tekstur funksjoner for å identifisere unormale kolon prøver [6, 9 , 10, 42, 43, 44].