近年來,由于高性能計算機的發展以及數據集規模的擴大,深度學習模型在醫學圖像分類檢測領域內取得了廣泛應用。利用深度學習從大規模醫學圖像數據庫中訓練自動診斷模型正引起廣泛的研究興趣。
方法
1.卷積神經網絡
受到生物神經系統的啟發,卷積神經網絡(CNN)在物體識別和檢測領域已經獲得了巨大成功。不同于傳統的神經網絡,CNN結合了局部連接和權值共享策略,因此,使得卷積神經網絡的參數大大減少,從而構建更深層數的卷積網絡成為可能。CNN的主要組成成分是卷積層,卷積層包含了許多神經元,每個神經元帶有一組可學習的權值和一個偏置項。這些權值會在網絡訓練的過程中不斷改變。每個神經元對于前一層的局部區域進行 感知,即將該局部區域作為其輸入。假定χlj是第l層卷積層的第j個神經元的輸出,且是第l-1層的神經元輸出,M表示當前神經元的局部輸入大小,那么χlj可以表示為:
其中表示連接至前一層第m個神經元輸出的權值,δ(.)表示神經元激活函數(一般常用ReLU非線性單元)。池化層(poolinglayer)和全連接層是CNN另一主要成分。
在本文中,我們將分類層softmax層作為全連接層的附屬層。一般而言,在卷積層之間會加入池化層,池化層本身不帶參數,其作用是減少卷積層輸出尺寸大小,從而大大減少整個網絡的參數數量,同時增強卷積層輸出特征的空間穩定性。因此,池化層在一定程度上可以避免網絡出現過擬合的情況。全連接層(fully-connectedlayer,FClayer)類似于卷積層,同樣是由許多神經元組成,但這里的神經元與前一層輸入之間是全連接的方式,即每個神經元與前一層所有輸入進行作用。Softmax層是CNN網絡的最后一層結構,其功能是對網絡提取的特征進行分類。為了評價網絡預測輸出與輸入圖像真實標簽之間的一致性,這里用到了損失函數。 具體而言,假定為輸入圖像,
是其對應的真實標簽,則損失函數可以表示為:
其中,表示網絡對輸入圖像Ii的預測類別概率輸出,此外,
是指示函數,
,當Ck=Ti時,其輸出值為1,反之則為0;fj是網絡對于圖像Ii在softmax層前一層第j個神經元的輸出。CNN訓練的目的就是獲取合適的權值參數,使得整個網絡能夠針對目標數據自動學習合適的特征表達,從而對于未知樣本得到比較好的預測結果。
2.CNN結構設置
對于像CNN-16這種深度的網絡,直接隨機初始參數的情況下訓練會出現收斂速度極慢,反向傳播更新參數過程會出現梯度消失等情況,因此,這里我們直接采用遷移學習的方式來初始化設置網絡,相應結果表示為CNN-16-TR。表1說明了實驗中CNN的具體結構細節。
3.數據增強
CNN網絡作為一種深度學習模型,其對于訓練數據量具有極大的要求。某種程度上,數據量的大小直接決定了網絡的規模,以及網絡的可訓練性。而臨床上,收集大量的且具有代表性的醫學圖像本身就相當困難,再加上這些數據還需要人工進行標注,因此,構建這種高質量大規模的醫學圖像數據集極具挑戰。而通過保持圖像本身標簽不變的情況下,對圖像數據進行多種變換來增大數據集的規模是一種可行且有效的數據增強方式。通過這種數據增強方式,我們可以大大增大數據集規模,從而解決醫學圖像數據集因為數據量不足而無法訓練CNN模型的情況。
4.遷移學習
即便CNN網絡具有極強的特征表達能力,在很多醫學圖像上得到了成功應用,但訓練的數據量依舊是最大的限制。因此,過擬合問題是有監督深度模型始終無法回避的一個話題。在這種情況下,先從大規模的數據集上預訓練一個CNN網絡,而后將該網絡的參數復制到目標網絡中是一個有效的網絡初始化方式,可以大大減少網絡訓練速度,同時避免訓練數據量過小而出現的過擬合現象。
目前,最常見遷移學習方法是首先在其他數據集上訓練一個基礎網絡,然后將該網絡的前n層參數復制到目標網絡對應層,而后目標網絡余下層則隨機初始化參數。根據訓練的方式不同,遷移學習可以分為兩種,一種是保持這些遷移過來的學習層參數固定,訓練過程中只改變后面隨機初始化的學習層參數;另一種則是在訓練過程中微調這些遷移的學習層參數。根據研究結果,由于ImageNet數據集與我們FFSP數據集之間圖像差異巨大,因此,遷移層數較多的情況下,采取前一種固定遷移參數的訓練方式并不適用,因此,在本研究中,我們采取微調的遷移學習方式。
實驗與結果
1.數據集與系統設置
2.定性分析評價
圖4中,(c)為CNN-8-TR提取的訓練集特征,可以看出四類切面特征基本很清楚的被區分,而(d)為CNN-8-RI提取的訓練集特征,四類切面特征還存在少量交叉。相對應的(g)、(h)分別為CNN-8-TR與CNN-8-RI測試集特征,結果與訓練集類似。
3.定量分析評價
目前,最主流的分類識別技術是利用人工特征結合分類器進行分類識別,這些方法基本思想是先從圖像中提取特征,同時對特征進行編碼,再訓練分類器進行分類識別,如基于DSIFT特征的編碼方式識別,包括直方圖編碼BoVW模型、局部特征聚合描述符VLAD編碼以及FV向量編碼。我們先前的研究工作就是利用這些方法進行FFSP的自動識別。
圖5是各個CNN網絡的分類性能ROC曲線和混淆矩陣。從圖5以及表2中可以看出,CNN-16-TR識別正確率高于CNN-8-TR,因此,加深CNN模型的深度能夠很好地提升最后的分類效果。此外,CNN-8-TR分類正確率高于CNN-8-RI,表明在其他數據集上預訓練基礎網絡,同時微調遷移參數也是一種改善CNN識別性能的有效方法。從實驗結果可以看出,所有CNN模型識別結果都表現良好,且都優于我們之前的手工特征分類結果。雖然CNN具有極強的分類性能,但在實驗結果中我們也觀察到了一些值得注意的細節:首先,測試階段,每張圖像綜合其10張子圖像的預測結果,這種10-croptesting比直接測試單張圖像的結果提升了3%左右。另外,采用遷移學習策略時,網絡收斂的速度大大加快,比隨機初始化參數的網絡收斂快一半以上的時間。
討論
深度網絡作為一種表達學習方法,通過組合迭代不同層次的特征,最后形成高層抽象特征,這種特征相對于傳統的人工特征而言,在概念表達方面具有更魯棒的性能或者說更具不變性。而且,深度網絡可以根據給定的數據,學習到對應的特征,因此,其泛化能力更強,可以推廣應用到不同的圖像領域。但是深度學習模型普遍要求足夠多的訓練數據量,否則網絡訓練會出現過擬合問題。在不同的圖像領域,顯然數據采集的難度不盡相同,且自然圖像數據集的規模往往遠大于醫學類圖像數據。因此,醫學圖像領域內,深度網絡應用的最大困難在于數據集規模的限制。
利用自然圖像數據集訓練基礎網絡,再進行遷移學習是解決當前不同圖像領域應用深度網絡數據量不足的有效方式。因此,本研究結合了遷移學習與數據增強的方式來綜合提升深度網絡分類性能。最后的結果分析也表明,其FFSP分類性能要遠遠好于我們之前的研究,即采用人工特征結合分類器分類的方法。
然而本研究依然存在一些不足之處,首先,測試集數量不夠多,只有2418張測試圖像,雖然在一定程度上可以反應CNN模型的分類性能,但更大量的數據應該更具說明性。這也是以后我們改進的方向之一。另外,在測試結果方面,依然存在提升的空間,不少接近FFSP的非標準切面被識別為標準切面。這跟圖像本身的噪聲以及差異度小有極大的關系。未來的研究中,可以通過給訓練集圖像隨機添加噪聲,來增加網絡識別的穩定性。另外,臨床醫生在尋找FFSP過程中,會考慮前后幀圖像的上下文信息,因此,在網絡訓練過程中加入當前圖像上下文信息可以消除FFSP與非FFSP類內差異小所帶來的干擾。
結論
本研究中,我們提出了用深度卷積網絡的方式來識別胎兒顏面部超聲圖像,同時,分析研究了不同深度結構的CNN模型對于FFSP分類的結果。為了防止由于訓練數據集數量不足而引發網絡訓練出現過擬合問題,我們采用了數據增強結合遷移學習的方式來改善網絡分類結果。最后的結果表明,深度網絡可以有效的識別FFSP標準切面,同時更深層的深度網絡能夠帶來更好的分類性能。因此,深度網絡與遷移學習的結合在臨床應用方面具有極大的前景,值得進一步的探索和研究。
中傳動網版權與免責聲明:
凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊
- 運動控制
- 伺服系統
- 機器視覺
- 機械傳動
- 編碼器
- 直驅系統
- 工業電源
- 電力電子
- 工業互聯
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機界面
- PLC
- 電氣聯接
- 工業機器人
- 低壓電器
- 機柜