AI+医疗 | 基于神经网络的新型乳腺癌检测框架

发布时间:2021-06-18

 

论文题名:Generalized Multiscale RBF Networks and the DCT for Breast Cancer Detection

论文作者:Carlos Beltran-Perez, Hua-Liang Wei, Adrian Rubio-Solis

全文链接:http://www.ijac.net/en/article/doi/10.1007/s11633-019-1210-y

参考链接:https://mp.weixin.qq.com/s/XpG1Y620VesoTnbcagNAbA

在公共健康领域,乳腺癌图像检测是一项非常重要却极具挑战的研究。此前,MSRBF网络(multiscale generalized radial basis function)尚未应用于图像处理技术及计算机辅助诊断系统(Computer-aided diagnosis, CAD)中。英国谢菲尔德大学的研究者们基于此,通过升级版的MSRBF网络,在机器学习背景下提出一种新型CAD系统,该系统可有效服务于乳腺癌检测(全文下载)。研究成果已于2020年2月发表在IJAC第一期专题中。

图片来自Springer

数字图像处理技术和计算机视觉技术为当前很多现实问题提供了越来越多的解决方法。在图像分类中,图像处理方法旨在识别可见及隐藏的模式(visible and hidden patterns),以支撑后续的统计推断过程(subsequent statistical inference process),并会首先提取出有关特征(features)信息作为分析所需的输入项。

基于近期发表的成果可看出,不少学者更接受系统识别方法(system identification approaches),该方法仅仅基于系统输入和输出的历史记录来建立模型(building models),无需内部结构(inner structure)的先验知识(prior knowledge),同样能够从系统行为(system′s behavior)中识别及复制行为模式(behavioural patterns)。在图像处理领域,拥有这样模式识别能力(pattern recognition capability)的系统识别模型(system identification models)让学者们的研究兴趣盎然。

有关计算机辅助诊断(Computer-aided diagnosis, CAD)的研究发展迅速,很好地将图像处理及计算机视觉技术应用到了医疗领域,特别是在完成可视化及诊断任务时(visualisation and diagnostic tasks)所起的作用尤为突出。

当前,CAD技术在智能系统中取得了诸多进展,如协助放射诊断学家(radiologists)做出医疗决策的软件支撑平台(software supporting platforms)。人工神经网络(artificial neural networks, ANN)因其出色的建模能力(modeling capacity),成为CAD系统中最受欢迎的一种系统识别方法(system identification approaches)。

此外,很多CAD系统专家愈发倾向于借助多层人工神经网络(multi-layered ANN)来得到最佳逼近(better approximations)。然而,网络中隐层(hidden layers)越多,模型映射(model mapping)就会越慢且越复杂。

相反地,众所周知,单隐层网络(single hidden-layer networks),如径向基函数(radial basis functions),在估算任何连续函数(continuous function)时的效率都很高,可独立于线性度测量(linearity degree)。径向基函数神经网络(Radial basis functions networks, RBF)是一种典型的人工神经网络。尽管RBF网络是加权线性结构(linearly weighted structure),在求解算法(solution algorithm)中会简化训练(ease the training)、舍弃复杂的非线性流程(discard complex nonlinear procedures),但仍可有效解决非线性系统识别问题(nonlinear system identification problems)。

谈及非线性分析(nonlinear analysis),其在研究真实系统(real-life systems)中的重要性只增不减。随着图像在诸多应用领域作用凸显、存储能力(storage capacities)不断提升、数据迁移速度不断加快(data transference speeds),非线性分析在数字图像处理(digital image processing)中的相关性(relevance)也与日俱增。例如:图像处理中的非线性分析,其对于图像的排他性线性程序(exclusively linear procedures)可能使得最终在边缘(edges)、非高斯噪音(non-Gaussian noise)及其他随机畸变中(other random distortions)得到的结果不尽如人意。当要求进行高准确度分析(high accuracy analysis)时,一些重要因素(Factors)的有效性可能明显降低( effectiveness reduces significantly)。

尽管RBF网络在建模及解决问题上具有简洁性的优势,但在构建高度动态(highly dynamic)及迅速变化的系统(rapidly changing systems)时,其产生的逼近(approximations)可能缺乏灵活性(flexibility)。

当前,可替代RBF、突破这一局限性的是多尺度RBF网络(multiscale version of RBF),即广义多尺度RBF网络(generalized multiscale RBF networks),该网络不仅能保持RBF网络建模的简洁性(simplicity),还能兼具复杂网络的优势。

在本研究之前,MSRBF网络(multiscale generalized radial basis function)尚未应用于图像处理技术及CAD系统中。为从图像中提取高质量信息(high-quality information),完成图像分类任务,本研究采用MSRBF网络,并与离散余弦变换(discrete cosine transform, DCT)相结合。在机器学习背景下提出一种新型CAD系统,基本框架如图一所示,本文第三部分做了详细介绍,借助k-means++聚类算法(clustering algorithm),训练及测试过程融入进分类当中以完成计算机辅助诊断。

Fig.1

图片来自论文

此外,为使数字图像信息(digital image information)与非线性系统识别问题(nonlinear system identification problems)相一致,本研究还基于NARX (nonlinear autoregressive with exogenous inputs)提出了数字图像的输入-输出映射(input-output mapping)。

测试结果显示:本文所提的新方法可作为一种有效的CAD系统同时应用于钼靶摄影(X-ray mammography)及显微镜影像(microscopy instances)等乳腺癌图像检测(breast cancer image detection)当中,而在公共健康领域,该项检测非常重要却极具挑战。

当前,RBF网络已经广泛应用于现实生活中,如复杂系统建模(modelling of complex systems)、近地磁场预测(prediction of near-earth geomagnetic field)、面部识别(face recognition)、动态系统建模及识别(modelling and identification of dynamical systems)、三维物体识别(three-dimensional object recognition)、动力系统控制(motor systems control)等,同时在CAD系统中也发挥着重要作用,如大脑病理检测(pathological brain detection)、乳腺癌检测(breast cancer detection)。

综上,本文提出一种全新的图像处理框架(image processing framework),可基于升级版RBF网络(improved version of RBF networks)完成特征提取(feature extraction),同时还在框架中结合了DCT的优势来压缩信息(compress information)。最终,本研究成功将MSRBF方法用于CAD系统中并服务于乳腺癌检测。

来源:《International Journal of Automation and Computing》编辑部