实例:以癌细胞识别为例,介绍机器识别全过程。
将显微细胞图像转换成数字化细胞图像,其中灰度数字图像的像素值反映光密度的大小。
(1)预处理的目的:
①去除在数据获取时引入的噪声与干扰;
②去除所有夹杂在背景的次要图像,突出主要的待识别图像。
(2)区域划分的目的:
找出区分边界,划分出三个区域,为特征抽取做准备。
目的:为了建立各种特征的数学模型,用于分类。
(1)特征抽取:在原始采集数据上进行特征抽取。
eg:对一个细胞抽取33个特征,建立一个33维的空间,每个细胞可以通过一个33维随机向量表示。
(2)特征选择:在原始特征基础上选择一些主要特征作为判别使用;
(3)特征提取:采用某种变换技术,进行特征维数压缩。
判别结果通过错误率评估。

(1)数据获取:用计算机可以运算的符号来表示所研究的对象。
(2)预处理:去除噪声,提取有用信息,并对输入测量仪器或其他因素所造成的退化现象进行复原。
(3)特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征。
测量空间:原始数据组成的空间
特征空间:分类识别赖以进行的空间
模式表示:维数较高的测量空间 -> 维数较低的特征空间
(4)分类决策:在特征空间中用模式识别的方法把被识别对象归为某一类。
采用概率论和数理统计的方法,通过判别函数,使得误判概率最小。
对模式结构进行分析,将模式表示为基元,基元之间满足一定的语法结构。

以隶属度μ为基础,运用模糊数学中的“关系”概念和运算进行分类。
隶属度反映了某一元素属于某集合的程度。

以人工神经元为基础,模拟人脑神经细胞的工作特点,实现形象思维的模拟。
(1)监督分类:在有足够先验知识的前提下,利用判别函数进行分类判别。
(2)非监督分类:在没有先验知识的情况下,采用聚类分析的方法。



自相关矩阵定义为随机向量与自身的外积的数学期望:



