2.1 分类的概念

从数学角度来说,分类问题可定义如下:已知集合C={y1y2y3,…, yn}, I={x1x2x3,…, xn},映射规则为y= fx),∀xiI有且仅有一个yiC,使得yifxi)成立。

其中,C称为类别集合,其中每个元素是一个类别;I称为项集合(特征集合),其中每个元素是一个待分类项;f称为分类器,分类算法的任务就是构造分类器f

分类的目标是构建一个可以描述和区分数据类或概念的模型,能够使用模型预测给定的数据类。

分类过程包括两个阶段。

(1)学习阶段

❑建立描述预先定义的数据类或概念集的分类器。

❑ 训练集提供了每个训练元组的类标号,分类的学习过程属于监督式学习。

(2)分类阶段

使用定义好的分类器进行分类。