- 数据挖掘算法实践与案例详解
- 丁兆云 沈大勇 徐伟 周鋆
- 293字
- 2025-04-09 18:12:41
2.1 分类的概念
从数学角度来说,分类问题可定义如下:已知集合C={y1, y2, y3,…, yn}, I={x1, x2, x3,…, xn},映射规则为y= f(x),∀xi∈I有且仅有一个yi∈C,使得yi∈f(xi)成立。
其中,C称为类别集合,其中每个元素是一个类别;I称为项集合(特征集合),其中每个元素是一个待分类项;f称为分类器,分类算法的任务就是构造分类器f。
分类的目标是构建一个可以描述和区分数据类或概念的模型,能够使用模型预测给定的数据类。
分类过程包括两个阶段。
(1)学习阶段
❑建立描述预先定义的数据类或概念集的分类器。
❑ 训练集提供了每个训练元组的类标号,分类的学习过程属于监督式学习。
(2)分类阶段
使用定义好的分类器进行分类。