ChiMerge是监督的、自底向上的(即基于合并的)数据离散化方法。它依赖于卡方分析:具有最小卡方值的相邻区间合并在一起,直到满足确定的停止标准。

本程序取鸢尾花数据集作为待离散的数据集合,对四个数值属性分别进行离散化,结束阈值设定为max-interval=6。

其中鸢尾花数据取自UCI机器学习数据库(http://archive.ics.uci.edu/ml/datasets/Iris)。

Last edited Jan 27, 2013 at 8:59 AM by iceflying, version 2