从大
数据挖掘从大数据库中挖掘关联规则(编辑修改稿)
不会打破交易中的任何模式 包含了序列模式挖掘所需的全部信息 紧密 去除不相关信息 —不包含非频繁项 支持度降序排列 : 支持度高的项在 FPtree中共享的机会也高 决不会比原数据库大(如果不计算树节点的额外开销 ) 例子 : 对于 Connect4 数据库 ,压缩率超过 100 2020116 数据挖掘:概念和技术 20 用 FPtree挖掘频繁集 基本思想