千亿球友会智能优化与控制课题组在非平衡数据流挖掘领域取得希望

算法框架图
在众多现实问题中,如装备故障检测、信用卡诓骗行为监测、天气预告和电力价钱展望,数据大多以流的形式一直发生,称之数据流。这些数据wangwang随着时间推移一直到来,而且可能发生动态转变,称之为看法漂移。研究怎样构建有用的数据流分类模子,有助于人们从海量的数据中提取有价值的信息,为科学评判和决议提供支持,进而发生更大的社会价值。
克日,千亿球友会智能优化与控制课题组焦博韬博士、郭一楠教授和巩敦卫教授在gai领域取得研究希望,研究效果形成论文“Dynamic Ensemble Selection for Imbalanced Data Streams With Concept Drift”,gai论文以中国矿业大学为第一单元,揭晓在中科院一区期刊《IEEE Transactions on Neural Networks and Learning Systems》(IF:14.255)。
本文针对数据流分类问题,提出了一种新颖的动态集因素类框架,旨在顺应具有种别不平衡的数据流中的漂移看法。首先jie助循环缓存数组,将数据流转化为数据块序列。基于相邻数据块间的样天职布的转变,设计了一种具有自顺应近邻的少数类过采样要领来平衡数据块中差异种别间样本规模的差异,并提出一种刷新的集成选择战略,用于从候选分类器池中为每一个查询样本构建最佳的分类器组合。
gai效果首ci面向数据流分类问题提出一种动态集成框架,在顺应看法漂移的同时,提高了模子对少数类样本的识别能力。在九个合成数据集和五个现实数据集的实验效果批注,所提出的要领可以准确地跟踪不平衡数据流中的新看法。