文理新闻内容

李艳颖教授团队在SCI一区期刊发表学术论文

发布日期:2024年05月06日 10:52 来源:研究生院、数学与信息科学学院 点击次数:

近日,我校数学与信息科学学院李艳颖教授团队完成的研究论文“A new filter feature selection algorithm for classification task by ensembling”在国际著名学术期刊Engineering Applications of Artificial Intelligence上发表。该期刊在最新的中国科学院SCI期刊分区表中属于一区期刊,最新影响因子为8.0。我校为该论文独立完成单位,李艳颖教授为唯一通讯作者,论文第一作者为我校数学与信息科学学院2020级应用数学专业硕士研究生龚欢欢。

(Engineering Applications of Artificial Intelligence, 2024, 131, 107865)

特征选择是一种重要的降维预处理技术,它通过获取信息量最大的特征子集来降低数据集的维数,同时最大限度地保留有效数据信息。针对特征之间依赖关系的单一度量方法,论文提出基于对称不确定性和皮尔逊相关系数的集成特征选择算法,该算法从线性和非线性两方面度量了特征之间的相关性。算法使用信息增益寻找与类变量相关性最高的一个特征,将信息增益值最高的特征添加到最终子集中。然后选择每次迭代满足新的评价函数最大的特征加入到最终子集中,直至达到停止标准为止。所提算法能有效选择出与类变量强相关、与其他已选特征低冗余的特征子集。在二十个公开数据集上的实验结果表明,所提方法获得的最终特征子集在大多数数据集上具有优异的分类性能,且与其他广泛使用的监督特征选择算法相比,数据维度的约减率更高。(研究生院、数学与信息科学学院 文、图/龚欢欢 审核/凡明锦、刘淳安)

原文链接:https://www.sciencedirect.com/science/article/abs/pii/S095219762400023X