11. 参考文献#
里卡多·巴兰德拉,何塞·萨尔瓦多·桑切斯,V·加西亚,和埃德加·兰格尔。类别不平衡问题中的学习策略。模式识别,36(3):849–851,2003年。
Gustavo EAPA Batista, Ana LC Bazzan, 和 Maria Carolina Monard。平衡训练数据以自动注释关键词:一个案例研究。在WOB中,10-18页。2003年。
Gustavo EAPA Batista, Ronaldo C Prati, 和 Maria Carolina Monard. 关于几种平衡机器学习训练数据方法行为的研究. ACM SIGKDD探索通讯, 6(1):20–29, 2004.
Nitesh V Chawla, Kevin W Bowyer, Lawrence O Hall, 和 W Philip Kegelmeyer. Smote: 合成少数类过采样技术. 人工智能研究杂志, 16:321–357, 2002.
陈超、Andy Liaw、Leo Breiman 等人。使用随机森林学习不平衡数据。加州大学伯克利分校,110(1-12):24,2004年。
A. Esuli, S. Baccianella, 和 F. Sebastiani. 序数回归的评估方法. 智能系统设计与应用, 国际会议, 1:283–287, 2009年12月. URL: https://doi.ieeecomputersociety.org/10.1109/ISDA.2009.230, doi:10.1109/ISDA.2009.230.
Vicente García, José Salvador Sánchez, 和 Ramón Alberto Mollineda。关于预处理方法在处理不同类别不平衡水平时的有效性。基于知识的系统, 25(1):13–21, 2012.
Hui Han, Wen-Yuan Wang, 和 Bing-Huan Mao. Borderline-smote: 一种新的不平衡数据集学习中的过采样方法. 在 国际智能计算会议, 878–887. Springer, 2005.
Peter Hart. 浓缩最近邻规则(通信)。IEEE信息论汇刊, 14(3):515–516, 1968.
Haibo He, Yang Bai, Edwardo A Garcia, 和 Shutao Li. Adasyn: 用于不平衡学习的自适应合成采样方法. 在 2008 IEEE 国际神经网络联合会议 (IEEE 世界计算智能大会), 1322–1328. IEEE, 2008.
Shohei Hido, Hisashi Kashima, 和 Yutaka Takahashi. 针对不平衡数据的粗略平衡装袋方法. Statistical Analysis and Data Mining: The ASA Data Science Journal, 2(5-6):412–426, 2009.
Miroslav Kubat, Stan Matwin, 等人。解决不平衡训练集的诅咒:单边选择。在Icml中,第97卷,179–186页。美国纳什维尔,1997年。
Felix Last, Georgios Douzas, 和 Fernando Bacao. 基于k-means和SMOTE的不平衡学习过采样. arXiv预印本 arXiv:1711.00837, 2017.
Jorma Laurikkala. 通过平衡类别分布来改进难以识别的小类别的识别。在欧洲医学人工智能会议上,63–66页。Springer, 2001年。
刘旭英,吴建新,周志华。类别不平衡学习的探索性欠采样。IEEE系统、人与控制论汇刊,B部分(控制论),39(2):539–550,2008年。
Richard Maclin 和 David Opitz。对 bagging 和 boosting 的实证评估。AAAI/IAAI, 1997:546–551, 1997.
Inderjeet Mani 和 I Zhang。Knn 方法应用于不平衡数据分布:一个涉及信息提取的案例研究。在从不平衡数据集中学习的研讨会论文集中,第126卷。2003年。
Giovanna Menardi 和 Nicola Torelli。使用不平衡数据进行分类规则的训练和评估。数据挖掘与知识发现, 28:92–122, 2014. URL: https://doi.org/10.1007/s10618-012-0295-5, doi:10.1007/s10618-012-0295-5.
Hien M Nguyen, Eric W Cooper, 和 Katsuari Kamei。不平衡数据分类的边界过采样。在第五届国际计算智能与应用研讨会论文集,第2009卷,24-29页。IEEE SMC广岛分会,2009年。
Chris Seiffert, Taghi M Khoshgoftaar, Jason Van Hulse, 和 Amri Napolitano. Rusboost: 一种缓解类别不平衡的混合方法. IEEE Transactions on Systems, Man, and Cybernetics-Part A: Systems and Humans, 40(1):185–197, 2009.
迈克尔·R·史密斯、托尼·马丁内斯和克里斯托夫·吉罗德-卡里尔。数据复杂性的实例级别分析。机器学习, 95(2):225–256, 2014.
Craig Stanfill 和 David Waltz。迈向基于记忆的推理。ACM通讯,29(12):1213–1228,1986年。
伊万·托梅克。使用编辑最近邻规则的实验。IEEE系统、人与控制论汇刊,6(6):448–452,1976年。
伊万·托梅克。对cnn的两种修改。IEEE 系统、人与控制论汇刊,6:769–772,1976年。
王硕和姚欣。通过使用集成模型对不平衡数据集进行多样性分析。在2009年IEEE计算智能与数据挖掘研讨会中,324–331页。IEEE,2009年。
D Randall Wilson 和 Tony R Martinez。改进的异构距离函数。人工智能研究杂志,6:1–34,1997年。
Dennis L Wilson. 使用编辑数据的最近邻规则的渐近性质. IEEE Transactions on Systems, Man, and Cybernetics, 页码 408–421, 1972.