本项目研究基于最小最大模块化分类器的大规模多标号不平衡模式分类问题的分类方法。拟开展的研究工作主要包括以下三个方面:1)考虑样本分布特性和先验知识的问题分解方法,从理论上研究保证模块化分类器最优泛化能力的不平衡问题的平衡化方法,系统地比较各种任务分解策略的特点和适应范围;2)研究并行计算环境与大规模多标号不平衡分类问题的最佳匹配,寻找在给定并行计算环境下,既能提高并行学习速度和分类速度,又能改善模块化分类器泛化能力的匹配策略;3)在大规模集群计算机上实现本项目所提出的模块化分类方法,通过解决实际的大规模多标号文本分类问题、大规模多标号专利分类问题和大规模蛋白质亚细胞多点定位问题,验证其有效性。本研究对有效利用日益普及的集群计算机,开发自然语言处理、数据挖掘和生物信息学等领域迫切需要的解决大规模分类问题的模式分类方法,以及研究新的模式分类理论与技术都具有重要意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
路基土水分传感器室内标定方法与影响因素分析
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
单类分类器和数据不平衡问题研究
基于集成学习的不平衡流数据分类问题研究
大规模MIMO-OFDM系统中的同相/正交支路不平衡问题及其补偿方法研究
图的几类标号问题