2015年6月11日 星期四
站内搜索:

杨宗凯:一种基于样本空间动态划分的中文情感识别方法

来源:中国知网

【作者】 刘智; 杨宗凯; 刘三(女牙); 铁璐;

【Author】 LIU Zhi,YANG Zong-kai,LIU San-ya,TIE Lu (National Engineering Research Center for E-Learning,Huazhong Normal University,Wuhan 430079,China)

【机构】 华中师范大学国家数字化学习工程技术研究中心;

【摘要】 为了提高中文文本情感识别的精度,从集成学习的角度出发,提出了一种基于样本空间动态划分的机制构建文本情感分类器。该算法充分利用训练样本空间内的鉴别信息,通过引入核平滑方法对样本空间进行自适应划分,形成若干个具有差异性的多粒度样本子集, 然后分别在每个子集上构造基分类器,最后将所有基分类器的输出进行融合以产生最终的预测结果。实验结果表明,该算法在查准率和查全率等方面均优于Bagging、AdaBoost等算法,并且在大规模样本集的情感识别中具有良好的应用前景。 更多还原

【关键词】 文本情感识别; 样本子空间; 动态划分; 集成分类模型; 核平滑;

【文内图片】
初始训练种子数b与子空间数量L对RDS算法识别性能的影响初始训练种子数b与子空间数量L对RDS算法识别性能的影响【基金】 国家“核高基”重大专项基金资助项目(2010ZX01045-001-005);国家“十二五”科技支撑计划资助项目 (2011BAK08B03);国家教育部新世纪优秀人才支持计划资助项目(NCET-11-0654);华中师范大学中央高校基本科研业务费专项基金资助项目(CCNU09A02006)