特征选择方法之卡方检验

  • June 10, 2016
  • 观山

除了分类算法以外,为分类文本作处理的特征提取算法也对最终效果有巨大影响,而特征提取算法又分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息增益,卡方检验等等十数种,这次先介绍特征选择算法中效果比较好的卡方检验方法。

大家应该还记得,卡方检验(χ2,又称Chi-square)其实是数理统计中一种常用的检验两个变量独立性的方法。(什么?你是文史类专业的学生,没有学过数理统计?那你做什么文本分类?在这捣什么乱?)

Read More
Search
categories
Support This Site

非常欢迎光临我的博客,希望对你有帮助!