BR 技术头条 技术链接、资讯与社区分享流
cl click.aliyun.com / 2017-05-03 16:46 / by @顽固份子_akaBlueMind

文本挖掘之特征选择(Python版)

机器学习算法的空间、时间复杂度依赖于输入数据的规模,维度规约(Dimensionality reduction)则是一种被用于降低输入数据维数的方法。维度规约可以分为两类: 特征选择(feature selection),从原始的d维空间中,选择为我们提供信息最多的k个维(这k个维属于原始空间的子集) 特征提取(feature extraction),将原始的d维空间映射到k维空间中(新的k维空间不输入原始空间的子集)   在文本挖掘与文本分类的有关问题中,常采用特征选择方法。

发表评论