说明
1、PCA是最经典、最实用的降维技术,尤其在辅助图形识别中表现突出。
2、用来减少数据集的维度,同时保持数据集中对方差贡献特征。
保持低阶主成分,而忽略高阶成分,低阶成分往往能保留数据的最重要部分。
实例
fromsklearn.feature_selectionimportVarianceThreshold #特征选择VarianceThreshold删除低方差的特征(删除差别不大的特征) var=VarianceThreshold(threshold=1.0)#将方差小于等于1.0的特征删除。默认threshold=0.0 data=var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]]) print(data) ''' [[0] [4] [1]] '''
以上就是Python特征降维的理解,希望对大家有所帮助。
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。