特征相关性

Linear feature correlation(线性特征相关性)基于皮尔逊相关系数。数值型到分类型的相关性是通过将分类特征编码为最佳预测数值特征的浮点数来计算的,然后再计算皮尔逊相关系数。

数值型到数值型的相关性范围在[-1, 1]之间,0表示没有相关性,1表示完全正相关,而-1表示完全负相关。数值型到分类以及分类到分类的相关性范围在[0, 1]之间,0表示没有相关性,1表示完全相关。不是数值型或分类的特征将被忽略。

创建分析,选择"Feature correlation"作为分析类型,并选择"liner"相关性类型,如下所示。

image-20240903100044378

下表列出了每个单独特征最相关的特征。

image-20240903100114087

非线性特征交互

非线性特征相关性基于斯皮尔曼等级相关系数。数值型到分类的相关性是通过将分类特征编码为最佳预测数值特征的浮点数来计算的,然后再计算斯皮尔曼等级相关系数。分类到分类的相关性基于标准化的克拉美尔V检验。

数值型到数值型的相关性范围在[-1, 1]之间,0表示没有相关性,1表示完全正相关,而-1表示完全负相关。数值型到分类型以及分类型到分类型的相关性范围在[0, 1]之间,0表示没有相关性,1表示完全相关。

不是数值型或分类的特征将被忽略。

创建分析,选择"Feature correlation"作为分析类型,并选择"non-liner"相关性类型,如下所示。 image-20240903100608453

下表列出了每个单独特征最相关的特征: image-20240903100633484