检测重复行

我们可以快速检测数据集是否存在任何重复行。要应用此分析,请在下图所示的"分析类型"中选择"Duplicate rows”:

image-20240903103639477

我们可以看到,数据集中约27%的行是重复的。 image-20240903103733641

稍后,在特征工程部分,我们将看到如何使用内置的转换来消除这些重复行。