我们可以快速检测数据集是否存在任何重复行。要应用此分析,请在下图所示的"分析类型"中选择"Duplicate rows”:
我们可以看到,数据集中约27%的行是重复的。
稍后,在特征工程部分,我们将看到如何使用内置的转换来消除这些重复行。