tensorflow輸入數(shù)據(jù)格式 在數(shù)據(jù)挖掘時為什么要進行數(shù)據(jù)預處理?
在數(shù)據(jù)挖掘時為什么要進行數(shù)據(jù)預處理?數(shù)據(jù)中含有大量噪聲數(shù)據(jù),需要剔除無關數(shù)據(jù),如分析無關字段了解數(shù)據(jù)質量,有些數(shù)據(jù)質量不足以直接使用,如包含太多缺失值,需要進行缺失值處理,不能直接使用數(shù)據(jù)字段,為了更
在數(shù)據(jù)挖掘時為什么要進行數(shù)據(jù)預處理?
數(shù)據(jù)中含有大量噪聲數(shù)據(jù),需要剔除無關數(shù)據(jù),如分析無關字段了解數(shù)據(jù)質量,有些數(shù)據(jù)質量不足以直接使用,如包含太多缺失值,需要進行缺失值處理,不能直接使用數(shù)據(jù)字段,為了更好地進行進一步的數(shù)據(jù)挖掘,需要派生出新的字段,數(shù)據(jù)的分散性需要提高數(shù)據(jù)的集成度,比如添加表(添加行),或者合并表(添加列),可以通過數(shù)據(jù)預處理對數(shù)據(jù)有一個很好的初步了解和理解。