如果大家對
豌豆BI的數據預處理有一定了解的話,就知道數據預處理的簡單易用性,可以在
數據分析之前,處理數據不完整,重復,異常值等問題,通過簡單的界面操作即可完成。通過對用戶需求的分析,數據預處理增加了其他更好用的功能,本文將介紹這些簡單易操作的功能。
1. 字段信息統計
在查看主題表數據,或進行數據預處理時,可以查到表中所有字段的各種統計信息,如最大值、最小值、唯一值,缺失值個數,合計值,均值,方差值大小,及數據分布情況。
2. 篩選生成新表
對某列數據進行篩選后,工具欄上出現“篩選結果另存為Sheet”按鈕,點擊后即可將篩選數據存成一張新的表進行處理
同時,可以框選界面中的任意部分數據,右鍵,點擊“框選另存為Sheet”,將框選部分存為一張新表處理
3. 生成關聯數據
選擇任意多張表進行關聯,表之間可以進行關聯后,選擇表的字段生成一張新的表,新的表數據是根據設置的關聯關系生成。
1.???? 選擇表做關聯關系
2.???? 設置關聯關系類型及關聯字段
3.???? 選擇最終生成關聯新表數據需要的字段
4. 主題表數據追加覆蓋
可以對主題表的數據進行追加或覆蓋操作,此處是選擇文件數據源中的文件數據,解析文件,通過設置字段對應關系,將文件中的數據追加或覆蓋到主題表中。
1.操作入口,主題表列表中,主題表后面更多操作中的“追加覆蓋數據”按鈕:
2.???? 選擇文件數據源中的文件,點擊追加或覆蓋
3.???? 當選擇的文件是EXCEL時,可以選擇EXCEL文件中用戶需要的工作簿,以及設置工作簿數據中的字段起始行及數據起始行
4.???? 進入數據預處理,可進行數據簡單的處理后再將數據追加或覆蓋到主題表中
5.???? 點擊追加或覆蓋,設置字段對應關系,可點擊按位置匹配或按名稱匹配
也可針對某一個字段自行選擇設置字段對應關系
設置完字段對應關系后,點擊確定,即可將進行預處理的文件數據追加或覆蓋到主題表中
(部分內容來源網絡,如有侵權請聯系刪除)