選單
GSS 技術部落格
在這個園地裡我們將從技術、專案管理、客戶對談面和大家分享我們多年的經驗,希望大家不管是喜歡或是有意見,都可以回饋給我們,讓我們有機會和大家對話並一起成長!
若有任何問題請來信:gss_crm@gss.com.tw
2 分鐘閱讀時間 (367 個字)

一窺倉儲資料的驗證方式

20210416-P1_20210416-033210_1

倉儲資料有這些的特性:

  • 資料來源多處,資料量大
  • 資料匯總可能來自好多年以前開始
  • 資料不夠整齊,需要先做資料的清理,例如日期:有的系統開文字格式,有的開日期格式,文字格式如果沒有做好資料格式驗證,就會出現各種不是日期的資料
  • 被匯總後的資料。由於來源多處,驗證困難
以下整理一些資料驗證的心得,提供參考

在資料彙整上,有一個非常重要的彙整因子,就是時間:

  •  資料收載期間收載以後,在資料呈現上有:以報表歸屬的月份,或是收載資料原所屬月份
因此資料彙總處理上,有分:
  • 單一日期對應到所屬的月份,如費用發生月份
  • 存續期間:如個案服務期間

● 以下是以彙整來源,經過 group(分群)次數的深度來分類,來看這個 領域(Domain) 的複雜度



以上大概就是資料倉儲的一些簡單的分析,從資料整理→資料分類→資料整理分群→資料以分析方式彙整,以及加上彙整深度與時間歸納方式來分類,把資料倉儲概念性的分析上簡化,可以方便新手快速進入狀況。

【jQuery】deferred物件介紹及使用deferred物件解決ajax非同步問題
離群值之簡介

相關文章

 

評論

尚無評論
已經注冊了? 這裡登入
Guest
2024/04/26, 週五

Captcha 圖像