最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

大白話給你講明白數(shù)據(jù)倉庫

2022-12-22 15:16 作者:北京派可數(shù)據(jù)  | 我要投稿

數(shù)據(jù)倉庫的本質(zhì)就是完成從面向業(yè)務(wù)過程數(shù)據(jù)的組織管理到面向業(yè)務(wù)分析數(shù)據(jù)的組織和管理的轉(zhuǎn)變過程。

數(shù)據(jù)倉庫類比糧食倉庫

業(yè)務(wù)過程數(shù)據(jù)的組織管理實(shí)際上就是由各種業(yè)務(wù)系統(tǒng)來完成的,比如ERP、CRM、OA等各類業(yè)務(wù)系統(tǒng),解決的是基本的業(yè)務(wù)流程管理。通過數(shù)據(jù)的錄入 Insert、刪除Delete、修改 Update、查詢 Search ,即用戶在業(yè)務(wù)系統(tǒng)操作界面中做的增刪改查操作,這些操作和業(yè)務(wù)系統(tǒng)底層的數(shù)據(jù)庫例如MySQL、Oracle、SQL Server 完成了數(shù)據(jù)的交互,數(shù)據(jù)也沉淀在這些數(shù)據(jù)庫中。?

數(shù)據(jù)倉庫 - 派可數(shù)據(jù)商業(yè)智能BI可視化分析平臺

各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫比做是一個個糧食倉庫的話,數(shù)據(jù)倉庫就可以簡單理解為,要把各個分散的糧食倉庫的糧食搬運(yùn)到一個更大的糧食倉庫來集中管理。

不同的獨(dú)立的糧食倉庫中存儲的糧食可能不一樣,有的糧食壞了可能不能吃了,那么在匯總到大的糧食倉庫過程中就需要把這些壞掉的糧食給去除掉。還有在不同的糧食倉庫中可能也存了一些同樣的糧食,那么在搬運(yùn)到大的糧食倉庫中,就需要去做一些歸類合并,按照更好的一種陳列方式將糧食擺放整齊,最后對外支持的時候,就從這個大的糧食倉庫直接取糧食就可以了。各類糧食都有,并且有很好的組織形式。

這個從小的糧食倉庫搬運(yùn)、清洗轉(zhuǎn)換、加載糧食的過程就是ETL過程,Extraction 抽取、Transformation 轉(zhuǎn)換、Loading 加載。

數(shù)據(jù)倉庫的本質(zhì)還是一個數(shù)據(jù)庫,它將各個異構(gòu)的數(shù)據(jù)源數(shù)據(jù)庫的數(shù)據(jù)給統(tǒng)一管理起來,并且完成了質(zhì)量較差的數(shù)據(jù)的剔除、格式轉(zhuǎn)換,最終按照一種合理的建模方式來完成源數(shù)據(jù)組織形式的轉(zhuǎn)變,以更好的支持到前端的可視化分析。?

數(shù)據(jù)倉庫 - 派可數(shù)據(jù)商業(yè)智能BI可視化分析平臺

在這個過程中,有的時候可能用普通的汽車搬運(yùn)糧食,有的可能用飛機(jī)運(yùn)糧食,有的可能需要每小時運(yùn)一次,有的可能就需要每天運(yùn)一次或者每月運(yùn)一次,這就是ETL工具的選擇和數(shù)據(jù)抽取調(diào)度以及抽取頻次的管理。有的時候糧食比較多,一般的糧食倉庫容量不夠,或者要求效率更高,就會選擇不同的糧食倉庫架構(gòu)來進(jìn)行管理,這就是數(shù)據(jù)倉庫技術(shù)框架的選擇,是選擇大數(shù)據(jù)技術(shù)框架,還是一般的技術(shù)框架就可以滿足,最終決定了我們要建設(shè)這個數(shù)據(jù)倉庫的投入成本。

數(shù)據(jù)的維度和指標(biāo)

維度就是看數(shù)據(jù)的角度,被看的數(shù)據(jù)就是指標(biāo)。比如:我想看2020年北京地區(qū)某品牌電腦的銷售量、銷售額和毛利。這里面的2020年、北京地區(qū)、某品牌電腦就是維度,分別代表了年維度、區(qū)域維度和品牌維度,看的是什么數(shù)據(jù)呢?就是銷售量、銷售額和毛利,這三個數(shù)據(jù)就是被看的指標(biāo)。?

指標(biāo) - 派可數(shù)據(jù)商業(yè)智能BI可視化分析平臺

這樣的一個問題就簡單構(gòu)成了由年、區(qū)域、品牌三個維度以及銷售量、銷售額、毛利三個指標(biāo)組成的一個簡單的分析模型。當(dāng)然如果需要從其它維度來看這些指標(biāo),在構(gòu)建這個分析模型的時候就可以把這些分析的角度都加進(jìn)去,形成一個相對比較全面的分析模型。

?

維度 - 派可數(shù)據(jù)商業(yè)智能BI可視化分析平臺

在這個分析模型中,維度可以任意搭配組合,比如只想知道2019年山東地區(qū)的銷售量、銷售額,實(shí)際上就只用到了這個分析模型中的兩個維度和兩個指標(biāo),前臺的分析就會根據(jù)用戶所選擇的維度和指標(biāo)組合相應(yīng)的 SQL 查詢語句到后臺數(shù)據(jù)倉庫中查詢,并將查詢的結(jié)果返回到前端頁面來渲染并呈現(xiàn)出最后所需要的結(jié)果。

SQL

這個 SQL 基本的格式就是 SELECT SUM
(銷售量)、SUM(銷售額)FROM 模型 GROUP BY 時間、區(qū)域,時間過濾條件就是2019年,區(qū)域過濾條件就是山東地區(qū)。

如果只想知道2020年全年的銷售量、銷售額,還是剛才的哪個 SQL 語句,只不過在GROUP BY 的時候就只會 GROUP BY 時間這個維度,時間過濾條件就是 2020年。?

SQL - 派可數(shù)據(jù)商業(yè)智能BI可視化分析平臺

所以,分析維度和分析指標(biāo)在這個模型中是可以靈活的組織搭配,動態(tài)的組織SQL查詢反查數(shù)據(jù)分析模型,從數(shù)據(jù)分析模型中提取查詢結(jié)果返回到前端頁面,這就是商業(yè)智能?BI 分析的基本原理。

?

大白話給你講明白數(shù)據(jù)倉庫的評論 (共 條)

分享到微博請遵守國家法律
桂平市| 西贡区| 山丹县| 中宁县| 拜泉县| 寿光市| 和政县| 延庆县| 丰原市| 浪卡子县| 宜兴市| 永川市| 时尚| 阿拉尔市| 大兴区| 澄城县| 阿克| 赤峰市| 霍山县| 湘乡市| 剑河县| 九江市| 台北市| 额尔古纳市| 凤阳县| 泰州市| 宝清县| 金湖县| 辰溪县| 义马市| 乌海市| 贡嘎县| 都匀市| 东乡族自治县| 赣州市| 台江县| 平罗县| 武安市| 老河口市| 镇平县| 台州市|