最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

網(wǎng)易云微專業(yè)大數(shù)據(jù)開發(fā)工程師

2022-09-28 13:44 作者:血霽玫瑰與櫻花  | 我要投稿

大數(shù)據(jù)計算原理

  1. 在待處理的數(shù)據(jù)存儲在服務器集群的所有服務器上,主要使用HDFS系統(tǒng),將文件分成很多塊(Block),以塊為單位存儲在集群的服務器上

  2. 大數(shù)據(jù)引擎根據(jù)集群里的不同服務器的計算能力,在每臺服務器上啟動若干分布式任務執(zhí)行進程,這些進程會等待給它們分配執(zhí)行任務

  3. 使用大數(shù)據(jù)計算框架支持的編程模型進行編程,比如Hadoop的MapReduce編程模型,或Spark的RDD編程模型,編寫應用程序,例如python或java程序

  4. 用Haddop或Spark的啟動命令執(zhí)行這個應用程序,執(zhí)行引擎會解析程序要處理的數(shù)據(jù)輸入路徑,根據(jù)輸入數(shù)據(jù)量的大小,將數(shù)據(jù)分片,每個片分配給一個任務執(zhí)行進程去處理

  5. 任務執(zhí)行進收到任務后檢查是否有任務對應的程序包,沒有就去下載,下載后加載程序

  6. 加載程序后,任務根據(jù)分配的數(shù)據(jù)片的文件地址和數(shù)據(jù)在文件內(nèi)的偏移量讀取數(shù)據(jù),并把數(shù)據(jù)輸入給應用程序相應的方法去執(zhí)行,從而實現(xiàn)分布式服務器集群中并行處理的計算目標


網(wǎng)易云微專業(yè)大數(shù)據(jù)開發(fā)工程師的評論 (共 條)

分享到微博請遵守國家法律
安阳县| 兴业县| 砚山县| 潜江市| 兰州市| 和顺县| 田东县| 永胜县| 仪征市| 小金县| 留坝县| 肥东县| 华容县| 洱源县| 三原县| 陇西县| 杭州市| 启东市| 庆元县| 淮滨县| 万年县| 长岛县| 安义县| 沛县| 四子王旗| 乌兰察布市| 庆阳市| 高陵县| 错那县| 崇州市| 云梦县| 青田县| 丹巴县| 宣威市| 成武县| 岢岚县| 报价| 和田县| 武鸣县| 滨海县| 五原县|