无码人妻A片一区二区三区_18禁裸乳无遮挡啪啪无码免费_91精品亚?影视在线?看_人人妻人人爽人人澡AV_国产精品人妻一区二区三区四区_午夜免费影视

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > Hadoop與Spark相互關系及未來展望

Hadoop與Spark相互關系及未來展望

2017-01-19 10:39:32 | 來源:中培企業IT培訓網

對于大數據來說,hadoopspark無疑是兩大組成架構。中培偉業“大數據”專家鐘老師指出,hadoopspark作為大數據的兩大架構系統,二者有著競爭與承前啟后的關系。對于二者之間的區別以及后期的發展趨勢,鐘老師給出了自己的看法。

首先,spark對于海量數據計算,尤其是迭代運算,圖計算運算速度相比與hadoop有著量級上的增長。spark計算的時候將原始數據及中間結果都存儲在內存中,而hadoop每輪迭代都要講原始數據讀入,中間結果寫出到硬盤上。這樣一來由于spark省去了IO的時間,所以相比于hadoop,其運算速率有這量級上的增長。
  其次,spark的容錯性很好,spark將海量數據抽象成RDD這種數據結構,并且其存在兩種算子,一種叫transformation,主要是用于對RDD進行數據轉換,一種叫action,是要將轉換好的RDD再轉換成原始數據。

spark運算是一種懶惰運算,其程序執行邏輯是,對于一系列transformation算子,在遇到action算子之前,這些transformation是不會執行的,而會生成一個運算邏輯圖,當遇到一個action算子的時候,才根據前面的運算邏輯圖執行程序。這樣如果有臺機器宕機了之后,只需要根據邏輯圖將宕機中的RDD進行重新計算就可以了(窄依賴的情況下,寬依賴的情況下計算代價要更高。)
  同時,sparkHDFSYarn/Mesos以及pregel有著很好的兼容性。但是畢竟spark起步晚,在性能、穩定性方面還有待提高;同時spark不能很好的處理細粒度、異步的數據。

Hadoop,性質和Spark并不一樣,它不僅僅是一個框架,而致力于發展成一個分布式計算的平臺。所以,現在的Spark是可以運行在YARNYet another Resource Negotiator)上的,而其他的一些框架也可以運行在這個平臺上,達到資源共享的目的。
  spark相對hadoop編程模型簡單,能進行迭代操作,利用內存(甚至是堆外內存)緩存數據,能進行流水線優化,上層封裝了sqlstreamingmlibgraphx等或成熟或不成熟的框架,明顯有取hadoop而代之的傾向。

1. 相同的算法,SparkHadoop快數倍,如果是一些迭代或者要對數據反復讀取的算法,SparkHadoop快數十倍至上百倍
   2. Spark對于數據的操作種類更多,對于一些比較特殊的計算需求,比如求兩個集合的交集并集,Spark都有函數直接計算,而Hadoop實現這樣的計算無比繁瑣
    3. Spark的開發效率比Hadoop高很多
        最后,鐘老師對二者的發展趨勢進行了展望,他認為雖然Spark目前還不夠成熟,但其無疑代表著未來。

標簽: 大數據
主站蜘蛛池模板: 91女上位在线播放 | 一级色网| 亚洲区精品视频 | 丝袜美腿国产综合久久 | 噜噜噜亚洲色成人网站∨ | 亚洲经典一区二区三区 | 国产激情免费视频 | 国产免费一区二区视频 | 在线免费看黄 | 国产午夜精华在线播放 | 久久国产午夜精品理论片推荐 | 国产精品久久久久AV福利动漫 | 国产精品十八禁在线观看 | 练舞蹈被教练做高h | 99国精产品影视 | 黄色a一级一级一级免费看 国产精品一区二区视频 | 91视频88av | 国产在线拍揄自揄拍无码视频 | 色妞www精品免费视频 | 久久国产人妖系列 | 午夜婷婷精品午夜无码a片影院 | jizzyou日本| 最近2018中文字幕免费看2019 | 生活片毛片 | 一本久道久久综合狠狠爱亚洲精品 | 久草国产在线视频 | 老熟女乱之仑视频 | www.国产精品 | 亚洲AV无码片一区二区三区 | 无码爆乳护士让我爽 | 扣逼喷水视频 | 国产精品久久久不卡 | 国产大屁股喷水视频在线观看 | 小舞屈辱打开双腿自慰出白浆 | 男女啪啪a级毛片 | 成人免费视频视频在线观看免费 | 国内三级视频在线观看 | 国产无遮挡又黄又爽不要VIP网站 | 日本免费极度色诱福利视频 | 色爱av综合网站 | 国产成人AV无码精品天堂 |