无码人妻A片一区二区三区_18禁裸乳无遮挡啪啪无码免费_91精品亚?影视在线?看_人人妻人人爽人人澡AV_国产精品人妻一区二区三区四区_午夜免费影视

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 大數(shù)據(jù) > 在混合云架構(gòu)中運(yùn)行Presto Engine

在混合云架構(gòu)中運(yùn)行Presto Engine

2020-07-27 16:40:45 | 來源:中培企業(yè)IT培訓(xùn)網(wǎng)

今天介紹在混合云架構(gòu)中運(yùn)行Presto Engine的內(nèi)容。將Presto工作負(fù)載從完全內(nèi)部部署環(huán)境遷移到云基礎(chǔ)架構(gòu)具有許多好處,包括減輕資源爭用并通過按需購買計(jì)算資源來降低成本。如果Presto在HDFS中存儲(chǔ)的數(shù)據(jù)上運(yùn)行,則由于Presto的體系結(jié)構(gòu)使存儲(chǔ)和計(jì)算組件能夠獨(dú)立運(yùn)行,因此云計(jì)算和本地存儲(chǔ)之間的分離是顯而易見的。在云中的Presto混合環(huán)境中,從本地環(huán)境中檢索HDFS數(shù)據(jù)的關(guān)鍵問題是兩個(gè)群集之間的網(wǎng)絡(luò)延遲。

這個(gè)關(guān)鍵的瓶頸嚴(yán)重限制了任何工作負(fù)載的性能,因?yàn)槠浯蟛糠謺r(shí)間都花在了可能位于地理位置不同的網(wǎng)絡(luò)之間傳輸請(qǐng)求的數(shù)據(jù)上。結(jié)果,大多數(shù)公司將其數(shù)據(jù)復(fù)制到云環(huán)境中并維護(hù)該重復(fù)數(shù)據(jù),也稱為Lift and Shift。有合規(guī)性和數(shù)據(jù)主權(quán)要求的公司甚至可能阻止組織將數(shù)據(jù)復(fù)制到云中。這種方法不可擴(kuò)展,需要付出大量的人工才能獲得合理的結(jié)果。

本文介紹了Alluxio充當(dāng)數(shù)據(jù)編排層,以幫助有效地將數(shù)據(jù)提供給Presto的方法,而不是直接查詢遙遠(yuǎn)的HDFS群集或?qū)?shù)據(jù)的本地化副本手動(dòng)提供給云群集中的Presto。

  具有Alluxio和Presto的混合云架構(gòu)

在以下架構(gòu)圖中,Presto和Alluxio進(jìn)程都位于云群集中。就Presto而言,它正在查詢數(shù)據(jù)并將其寫入Alluxio,就好像它是位于同一位置的HDFS集群一樣。當(dāng)Alluxio收到數(shù)據(jù)請(qǐng)求時(shí),最初會(huì)從遠(yuǎn)程HDFS群集中獲取數(shù)據(jù),但后續(xù)請(qǐng)求將直接從其緩存中獲得。

當(dāng)Presto發(fā)送數(shù)據(jù)以將其持久存儲(chǔ)到存儲(chǔ)中時(shí),Alluxio會(huì)將數(shù)據(jù)異步寫入HDFS,從而使Presto工作量免于等待遠(yuǎn)程寫入完成的麻煩。在讀取和寫入兩種情況下,除初始讀取外,Presto工作負(fù)載都能以與HDFS群集相同的網(wǎng)絡(luò)運(yùn)行,即使不是更快,性能也一樣。請(qǐng)注意,除了部署和配置Alluxio以及在Presto和Alluxio之間建立連接之外,不需要其他配置或其他手動(dòng)操作即可維護(hù)混合環(huán)境。

  標(biāo)桿績效

為了進(jìn)行基準(zhǔn)測試,我們將使用Presto作為計(jì)算框架,以對(duì)地理上分離的Hive和HDFS群集中的數(shù)據(jù)運(yùn)行SQL查詢。

本節(jié)中用于實(shí)驗(yàn)的混合云環(huán)境包括位于不同AWS區(qū)域的兩個(gè)Amazon EMR集群。由于兩個(gè)群集在地理位置上分散,因此群集之間存在明顯的網(wǎng)絡(luò)延遲。VPC對(duì)等用于創(chuàng)建VPC連接,以允許兩個(gè)AWS VPC之間通過全局AWS骨干網(wǎng)之間的流量,而不會(huì)出現(xiàn)帶寬瓶頸。如果使用AWS作為云提供商,則讀者可以按照白皮書中的教程來重現(xiàn)基準(zhǔn)測試結(jié)果。

我們將行業(yè)標(biāo)準(zhǔn)TPC-DS基準(zhǔn)中的數(shù)據(jù)和查詢用于決策支持系統(tǒng),該系統(tǒng)可檢查大量數(shù)據(jù)并回答業(yè)務(wù)問題。

我們將TPC-DS查詢的子集分為以下幾類(根據(jù)此存儲(chǔ)庫中的可視化):報(bào)告,交互式和深度分析。

使用Alluxio,我們?yōu)樗蠺PC-DS查詢收集兩個(gè)數(shù)字;用冷暖表示。

· 感冒是其中運(yùn)行查詢之前的數(shù)據(jù)沒有在Alluxio存儲(chǔ)加載的情況下。在這種情況下,Alluxio在查詢執(zhí)行期間按需從HDFS提取數(shù)據(jù)。

· 在冷運(yùn)行后,將數(shù)據(jù)加載到Alluxio存儲(chǔ)中的情況是熱的。后續(xù)訪問相同數(shù)據(jù)的查詢不會(huì)與HDFS通信。

借助HDFS,我們也可以收集兩個(gè)數(shù)字。本地和遠(yuǎn)程。

· 本地是指Presto和HDFS位于同一區(qū)域的情況。此數(shù)字向我們顯示了在本地?cái)?shù)據(jù)而不爆發(fā)到云中時(shí)在本地運(yùn)行計(jì)算的性能。

· 遠(yuǎn)程是Presto從另一個(gè)區(qū)域的存儲(chǔ)讀取的情況。

我們比較了Alluxio(冷和暖)和HDFS(本地和遠(yuǎn)程)的性能。基準(zhǔn)測試表明,當(dāng)緩存因遠(yuǎn)程訪問HDFS數(shù)據(jù)而受熱時(shí),Alluxio的性能平均提高了3倍。

在此存儲(chǔ)庫中可用的104個(gè)查詢中,q72在遠(yuǎn)程訪問數(shù)據(jù)時(shí)未完成,而在本地?cái)?shù)據(jù)時(shí)花費(fèi)了5個(gè)小時(shí)以上。除此之外,白皮書中的結(jié)果包括所有其余103個(gè)查詢。

下表按類別總結(jié)了結(jié)果。總體與Alluxio看到的最大改進(jìn)是為Q9(7.1倍),最低是為q39a(1X -沒有區(qū)別)。

· 查詢類別:報(bào)告

· 最大改善:q27(3.1x)

· 最低改進(jìn):q43(2.7倍)

· 查詢類別:互動(dòng)

· 最大改善:q73(3.9x)

· 最低改進(jìn):q98(2.2x)

· 查詢類別:深度分析

· 最大改善:q34(4.2x)

· 最低改進(jìn):q59(1.9倍)

對(duì)于具有10個(gè)節(jié)點(diǎn)的計(jì)算群集,從地理上分離的群集訪問數(shù)據(jù)時(shí),貫穿所有查詢運(yùn)行的峰值帶寬利用率保持在2Gbps以下。帶寬不是AWS骨干網(wǎng)的瓶頸。隨著利用率隨著計(jì)算群集的大小而擴(kuò)展,當(dāng)不使用Alluxio時(shí),較大的群集可能會(huì)遇到帶寬瓶頸,因?yàn)橹苯舆B接可用的帶寬可能會(huì)受到限制。

當(dāng)無縫緩存到本地的Alluxio群集中時(shí),通過Alluxio可以看到的大多數(shù)性能提升都可以通過元數(shù)據(jù)和數(shù)據(jù)的延遲差異來解釋。

  結(jié)論

混合云架構(gòu)允許將云計(jì)算資源用于數(shù)據(jù)分析,即使數(shù)據(jù)位于完全不同的網(wǎng)絡(luò)中也是如此。除了獲得顯著更好的性能外,概述的執(zhí)行計(jì)劃不需要對(duì)內(nèi)部部署基礎(chǔ)結(jié)構(gòu)進(jìn)行任何重大重新配置。

由于用戶可以利用公共云的計(jì)算能力,因此這為Presto提供了更多機(jī)會(huì),可將其用作可擴(kuò)展的高性能計(jì)算框架,以使用內(nèi)部存儲(chǔ)的數(shù)據(jù)進(jìn)行分析。

好了,關(guān)于在混合云架構(gòu)中運(yùn)行Presto Engine的內(nèi)容介紹到這里就結(jié)束了,想了解更多關(guān)于云計(jì)算的信息,請(qǐng)繼續(xù)關(guān)注中培偉業(yè)吧。

主站蜘蛛池模板: 久久久无码精品无码国产人妻丝瓜 | 不卡在线一区二区 | 九九九九九九九伊人 | 少妇一区二区三区免费观看 | 亲子乱AV一区二区三区 | 亚洲精品456在线播放牛牛影院 | 久久久久久视频 | 欧美视频亚洲视频 | 国产精品影 | 56精品视频在线播放免费观看 | 成人久久一区二区三区 | 国产一级片久久久 | 久久视频亚洲 | 亚洲乱码国产乱码精品精 | 国产美女被遭强高潮免费 | 欧美精品91| 免费人成视频网站在线观看18 | 曰韩无码A级成人毛片 | a级毛片基地 | 中国女人真人一级毛片 | 久久三级 | 亚洲人成精品久久久久 | 国产精品人妻无码久久久 | 国产精品久久综合 | 日本啊v在线 | 中文字幕在线看第二 | 四虎影院在线免费 | 久草在线资源总站 | 视频二区三区 | 嫩草视频国产精品 | 国产精品久久久久久无码 | 中文字幕91视频 | 日韩在线中文高清在线资源 | 精品一区二区三区在线播放 | 内射白浆一区二区在线观看 | 别揉我奶头~嗯~啊~视频免费网站 | 三级毛片视频 | 日韩成人激情 | 无码精品不卡一区二区三区 | 日本韩国视频在线观看 | 精品在线视频播放 |