欧美午夜精品理论片a级按摩,亚洲视频免费观看,欧美特黄一级,中文字幕一区二区av

我要找:  
您的位置:電源在線首頁>>行業(yè)資訊>>企業(yè)動態(tài)>>Cloudera Data Platform引入Apache Iceberg的五大原因正文

Cloudera Data Platform引入Apache Iceberg的五大原因

2022/9/19 16:22:50   電源在線網(wǎng)
分享到:

  

  近期,Cloudera宣布將Apache Iceberg集成到其云生態(tài)系統(tǒng)中,Iceberg的優(yōu)勢得以融入正在轉(zhuǎn)向公有云和采用湖倉等融合架構(gòu)的企業(yè)之中。可以說,集成了Iceberg的Cloudera CDP將強有力地幫助企業(yè)構(gòu)建新一代數(shù)據(jù)架構(gòu),賦予企業(yè)更多的前瞻性和附加優(yōu)勢。

  Apache Iceberg是一種高性能的開放表格式。它誕生于云端,可擴展到PB級并且獨立于底層存儲層和引擎存儲層。作為一種真正的開放表格式,Apache Iceberg符合Cloudera Data Platform(CDP)的愿景。

  原因一:多功能分析助力實現(xiàn)數(shù)據(jù)集共享

  Apache Iceberg實現(xiàn)了不同流式傳輸和處理引擎之間的無縫集成,同時保持了它們之間的數(shù)據(jù)完整性。多個引擎可以同時更改表,即便是部分寫入也不會出現(xiàn)正確性問題,而且也不需要昂貴的讀取鎖定。因此,降低了使用不同的連接器、維護不善的API、以及采取其他臨時解決方案處理數(shù)據(jù)集的必要性。

  Iceberg采用開放、兼容所有引擎的設(shè)計,實現(xiàn)了數(shù)據(jù)集的共享。Cloudera擴展了對Hive和Impala的支持,實現(xiàn)了從大規(guī)模數(shù)據(jù)工程工作負載和流處理,到智能大數(shù)據(jù)分析平臺(Fast BI)和查詢以及機器學習的多功能分析數(shù)據(jù)架構(gòu)愿景。

  Iceberg的多功能還意味著Cloudera數(shù)據(jù)平臺就此擁有了打破數(shù)據(jù)孤島的集成端到端數(shù)據(jù)管道,并將分析整合成一個連貫的生命周期,在每一個階段都可以提取商業(yè)價值。用戶將能夠借助所需工具并充分利用其對工作負載所作出的特定優(yōu)化。例如Jupyter筆記本可以使用Spark或Python框架直接訪問Iceberg表來建立預測模型,同時通過NiFi流獲取新數(shù)據(jù),而SQL分析師則可以利用數(shù)據(jù)可視化監(jiān)控收入目標。而作為一個完全開源的項目,這意味著將來會有更多的引擎和工具得到支持。

  原因二:開放文件格式提升數(shù)據(jù)存用靈活度

  作為一種表格式,Iceberg支持一些最常用的開源文件格式,比如Avro、Parquet和ORC。這些都是眾所周知且發(fā)展成熟的大數(shù)據(jù)文件格式,它們不僅被開源社區(qū)所使用,同時也被嵌入到第三方工具中。開放格式的價值在于靈活性和可移植性。用戶可以在不受底層存儲束縛的情況下移動他們的工作負載。但到目前為止,這種格式仍有一個缺點——由于表模式和存儲優(yōu)化與引擎等緊密耦合,因此使用起來難免“束手束腳”。

  而Iceberg是一個通過與開放文件格式一起使用來避免這種耦合的開放表格式。模式、分區(qū)等表信息作為元數(shù)據(jù)文件的一部分單獨存儲,使應用更容易與表和它們所選擇的存儲格式快速集成。由于查詢不再依賴于表的物理布局,Iceberg表可以隨著數(shù)據(jù)量的變化而逐漸實現(xiàn)分區(qū)方案的演進。

  原因三:開源功能有效規(guī)避供應商“陷阱”

  開源對于避免供應商“陷阱”至關(guān)重要,但許多供應商會在兜售開源工具時隱瞞他們自主開發(fā)的版本與開源社區(qū)之間的差距。這意味著當客戶嘗試去使用開源版本時,他們才會發(fā)現(xiàn)二者之間存在顯著差異。如此說來,避開供應商陷阱實則困難重重。

  而Apache Iceberg項目是一個充滿活力的社區(qū),它正迅速擴大對各種處理引擎的支持并不斷增加新功能。為了使該社區(qū)及新的表格式獲得持續(xù)成功,Cloudera為上游社區(qū)提供跨Spark、Hive和Impala的支持,意在促使Apache Iceberg被廣泛采納并可供有意構(gòu)建新一代數(shù)據(jù)架構(gòu)的企業(yè)所使用。該社區(qū)提供了許多功能改進及性能特性,例如向量化讀取和Z-Order等,無論用戶使用什么引擎或供應商來訪問表,都將從中受益。在CDP中,這已經(jīng)作為Impala MPP開源引擎對Z-Order提供的一部分支持。

  如之前所述,在查詢規(guī)劃方面Iceberg依賴于元數(shù)據(jù)文件,這些文件包含了數(shù)據(jù)駐留的位置以及分區(qū)和模式如何分布在文件中。雖然這實現(xiàn)了模式的演變,但如果表格的變化過多,就會帶來問題。為此社區(qū)創(chuàng)建了一個API來讀取元數(shù)據(jù)文件,同時也在同步進行其他類似的優(yōu)化。這種開放標準方法讓用戶可以在Iceberg上以CDP中的性能運行工作負載,且無需擔心落入供應商“陷阱”中。

  原因四:有效降低企業(yè)級應用學習和管理門檻

  作為Cloudera企業(yè)平臺的一部分,Iceberg的原生集成受益于企業(yè)級的共享數(shù)據(jù)體驗(SDX)功能,例如數(shù)據(jù)沿襲、審計和安全等,而且無需重新設(shè)計或第三方工具集成,因此不會增加管理的復雜性,也不需要額外學習。CDP中的Apache Iceberg表被集成在SDX Metastore中用于表結(jié)構(gòu)和訪問驗證,這意味著用戶可以進行審計并創(chuàng)建細粒度的政策,實現(xiàn)即開即用。

  原因五:Apache Iceberg開啟全新使用場景

  Apache Hive表實現(xiàn)了對數(shù)據(jù)倉儲、數(shù)據(jù)工程和機器學習的集中訪問,奠定了良好的性能基礎(chǔ)。同時,它還支持開放的文件格式(ORC、AVRO、Parquet等),并通過ACID和事務支持幫助實現(xiàn)新的用例。但由于元數(shù)據(jù)的集中化并且抽象化主要基于文件,因此它在規(guī)模等方面不免面臨挑戰(zhàn)。

  Iceberg克服了規(guī)模和性能方面的挑戰(zhàn),同時加入了一系列新的功能,能夠解決不同行業(yè)和用例的挑戰(zhàn)。例如:

  變更數(shù)據(jù)捕獲(CDC)

  能夠處理具有原子性和一致性的Delta表雖然早已普及,而且Hive ACID等現(xiàn)有的解決方案也能提供這種功能,但該功能對大多數(shù)提供DW和BI用例的數(shù)據(jù)處理管道來說至關(guān)重要。因此Iceberg從一開始就通過支持行級更新和刪除來解決這個問題。它在不深入到細節(jié)的情況下可以使用多種不同的方法來實現(xiàn)這一點,例如寫時拷貝(Copy-on-write)與讀時合并(Merge-on-read)。但更重要的是,隨著這些解決方案以及Iceberg開放標準格式的持續(xù)發(fā)展,我們將看到處理類似用例的更優(yōu)表現(xiàn)。

  金融監(jiān)管

  許多金融和受到高度監(jiān)管的行業(yè)都希望能夠回溯歷史,甚至希望能夠?qū)⒈頎顟B(tài)恢復到特定的時間點。Apache Iceberg的“快照”和“時間旅行”功能可以幫助分析和審計人員輕松回溯歷史并使用簡單的SQL來分析數(shù)據(jù)。

  機器學習運維的可重復性

  通過允許檢索之前的表狀態(tài),Iceberg讓機器學習工程師能夠使用原始狀態(tài)的數(shù)據(jù)重新訓練模型,并執(zhí)行將預測與歷史數(shù)據(jù)相匹配的事后分析。通過這些存儲的歷史特征,可以對模型進行重新評估、找出不足之處并部署更新、更好的模型。

  簡化數(shù)據(jù)管理

  大多數(shù)數(shù)據(jù)從業(yè)者需要耗費很多時間來應對數(shù)據(jù)管理的復雜性,為項目確定新的數(shù)據(jù)源并將新的屬性加入到現(xiàn)有的數(shù)據(jù)模型中就是其中之一。以前,這可能會因為需要重新創(chuàng)建和重新加載表而導致開發(fā)周期過于漫長,尤其是在引入新的分區(qū)時。但有了Iceberg表及其元數(shù)據(jù)清單文件,就可以簡化這些更新并且不產(chǎn)生額外的費用。

  模式演變:表中的列可以就地改變(添加、刪除、重命名、更新或重新排序)而不影響數(shù)據(jù)的可用性。所有變化都可以在元數(shù)據(jù)文件中被追蹤,Iceberg確保模式變化獨立且沒有副作用(比如錯誤的值)。

  分區(qū)演變:可通過與模式演變相同的方式改變Iceberg表中的分區(qū)。在分區(qū)演變過程中,舊的數(shù)據(jù)保持不變,新的數(shù)據(jù)將按照新的分區(qū)規(guī)格寫入。Iceberg使用隱藏分區(qū),通過分割規(guī)劃自動修剪包含新舊分區(qū)規(guī)格中的匹配數(shù)據(jù)的文件。

  細粒度的分區(qū):以前,在查詢規(guī)劃期間所面臨的主要瓶頸是元數(shù)據(jù)倉以及將分區(qū)加載到內(nèi)存中,限制了用戶使用小時等細粒度的分區(qū)方案以避免隨著表規(guī)模的增長而導致性能不佳。Iceberg克服了這些可擴展性方面的挑戰(zhàn),通過同時避免元數(shù)據(jù)倉和內(nèi)存瓶頸,使用戶能夠使用更細粒度、最適合應用需求的分區(qū)方案來實現(xiàn)更快的查詢。

  這意味著數(shù)據(jù)從業(yè)者可以將更多的時間用于創(chuàng)造業(yè)務價值和開發(fā)新的數(shù)據(jù)應用,減少處理數(shù)據(jù)管理的時間,即根據(jù)業(yè)務的速度實現(xiàn)數(shù)據(jù)演進,避免本末倒置。

  ·輕松構(gòu)建數(shù)據(jù)倉庫

  我們已經(jīng)看到了數(shù)據(jù)倉庫領(lǐng)域的很多趨勢,其中最新的趨勢就是湖倉——一種將數(shù)據(jù)倉庫和數(shù)據(jù)湖相結(jié)合的融合架構(gòu)。在企業(yè)中,加速此類融合架構(gòu)的一個關(guān)鍵因素是存儲與處理引擎的解耦。但這必須與從串流和實時分析到倉儲和機器學習等多功能分析服務相結(jié)合,僅憑分析工作負載或?qū)烧呦嘟Y(jié)合還不夠。因此CDP中的Iceberg不具有固定形態(tài),它更多的是一種兼容一切引擎的開放式數(shù)據(jù)底層,可以在云端進行擴展。

  這使得企業(yè)可以輕松構(gòu)建“任何”數(shù)據(jù)倉庫,而不必使用專門的存儲格式來獲得最佳性能,也不必在一個引擎或服務中進行專有優(yōu)化。

   免責聲明:本文僅代表作者個人觀點,與電源在線網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
本文鏈接:Cloudera Data Platf
http:m.mangadaku.com/news/2022-9/2022919162250.html
文章標簽:
  投稿熱線 0755-82905460    郵箱  :news@cps800.com
關(guān)于該條新聞資訊信息已有0條留言,我有如下留言:
請您注意:
·遵守中華人民共和國的各項有關(guān)法律法規(guī)
·承擔一切因您的行為而導致的法律責任
·本網(wǎng)留言板管理人員有權(quán)刪除其管轄的留言內(nèi)容
·您在本網(wǎng)的留言內(nèi)容,本網(wǎng)有權(quán)在網(wǎng)站內(nèi)轉(zhuǎn)載或引用
·參與本留言即表明您已經(jīng)閱讀并接受上述條款
用戶名: 密碼: 匿名留言   免費注冊會員
關(guān)鍵字:
        
按時間:
關(guān)閉
欧美午夜精品理论片a级按摩,亚洲视频免费观看,欧美特黄一级,中文字幕一区二区av
欧美日韩在线播放一区| 亚洲人成伊人成综合网小说| 91视频免费观看| 99热这里都是精品| aa级大片欧美| 91在线精品秘密一区二区| www.亚洲激情.com| www.在线欧美| 色诱视频网站一区| 欧美视频完全免费看| 欧美精品粉嫩高潮一区二区| 5月丁香婷婷综合| 精品久久久久av影院| 久久一区二区三区四区| 国产精品国模大尺度视频| 综合久久国产九一剧情麻豆| 亚洲一区成人在线| 日韩影视精彩在线| 精品在线一区二区| 风间由美一区二区三区在线观看 | 日本不卡视频在线观看| 免费成人结看片| 国产成人免费在线视频| 成人激情开心网| 欧洲国产伦久久久久久久| 欧美疯狂做受xxxx富婆| 精品国产成人系列| 亚洲三级电影全部在线观看高清| 亚洲综合在线视频| 激情图片小说一区| 色综合天天性综合| 欧美电影免费观看高清完整版在线 | 亚洲精品自拍动漫在线| 亚洲成av人片| 国产成人午夜片在线观看高清观看| 91在线视频免费91| 精品少妇一区二区三区免费观看| 亚洲人成亚洲人成在线观看图片| 日本欧美韩国一区三区| 97se狠狠狠综合亚洲狠狠| 日韩一区二区电影网| 亚洲欧洲精品一区二区精品久久久| 天堂在线一区二区| av影院午夜一区| 精品欧美一区二区在线观看| 一区二区三区日韩精品| 国产精品一品视频| 欧美精品一二三| 亚洲丝袜精品丝袜在线| 国产在线播精品第三| 91精品麻豆日日躁夜夜躁| 国产精品高清亚洲| 国产精品一级在线| 精品国产欧美一区二区| 一二三四区精品视频| 岛国一区二区在线观看| 精品sm在线观看| 美国毛片一区二区三区| 欧美视频一区在线观看| 亚洲黄色av一区| 成年人国产精品| 国产亚洲精久久久久久| 久久66热偷产精品| 欧美一级生活片| 青青青伊人色综合久久| 欧美日韩1区2区| 午夜欧美大尺度福利影院在线看| 欧美亚洲丝袜传媒另类| 亚洲一二三四区| 欧美怡红院视频| 一二三区精品视频| 欧美在线啊v一区| 亚洲精品乱码久久久久| aaa亚洲精品| 亚洲精品视频在线看| 在线精品视频小说1| 亚洲成人你懂的| 欧美美女直播网站| 丝袜国产日韩另类美女| 678五月天丁香亚洲综合网| 奇米色一区二区| 久久色.com| 成人一二三区视频| 亚洲天堂免费看| 欧美日韩国产免费一区二区| 亚洲成人一区二区| 精品久久五月天| 成人视屏免费看| 亚洲综合视频在线观看| 91麻豆精品国产综合久久久久久| 久久精品国产久精国产| 国产日本欧美一区二区| 日本道免费精品一区二区三区| 亚洲国产成人av| 精品国产自在久精品国产| 国产999精品久久久久久绿帽| 亚洲人成电影网站色mp4| 欧美日韩国产成人在线91| 免费欧美高清视频| 欧美激情一区二区三区四区| 色94色欧美sute亚洲线路一ni| 日本亚洲欧美天堂免费| 国产精品午夜电影| 69av一区二区三区| 成人av在线电影| 日韩精品免费视频人成| 中文字幕精品—区二区四季| 欧美日韩一卡二卡| 国产91丝袜在线18| 图片区日韩欧美亚洲| 欧美激情在线观看视频免费| 欧美日韩极品在线观看一区| 国产美女精品一区二区三区| 亚洲伦理在线免费看| 精品999久久久| 欧美性生活一区| 粉嫩嫩av羞羞动漫久久久| 日韩精品欧美精品| 亚洲美女屁股眼交| 久久久www成人免费无遮挡大片| 91理论电影在线观看| 国产精品白丝jk白祙喷水网站| 亚洲国产毛片aaaaa无费看| 国产精品私人自拍| 欧美电影免费观看完整版| 在线观看91视频| jlzzjlzz欧美大全| 激情深爱一区二区| 日本在线不卡视频一二三区| 一区二区三区在线观看动漫| 亚洲国产精品黑人久久久| 日韩三级视频中文字幕| 欧美午夜电影一区| 色欧美日韩亚洲| 成人精品免费网站| 国产99精品视频| 黄页视频在线91| 日韩国产欧美在线观看| 亚洲午夜精品17c| 夜夜精品视频一区二区| 亚洲欧美日韩国产一区二区三区| 国产精品家庭影院| 亚洲欧洲无码一区二区三区| 中文字幕国产一区二区| 国产目拍亚洲精品99久久精品| 日韩精品中文字幕在线不卡尤物| 69p69国产精品| 日韩精品一区二| 久久久久久一二三区| 久久久av毛片精品| 国产日韩精品一区二区浪潮av| 国产亚洲一区二区三区在线观看 | 欧美丝袜丝nylons| 精品1区2区3区| 欧美日韩一级片在线观看| 欧美日韩国产精品自在自线| 91精品国产91久久综合桃花| 欧美一区二区黄| 欧美一级国产精品| 26uuu久久综合| 欧美国产日韩a欧美在线观看| 国产精品第五页| 亚洲精品中文在线影院| 天天综合网 天天综合色| 六月丁香综合在线视频| 国产高清在线精品| 91啪亚洲精品| 欧美日韩午夜影院| 久久婷婷一区二区三区| 中文字幕一区二区不卡| 亚洲一区二区3| 精品一区二区日韩| 99riav一区二区三区| 欧美日韩成人一区二区| 精品久久国产老人久久综合| 国产欧美日产一区| 亚洲国产日韩精品| 国产大片一区二区| 欧美午夜精品免费| 久久中文娱乐网| 中文字幕一区三区| 秋霞电影网一区二区| av午夜精品一区二区三区| 欧美男人的天堂一二区| 国产欧美日韩亚州综合| 亚洲观看高清完整版在线观看| 韩国欧美一区二区| 欧洲精品一区二区三区在线观看| 久久影视一区二区| 亚洲精品视频免费观看| 另类人妖一区二区av| 91丨九色丨尤物| 久久亚洲春色中文字幕久久久| 亚洲综合网站在线观看| 不卡电影免费在线播放一区| 日韩精品专区在线影院重磅| 亚洲视频网在线直播| 国产美女精品一区二区三区| 91麻豆精品国产91| 一区二区三区精品在线|