北京,2021年4月13日——企業(yè)數(shù)據(jù)云公司Cloudera(NYSE:CLDR)今日宣布,Cloudera Data Platform(CDP)將集成Apache Spark 3.0的RAPIDS加速器。該軟件部署在NVIDIA計算平臺上,支持企業(yè)能夠加速數(shù)據(jù)管道,并大幅提升數(shù)據(jù)和機器學(xué)習(xí)工作流,從而在不更改任何代碼的情況下,加快AI采用速度,并產(chǎn)生更好的業(yè)務(wù)成果。借助今年初發(fā)布的CDP中Applied ML Prototypes(AMPs)以及NVIDIA強大的計算性能,美國國稅局、英國國家統(tǒng)計局和德國商業(yè)銀行等客戶不但可以快速啟動整套機器學(xué)習(xí)應(yīng)用,還可以在任何本地、公有云或混合云部署中以較低的成本加速數(shù)據(jù)處理和模型訓(xùn)練。
企業(yè)數(shù)據(jù)工程師正在以前所未有的力度和規(guī)模運用數(shù)據(jù)集,比如改造供應(yīng)鏈模型、應(yīng)對日益增加的欺詐行為或開發(fā)新的產(chǎn)品線等。對于數(shù)據(jù)科學(xué)家而言,海量數(shù)據(jù)造成的瓶頸會直接影響企業(yè)訓(xùn)練和使用模型的成本與速度。Cloudera與NVIDIA的集成有望幫助企業(yè)快速應(yīng)對新出現(xiàn)的以及持續(xù)的業(yè)務(wù)挑戰(zhàn),并提供具有洞察力的分析。
美國國稅局研究應(yīng)用分析與統(tǒng)計司技術(shù)部門主管Joe Ansaldi表示:“我們需要能夠運用大量數(shù)據(jù)快速做出準(zhǔn)確的決策。隨著數(shù)據(jù)量和速度不斷提高,這一挑戰(zhàn)也在不斷變化。憑借Cloudera和NVIDIA的集成,我們將能夠運用以數(shù)據(jù)為依據(jù)的洞察為欺詐檢測等關(guān)鍵任務(wù)應(yīng)用提供支持。目前我們正在完成上述集成,并且已經(jīng)看到數(shù)據(jù)工程和數(shù)據(jù)科學(xué)工作流程的速度提升了三倍以上。”
對于努力應(yīng)對海量數(shù)據(jù)集的公司而言,能否進行模型訓(xùn)練取決于是否擁有開源GPU加速數(shù)據(jù)科學(xué)管道。這種管道可以直接增強企業(yè)機構(gòu)運用AI進行業(yè)務(wù)轉(zhuǎn)型的能力。GPU加速的Apache Spark 3能夠在CDP上無縫運行,從而支持企業(yè)機構(gòu)可以通過安全且可擴展的開源機器學(xué)習(xí)平臺,滿足從研發(fā)到生產(chǎn)的高性能計算(HPC)、AI和數(shù)據(jù)科學(xué)需求。
Cloudera首席產(chǎn)品官Arun Murthy表示:“在速度至關(guān)重要的今天,企業(yè)比以往任何時候都更加依賴數(shù)據(jù)的力量。Cloudera與NVIDIA的合作將為客戶提供必要的技術(shù)支持,幫助客戶更好地理解數(shù)據(jù),并充分發(fā)掘真正的AI轉(zhuǎn)型潛力。CDP分析體驗專為幫助數(shù)據(jù)專家跨多個公有云和私有云、自信應(yīng)對指數(shù)級數(shù)據(jù)增長和孤島式數(shù)據(jù)分析而構(gòu)建的。接下來我們將深化與NVIDIA的現(xiàn)有集成,通過使用我們的企業(yè)數(shù)據(jù)云服務(wù),客戶將可以保持他們現(xiàn)有的競爭優(yōu)勢。”
NVIDIA數(shù)據(jù)科學(xué)產(chǎn)品組高級總監(jiān)Scott McClellan表示:“Apache Spark為企業(yè)保持競爭力所依賴的機器學(xué)習(xí)和數(shù)據(jù)分析管道奠定了基礎(chǔ)。NVIDIA加速的計算和運行在Cloudera Data Platform上的Spark分析所帶來的處理能力,提供了如期高速完成任務(wù)的靈活性,同時節(jié)省成本。”
用于Apache Spark的RAPIDS加速器將于今年夏天在CDP私有云版本中提供。NVIDIA與Cloudera將陸續(xù)在CDP中推出更多的加速產(chǎn)品,5月將會在CDP公有云中提供深度學(xué)習(xí)和機器學(xué)習(xí)加速產(chǎn)品。您可以在本周NVIDIA GTC上了解有關(guān)本次合作的更多信息:https://www.nvidia.com/cn-us/gtc/。
http:m.mangadaku.com/news/63001.htm

