vrjapanxxxxhdvideosvr_和老板在办公室做刺激好爽_女王性调教视频_欧美jizzhd精品欧美巨大

咨詢郵箱?咨詢郵箱:service@yitianxinda.com 咨詢熱線?咨詢熱線:18101296137 微博 微信
北京軟件開發(fā)公司Apache Spark 2.0技術(shù)預(yù)覽版_北京軟件開發(fā)公司
發(fā)表日期:2016-06-08 10:12:36 ?? 文章編輯:yitianxinda ?? 瀏覽次數(shù):

  北京軟件開發(fā)公司Apache Spark 2.0技術(shù)預(yù)覽版,Apache Spark第一版發(fā)布時(shí)隔兩年后,Databricks公布了基于上游分支2.0.0-preview的Apache Spark 2.0技術(shù)預(yù)覽版。該預(yù)覽版在穩(wěn)定性和API方面均不適合用于生產(chǎn)環(huán)境,主要是為了在正式上市前收集來及社區(qū)的反饋。

  此次發(fā)布的新版主要針對(duì)社區(qū)反饋進(jìn)一步完善了各種功能,根據(jù)Spark的開發(fā)計(jì)劃,主要改進(jìn)分為兩方面。

  SQL是基于Apache Spark的應(yīng)用程序較常用的接口之一。Spark 2.0可以支持全部的99個(gè)TPC-DS查詢,這些查詢大部分都基于SQL:2003規(guī)范。這些改進(jìn)有助于在對(duì)應(yīng)用程序堆棧進(jìn)行較少量重寫的情況下將現(xiàn)有數(shù)據(jù)負(fù)載移植至Spark后端。

  第二方面改進(jìn)主要是編程API,同時(shí)在這個(gè)新版中也更重視機(jī)器學(xué)習(xí)。spark.mllib程序包已經(jīng)被全新的spark.ml程序包所取代,后者更加側(cè)重于基于管線的API,這項(xiàng)技術(shù)源自DataFrames。機(jī)器學(xué)習(xí)管線和模型現(xiàn)已能夠持久保存,Spark所支持的所有語(yǔ)言均支持這一特性。同時(shí)R已經(jīng)可以支持K-Means、Generalized Linear Models(GLM)、樸素貝葉斯和Survival Regression。

  借助新增的Datasets類,DataFrames和Datasets已實(shí)現(xiàn)了統(tǒng)一,可支持Scala和Java編程語(yǔ)言,同時(shí)也可充當(dāng)結(jié)構(gòu)流(Structured streaming)的抽象。不支持編譯時(shí)類型安全(Compile time type safety)的語(yǔ)言暫時(shí)還無法做到這一點(diǎn),此時(shí)只能使用DataFrames作為主要抽象。SQLContext和HiveContext已被統(tǒng)一的SparkSession所取代。新增的Accumulator API具有比基本類型更簡(jiǎn)單的類型層級(jí),可支持對(duì)基本類型進(jìn)行專門化(Specialization)。老的API已被棄用,但為了實(shí)現(xiàn)向后兼容性依然包含在新版中。

  新發(fā)布的結(jié)構(gòu)化流API主要可用于在不增加復(fù)雜性的前提下管理流數(shù)據(jù)集,借此程序員和現(xiàn)有機(jī)器學(xué)習(xí)算法將可以處理批量加載的數(shù)據(jù)集。在第二代Tungsten引擎的幫助下,性能也有所增強(qiáng),執(zhí)行速度較高可提升10倍。

  該技術(shù)預(yù)覽版已經(jīng)發(fā)布至DataBricks。

相關(guān)文章推薦
下一代工業(yè)進(jìn)步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動(dòng)化)互聯(lián)互通并實(shí)現(xiàn)計(jì)算機(jī)化。工業(yè)4.0的目標(biāo)是使工廠變得更加智能,提高適應(yīng)性和資源效率,以及改善工廠之間供...
您正在尋找能夠?qū)⒛钊梭@嘆的應(yīng)用程序想法變?yōu)楝F(xiàn)實(shí)的人。我應(yīng)該聘請(qǐng)軟件公司還是兼職開發(fā)者?這可能是每個(gè)新晉產(chǎn)品所有者問自己的最常見問題。在開始開發(fā)過程之前,您需要...
從頭開始構(gòu)建網(wǎng)站并托管和維護(hù)或改造舊網(wǎng)站需要聘請(qǐng)一支擁有技能和專業(yè)知識(shí)的團(tuán)隊(duì)。如果您不想進(jìn)一步擴(kuò)大團(tuán)隊(duì),不想經(jīng)歷招聘大手筆,或者想降低離岸成本,北京軟件開發(fā)外包...
物聯(lián)網(wǎng) ( IoT ) 概念首次出現(xiàn)時(shí),曾有大膽預(yù)測(cè)稱,到 2020 年,物聯(lián)網(wǎng)連接設(shè)備數(shù)量將達(dá)到 500 億甚至數(shù)萬億。這些極高的估值引發(fā)了炒作,但最終被證明...
下一代工業(yè)進(jìn)步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動(dòng)化)互聯(lián)互通并實(shí)現(xiàn)計(jì)算機(jī)化。工業(yè)4.0的目標(biāo)是使工廠變得更加智能,提高適應(yīng)性和資源效率,以及改善工廠之間供...
企業(yè)需要強(qiáng)大且可靠的在線形象才能取得成功。Magento 已成為領(lǐng)先的電子商務(wù)平臺(tái),為各種規(guī)模的企業(yè)提供強(qiáng)大的功能和定制選項(xiàng)。對(duì)于希望通過基于 Magento ...
北京軟件開發(fā)公司已經(jīng)開發(fā)出一種新的軟件來預(yù)測(cè)海洋、水庫(kù)和河流中的污染源的系統(tǒng)...
條件提供合 資源起源:其它 4)具有近三年完成在3個(gè)(含)以上同等界限的告捷案例,對(duì)“中國(guó)工商銀行股份無限公司軟件征戰(zhàn)重心北京研 3)具有ISO9000質(zhì)量認(rèn)證體系書;具有國(guó)度質(zhì)量...
為什么我們接受速度作為軟件開發(fā)中毫無疑問的法令?當(dāng)我們這樣做時(shí),我們會(huì)問自己:在引入數(shù)字化轉(zhuǎn)型過程中不疏遠(yuǎn)客戶的前提下,引入智能機(jī)器的最佳方法是什么? 要了解速度起...
經(jīng)由過程抗衡演練該部在新聞化條件下戰(zhàn)場(chǎng)感知、新聞傳輸、火力打擊和指揮職掌才干大大加強(qiáng),軟件誘導(dǎo)。新聞化為鐵甲插翅,我不大白北京軟件誘導(dǎo)。將藍(lán)方逼向絕路末路。北京。...
軟件開發(fā)公司通過demo學(xué)習(xí)OpenStack開發(fā)——單元測(cè)試...
北京軟件開發(fā)公司移動(dòng)軟件測(cè)試儀,它是重要的是要把各種硬件和操作系統(tǒng)(操作系統(tǒng))的條件,看看如何影響軟件。有測(cè)試人員不考慮硬件或操作系統(tǒng)條件的移動(dòng)測(cè)試儀的曲目的必要...
?