最近這幾周大數(shù)據(jù)領(lǐng)域可謂動作頻頻,初創(chuàng)公司和老牌企業(yè)都紛紛發(fā)布新品,更新或改進(jìn)現(xiàn)有的產(chǎn)品系列,以及達(dá)成戰(zhàn)略性關(guān)系。
目前成都創(chuàng)新互聯(lián)公司已為成百上千的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)絡(luò)空間、網(wǎng)站托管維護(hù)、企業(yè)網(wǎng)站設(shè)計(jì)、達(dá)拉特網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。行業(yè)觀察人士表示,許多企業(yè)拿來試點(diǎn)階段的大數(shù)據(jù)系統(tǒng)(尤其是那些整合Hadoop平臺的系統(tǒng))后,將它們部署到更廣泛的生產(chǎn)環(huán)境。本文介紹的新聞主要旨在幫助公司進(jìn)行這種轉(zhuǎn)型。
下面看一下引起我們關(guān)注的12則與大數(shù)據(jù)有關(guān)的動向。其中許多來自近日在加州圣何塞召開的2016年Hadoop峰會。
Actian發(fā)布VectorH 5.0數(shù)據(jù)庫
Actian首席營銷官托尼·卡瓦諾(Tony Kavanaugh,圖左)與Actian合作伙伴銷售副總裁戴夫·休格曼(Dave Sugarman)在近期召開的2016年Hadoop峰會上交談。
Actian本周發(fā)布了Actian Vector in Hadoop(VectorH)5.0,這是該公司現(xiàn)已與Apache Spark集成起來的SQL-in-Hadoop數(shù)據(jù)庫的新版本。
與Spark集成起來后,就可以獲取來自不同數(shù)據(jù)源、采用不同格式的數(shù)據(jù),讓開發(fā)人員得以利用VectorH,構(gòu)建高性能數(shù)據(jù)流、ETL和機(jī)器學(xué)習(xí)等應(yīng)用程序。隨著企業(yè)組織將Hadoop分析系統(tǒng)遷移到生產(chǎn)環(huán)境,這類功能至關(guān)重要。
Actian還大肆宣傳VectorH的更高性能,聲稱性能比像Apache Hive、Cloudera Impala、Apache Spark SQL和Apache HAWQ這些與之競爭的技術(shù)更勝一籌,并援引了TPC-H查詢基準(zhǔn)測試方面的結(jié)果。
Hortonworks經(jīng)銷AtScale的BI-on-Hadoop軟件
AtScale開發(fā)AtScale智能平臺,這讓常用的業(yè)務(wù)分析工具得以訪問存儲在Hadoop集群里面的數(shù)據(jù)。
在Hadoop峰會上,Hadoop軟件開發(fā)商Hortonworks表示,從今年第三季度開始,它將經(jīng)銷AtScale的軟件,作為其圍繞Hortonworks數(shù)據(jù)平臺的套裝軟件解決方案的一部分。
AtScale首席執(zhí)行官戴夫·馬里安尼(Dave Mariani)表示,考慮到Hortonworks的市場地位,這種關(guān)系將為AtScale提供一條重要的軟件銷售渠道。他告訴CRN:“我們認(rèn)為,這方面大有潛力帶來新業(yè)務(wù)。”
Attunity發(fā)布Visibility For Hadoop系統(tǒng)
Attunity是一家大數(shù)據(jù)管理軟件開發(fā)商,它發(fā)布了最新版本的Visibility for Hadoop系統(tǒng),可幫助管理員回答諸如此類的問題:誰在訪問Hadoop數(shù)據(jù),他們在如何使用數(shù)據(jù),以及在此過程中使用了哪些種類的IT資源。那些答案對于在基于Hadoop的數(shù)據(jù)湖生產(chǎn)環(huán)境里面管理數(shù)據(jù)增長和工作負(fù)載性能來說至關(guān)重要。
新版本提供了更全面的分析功能,可幫助企業(yè)組織衡量Hadoop數(shù)據(jù)和存儲使用情況,用于更準(zhǔn)確的容量規(guī)劃、優(yōu)化成本效益,并滿足數(shù)據(jù)治理和合規(guī)要求。新功能支持Hadoop文件系統(tǒng)的存儲級別,還支持眾多Hadoop數(shù)據(jù)處理引擎,包括MapReduce、Tez、Hive和Cloudera Impala。
Dataguise DgSecure 6.0
Dataguise發(fā)布了新版本的DgSecure軟件,這個軟件是以數(shù)據(jù)為中心的安全平臺,數(shù)據(jù)經(jīng)理和首席信息安全官可以使用該平臺,管理傳統(tǒng)關(guān)系數(shù)據(jù)庫和大數(shù)據(jù)平臺中的敏感數(shù)據(jù)。
DgSecure 6.0與一系列廣泛的數(shù)據(jù)平臺和數(shù)據(jù)源兼容,并支持本地系統(tǒng)和云系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。它提供了數(shù)據(jù)檢測、保護(hù)和監(jiān)控功能,用于數(shù)據(jù)治理。它還與一系列更廣泛的IT和數(shù)據(jù)管理框架兼容。
新版本還使用內(nèi)置模板和自定義模板,簡化了制定數(shù)據(jù)治理策略的工作。
Hortonworks發(fā)布HDP 2.5預(yù)覽版
Hortonworks將在今年第三季度發(fā)布旗艦Hortonworks數(shù)據(jù)平臺軟件的下一個版本,符合該公司在今年初承諾這款基于Apache Hadoop的軟件遵守的“快速發(fā)布”時(shí)間表。
HDP 2.5通過分別支持Apache Ranger和Apche Atlas,增添了該系統(tǒng)的安全功能和治理功能。另外得到支持的還有Apache Zeppelin,這種基于Web的筆記本用于使用SQL、Scala、Python及其他開發(fā)語言,創(chuàng)建交互式分析文檔。HDP 2.5還與最新版本的Apache Ambari集成起來,用于規(guī)劃、安裝和配置Hadoop系統(tǒng)。
Hortonworks還發(fā)布了增強(qiáng)版的Partnerworks合作伙伴計(jì)劃,添加了一些項(xiàng)目,旨在招募托管服務(wù)提供商,并服務(wù)于獨(dú)立軟件開發(fā)商和獨(dú)立硬件廠商合作伙伴。
Koverse 2.0加快數(shù)據(jù)湖的實(shí)施
初創(chuàng)公司Koverse提供一種“一體化數(shù)據(jù)湖”平臺;該公司表示,相比目前的技術(shù)和方法,有了該平臺,就可以大大加快收集大數(shù)據(jù)、部署到生產(chǎn)環(huán)境的速度,并降低成本。
該公司創(chuàng)辦于2012年,兩年多前開發(fā)了早期版本的技術(shù)。Koverse平臺2.0于6月21日發(fā)布,它采用了Apache Accumulo的“分布式鍵/值存儲”技術(shù)和該公司的通用索引引擎(Universal Indexing Engine)。
聯(lián)合創(chuàng)始人保羅·布朗(Paul Brown,首席產(chǎn)品官)和阿倫·科多瓦(Aaron Cordova,首席技術(shù)官)曾在美國國家安全局(NSA)從事過數(shù)據(jù)科學(xué)家的工作,他們幫助開發(fā)了最初的Accumulo項(xiàng)目,為該部門的數(shù)據(jù)基礎(chǔ)設(shè)施重新設(shè)計(jì)了架構(gòu),以便更好地處理意想不到的數(shù)據(jù)分析情形?,F(xiàn)在他們把這一專長帶給了Koverse的客戶。
Looker更新嵌入式分析工具集
Looker商業(yè)智能平臺可以訪問駐留在數(shù)據(jù)庫中或云端的數(shù)據(jù)。該公司的Powered by Looker工具讓開發(fā)人員得以將那些功能嵌入到應(yīng)用程序中,或者構(gòu)建具有數(shù)據(jù)探查和分析功能的自定義應(yīng)用程序。
本周,該公司更新了Powered by Looker,增添了預(yù)制應(yīng)用程序模板、預(yù)制網(wǎng)頁和應(yīng)用程序窗口組件庫、增強(qiáng)型API庫,以及眾多新功能,比如支持Javascript對話,那樣更容易把Looker嵌入到應(yīng)用程序里面。
Pepperdata Hadoop Health Check
Pepperdata開發(fā)的軟件用于管理和改進(jìn)Hadoop集群的性能。這家廠商啟動了Hadoop Health Check計(jì)劃;按照該計(jì)劃,該公司使用軟件對至少100個節(jié)點(diǎn)組成的Hadoop集群進(jìn)行補(bǔ)充性評估。該軟件可以收集并分析Hadoop性能數(shù)據(jù),該公司開發(fā)了診斷報(bào)告,可準(zhǔn)確查出耗用太多IT資源的有問題的用戶或任務(wù),識別未得到充分利用的集群資源,并將處理方面的瓶頸標(biāo)記出來。
Talend發(fā)布經(jīng)過更新的大數(shù)據(jù)集成平臺
Talend發(fā)布了新版本的Talend Data Fabric平臺,用于集成駐留在本地或云端的數(shù)據(jù)和應(yīng)用程序。
新版本的Talend Data Preparation軟件是Data Fabric系統(tǒng)的一部分,它為一系列廣泛的業(yè)務(wù)用戶提供了增強(qiáng)的自助式數(shù)據(jù)準(zhǔn)備功能,而不是像許多數(shù)據(jù)準(zhǔn)備工具那樣將它們局限于一小批熟悉數(shù)據(jù)的用戶。該公司表示,工具集提供了更直觀的數(shù)據(jù)準(zhǔn)備功能,還提供了基于角色訪問共享式數(shù)據(jù)存儲區(qū)的功能。
Talend Data Mapper中的新功能通過更容易地處理龐大數(shù)據(jù)集,以識別數(shù)據(jù)模式,找到新的商機(jī),幫助公司更好地發(fā)揮公司數(shù)據(jù)湖的運(yùn)營價(jià)值。Talend Data Fabric還新增了Talend Integration Cloud和亞馬遜Redshift中的數(shù)據(jù)集成任務(wù)之間的安全套接層通信。
Teradata發(fā)布支持Presto的技術(shù)
企業(yè)數(shù)據(jù)倉庫開發(fā)商Teradata發(fā)布了技術(shù),支持它所發(fā)行的來自許多大數(shù)據(jù)分析軟件開發(fā)商的Presto SQL-on-Hadoop軟件。
Presto最初由Facebook開發(fā),這個開源分布式查詢引擎可以針對各個數(shù)據(jù)源運(yùn)行交互式查詢,包括Apache Hive、Apache Cassandra、 Hadoop分布式文件系統(tǒng)、關(guān)系數(shù)據(jù)庫,甚至專有的數(shù)據(jù)存儲系統(tǒng)。Teradata的Presto發(fā)行版是這家開發(fā)商的Teradata統(tǒng)一數(shù)據(jù)架構(gòu)的一部分。
支持Teradata的Presto的軟件開發(fā)商包括:Tableau、Looker、Information Builders、Qlik和Zoomdata,MicroStrategy和微軟正努力認(rèn)證其商業(yè)智能工具,以便與該軟件兼容。
Waterline Data軟件支持Apache Atlas
Waterline Data開發(fā)同名的Smart Data Catalog軟件,可以清點(diǎn)數(shù)據(jù)湖資產(chǎn),改善數(shù)據(jù)發(fā)現(xiàn)功能,并且讓公司更容易從那些資產(chǎn)獲取價(jià)值。
Smart Data Catalog現(xiàn)在與Apache Atlas這種開源數(shù)據(jù)治理技術(shù)在Hortonworks數(shù)據(jù)平臺里面集成起來。借助Waterline Smart Data Catalog,Apache Atlas用戶就可以將人工的元數(shù)據(jù)標(biāo)記換成自動化流程,對數(shù)據(jù)湖資產(chǎn)進(jìn)行分類,并改善數(shù)據(jù)治理。
Zoomdata的可視化分析軟件支持MapR和Apache Drill
Zoomdata提供一種大數(shù)據(jù)可視化分析平臺,能夠?qū)崟r(shí)處理本地環(huán)境和云環(huán)境中龐大而復(fù)雜的查詢。
Zoomdata的軟件現(xiàn)已通過認(rèn)證,可與基于Hadoop的 MapR融合數(shù)據(jù)平臺兼容,這兩家公司正在展開合作,致力于改進(jìn)產(chǎn)品整合和支持。
作為這次合作的一方面,Zoomdata表示,它開發(fā)了一款“智能連接件”(smart connector),能夠以原生方式將其軟件與Apache Drill聯(lián)系起來,后者是一種開源SQL查詢引擎,可以訪問一大批NoSQL數(shù)據(jù)庫和文件系統(tǒng)中的數(shù)據(jù)。