這篇文章主要介紹“.NET for Apache Spark 1.0有哪些功能”,在日常操作中,相信很多人在.NET for Apache Spark 1.0有哪些功能問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”.NET for Apache Spark 1.0有哪些功能”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
10年積累的成都網(wǎng)站設計、成都做網(wǎng)站經(jīng)驗,可以快速應對客戶對網(wǎng)站的新想法和需求。提供各種問題對應的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡服務。我雖然不認識你,你也不認識我。但先做網(wǎng)站后付款的網(wǎng)站建設流程,更有長葛免費網(wǎng)站建設讓你可以放心的選擇與我們合作。
.NET for Apache Spark 1.0 現(xiàn)已發(fā)布,這是一個用于 Spark 大數(shù)據(jù)的 .NET 框架,可以讓 .NET 開發(fā)者輕松地使用 Apache Spark。
該軟件包由微軟和 .NET Foundation 牽頭,經(jīng)過大約兩年的開發(fā)。在 2019 年的 Spark + AI 峰會上,微軟曾宣布推出 .NET for Apache Spark,并發(fā)布了首個預覽版本 v0.1.0。
1.0 版本包括以下內容:
支持面向 .NET Standard 2.0 的 .NET 應用程序(建議使用 .NET Core 3.1 或更高版本)。
支持 Apache Spark 2.4/3.0 DataFrame API,包括編寫 Spark SQL 的功能。例如:
var spark = SparkSession.Builder().GetOrCreate();
var tweets = spark.Read().Schema("date STRING, time STRING, author STRING, tweet STRING").Format("csv").Load(inputfile);
tweets = tweets.GroupBy(Lower(Col("author")).As("author"))
.Agg(Count("tweet").As("tweetcount"))
.OrderBy(Desc("tweetcount"));
tweets.Write().SaveAsTable("tweetcount");
spark.Sql(@"SELECT * FROM tweetcount").show();
能夠使用 .NET 用戶自定義函數(shù)(UDF)編 寫Apache Spark 應用程序。例如:
// Define and register UDF
var concat = Udf((age, name)=>name+age);
// Use UDF
df.Filter(df["age"] > 21).Select(concat(df["age"], df["name"]).Show();
提供 API 擴展框架以添加對其他 Spark 庫的支持。當前包括對 Linux foundation Delta Lake、Microsoft OSS Hyperspace、ML.NET、以及對 Apache Spark’s MLLib functionality 的支持。
在 Spark 運行時和 .NET UDFs 之間移動數(shù)據(jù)的性能工作和改進 pickling interop 以及對 Apache Arrow 的支持。
競爭優(yōu)勢:沒有使用 UDF 的 .NET for Apache Spark 程序與基于 Scala 和 PySpark 的非 UDF Spark 應用程序顯示出相同的速度。如果應用程序包含UDF,.NET for Apache Spark 程序的速度至少和 PySpark 程序一樣快,一般來說更快。
到此,關于“.NET for Apache Spark 1.0有哪些功能”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續(xù)學習更多相關知識,請繼續(xù)關注創(chuàng)新互聯(lián)網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
當前文章:.NETforApacheSpark1.0有哪些功能
本文路徑:http://weahome.cn/article/jsiocg.html