真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

大數(shù)據(jù)中Spark實戰(zhàn)技巧是什么

本篇文章給大家分享的是有關(guān)大數(shù)據(jù)中Spark實戰(zhàn)技巧是什么,小編覺得挺實用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

成都創(chuàng)新互聯(lián)為您提適合企業(yè)的網(wǎng)站設(shè)計?讓您的網(wǎng)站在搜索引擎具有高度排名,讓您的網(wǎng)站具備超強的網(wǎng)絡(luò)競爭力!結(jié)合企業(yè)自身,進行網(wǎng)站設(shè)計及把握,最后結(jié)合企業(yè)文化和具體宗旨等,才能創(chuàng)作出一份性化解決方案。從網(wǎng)站策劃到網(wǎng)站制作、成都網(wǎng)站設(shè)計, 我們的網(wǎng)頁設(shè)計師為您提供的解決方案。

1.連接MySQL

--driver-class-path mysql-connector-java-5.1.21.jar 在數(shù)據(jù)庫中,SET GLOBAL binlog_format=mixed;

2.Spark中 使用Hive的udf

同樣使用—jars 才行

3.Spark jupyter使用

https://www.jb51.net/article/163641.htm

https://my.oschina.net/albert2011/blog/754174

使用jupyter-notebook --ip hostname -i來啟動

4.Spark使用hive的orc解析格式

spark.sql.hive.convertMetastoreOrc=true

使用spark寫入hive表中的數(shù)據(jù),可能會出現(xiàn)空指針問題或者數(shù)據(jù)越界問題,問題原因是spark的元數(shù)據(jù)解析問題,而不是hive的元數(shù)據(jù)解析問題

5.row_number排序算子的使用

import org.apache.spark.sql.expressions.Window
import org.apache.spark.sql.functions.row_number
import org.apache.spark.sql.functions._

1.spark.sql(sql).withColumn("rn", row_number().over(Window.partitionBy('f_trans_id).orderBy(col("f_modify_time").desc))) 2.spark.sql(sql).withColumn("rn", row_number().over(Window.partitionBy('f_trans_id).orderBy(-col("f_modify_time"))))

3.val df = spark.sql(sql)

df.withColumn("rn", row_number().over(Window.partitionBy('f_trans_id).orderBy(-df("f_modify_time"))))

4.spark.sql(sql).withColumn("rn", row_number().over(Window.partitionBy('f_trans_id).orderBy(-'f_modify_time)))

注意:-的方式,經(jīng)過測試,不穩(wěn)定,有時可以,有時不可以

6.broadcast廣播表

sc.broadcast是廣播數(shù)據(jù),一般用于rdd廣播,而下面的方式用于廣播表

import org.apache.spark.sql.functions.broadcast

broadcast(tableData).createOrReplaceTempView 

以上就是大數(shù)據(jù)中Spark實戰(zhàn)技巧是什么,小編相信有部分知識點可能是我們?nèi)粘9ぷ鲿姷交蛴玫降摹OM隳芡ㄟ^這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。


分享題目:大數(shù)據(jù)中Spark實戰(zhàn)技巧是什么
當(dāng)前地址:http://weahome.cn/article/iihdhp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部