最近工作中需要用spark對(duì)中文的字符提取,由于環(huán)境一直是英文的,發(fā)現(xiàn)打印出來(lái)是亂碼。后經(jīng)研究,需要做一個(gè)UTF-8的轉(zhuǎn)換 大概如下: val data_file = sc.textFile(“test.txt”) val item1 = data_file.map(p => new String(p.getBytes, 0, p.getLength, "UTF-8")).map{ item => XXX }
全國(guó)免費(fèi)咨詢:
業(yè)務(wù)咨詢:028-86922220 / 13518219792
節(jié)假值班:18980820575 / 13518219792
聯(lián)系地址:成都市太升南路288號(hào)錦天國(guó)際A幢1002號(hào)
在線咨詢
微信咨詢
電話咨詢
028-86922220(工作日)
18980820575(7×24)
提交需求
返回頂部