真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

詳解使用Node.js將txt文件轉(zhuǎn)為Excel文件

最近同事需要對一份報告進行整理,一共有80個報告約9000多行放在一個txt文件中。雖然每份報告的格式比較類似,但其中部分字段對應(yīng)的數(shù)量依舊會有差別。所以真要靠人工來做,無疑會是一件費時費力的并且是很枯燥的工作。據(jù)說如果有了這個程序,可以減少60%的工作量!那么為了我以后的下午茶,自然應(yīng)該去嘗試一下不是么?

創(chuàng)新互聯(lián)專業(yè)為企業(yè)提供貢覺網(wǎng)站建設(shè)、貢覺做網(wǎng)站、貢覺網(wǎng)站設(shè)計、貢覺網(wǎng)站制作等企業(yè)網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計與制作、貢覺企業(yè)網(wǎng)站模板建站服務(wù),十多年貢覺做網(wǎng)站經(jīng)驗,不只是建網(wǎng)站,更提供有價值的思路和整體網(wǎng)絡(luò)服務(wù)。

不過既然是費時費力又枯燥的工作,自然就應(yīng)該交給代碼去解決。畢竟,我堅信任何的科學(xué)技術(shù)就是為了讓人類偷懶而存在的。那么就先切入正題,先上GitHub的項目地址。歡迎批評指點。

GitHub項目:report-maker

項目分析

既然準備要上代碼了,作為一個狂熱的前端愛好者,自然首選Node.js了。這一個項目主要的目的就是將txt文件中的內(nèi)容按照一定的規(guī)則轉(zhuǎn)化為固定格式的表格并導(dǎo)出為Excel。那么重點就可以分為下面兩步了。

  1. Excel文件的生成
  2. txt內(nèi)容的整理

1. Excel文件的生成

Excel文件自然是尋找可以依賴的模塊了(畢竟我自己寫不出來)。找了一圈,發(fā)現(xiàn)js-xlsx這一個模塊。雖然看起來很復(fù)雜,但其實只要提供好表頭和內(nèi)容就可以,其余只是對于內(nèi)容數(shù)據(jù)整理的固定模板。

相關(guān)教程可以參考下面這篇,講的比較詳細所以這里就不多做贅述了。

參考教程:使用node-xlsx進行excel文件的讀寫

2. txt內(nèi)容的整理

解決了Excel導(dǎo)出的問題(不然就得換Py了呢),文檔內(nèi)容的整理便是這個項目最重要的問題了。最終整理的表格樣式以及需要抽出的項目內(nèi)容已經(jīng)和同事確認過了。那么接下來就是如何整理了一個有著80個長短不一報告的文件了。

首先來看看文件的格式,整個文件的格式類似于下面這樣。

 Policy Name:  policyName1
 ……省略中間內(nèi)容……
 Policy Type:  Standard (0)
 ……省略中間內(nèi)容……
 Client/HW/OS/Pri/CIT: Client1
 Client/HW/OS/Pri/CIT: Client2
 Client/HW/OS/Pri/CIT: Client3
 Client/HW/OS/Pri/CIT: Client4
 ……省略多個Client
 Include:   /dir1
 Include:   /dir2
 Include:   /dir3
 ……省略多個Include
 Schedule:    Schedule1
  Type:
  ……
 Schedule:    Schedule2
  Type:
  ……
 ……省略多個Schedule

 Policy Name:  policyName2
 ……省略中間內(nèi)容……
 ……

可以看出,每一個段落是以Policy Name為分界的。那么,利用fs.readFile將完整的文件讀取進來,作為一個字符串使用split方法進行切割。具體代碼如下:

fs.readFile(filePath, 'UTF-8', function (err, data) {
 if (err) throw err;
 // 對文件讀取的數(shù)據(jù)進行處理,首先用 policyName 進行切割
 var policyLists = data.split(config.splitRules.policyName);
 if (policyLists[0] === '\r\n') {
 policyLists.shift();
 };

然后針對數(shù)組中每一個元素(一個段落)根據(jù)之前文件中所需要項目,使用正則表達式切提取出所需要的內(nèi)容,然后將提取出的內(nèi)容組成所需要的數(shù)據(jù)結(jié)構(gòu),具體代碼如下。其中schedule項目中內(nèi)容也并非在一行中,所以也同樣使用上面的方法進行切割。而對于其他的項目,則通過正則表達式來進行內(nèi)容的獲取。

 policyLists.forEach(function (policy) {
 var policyData = policyFormatter(config.splitRules.policyName + policy);
 excelData.push(policyData);
 });

/**
 * 對每一個policy進行整理 使其符合表格插入的形式
 * @param {*} policy 
 * {
 * policyName: String
 * client: []]
 * policyType: String
 * include: []
 * schedule[]
 * scheduleResidence: String
 * }
 * 
 */
function policyFormatter(policy) {

 var policyNameMatcher = new RegExp(config.splitRules.policyName + "([\\s\\w\\d\\-]*)\\r\\n"),
 clientMatcher = new RegExp(config.splitRules.client + "([\\s\\w\\d\\?\\-\\.]*)\\r\\n", "g"),
 policyTypeMatcher = new RegExp(config.splitRules.policyType + "([\\s\\w\\d\\(\\)\\-]*)\\r\\n"),
 includeMatcher = new RegExp(config.splitRules.include + "([\\s/\\w\\.\\\\:_\\?=\\\"\\*]*)\\r\\n", "g");

 var scheduleLists = policy.split(config.splitRules.schedule).slice(1),
 scheduleFormatLists = [],
 scheduleResidenceMatcher = new RegExp(config.splitRules.scheduleResidence + "([\\s\\w\\d\\-\\(\\)]*)\\r\\n");

 scheduleLists.forEach(function (schedule) {
 var scheduleFormat = config.splitRules.schedule + schedule;
 scheduleFormatLists.push(scheduleFormat);
 });

 // console.log(scheduleFormatLists);

 var results = {
 policyName: policy.match(policyNameMatcher)[1].trim(),
 client: policy.match(clientMatcher) ? policy.match(clientMatcher).join('').trim() : '',
 policyType: policy.match(policyTypeMatcher)[1].trim(),
 include: policy.match(includeMatcher).join('').trim(),
 schedule: scheduleFormatLists.join('').trim(),
 scheduleResidence: scheduleLists[0].match(scheduleResidenceMatcher)[1].trim()
 };

 // console.dir(results);
 return results;
}

主要邏輯處理完以后,把收集到的內(nèi)容傳給excel處理模塊,導(dǎo)出成文件就能解決問題了。

不過似乎最終如果能導(dǎo)出為Word,似乎更好??磥磉€有新的改進空間還留著呢。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持創(chuàng)新互聯(lián)。


文章名稱:詳解使用Node.js將txt文件轉(zhuǎn)為Excel文件
當前鏈接:http://weahome.cn/article/jhheds.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部