真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

JAVA過濾標簽實現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法示例

本文實例講述了JAVA過濾標簽實現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法。分享給大家供大家參考,具體如下:

創(chuàng)新互聯(lián)主營金灣網(wǎng)站建設的網(wǎng)絡公司,主營網(wǎng)站建設方案,app開發(fā)定制,金灣h5重慶小程序開發(fā)搭建,金灣網(wǎng)站營銷推廣歡迎金灣等地區(qū)企業(yè)咨詢

/**
* 把html內(nèi)容轉(zhuǎn)為文本
* @param html 需要處理的html文本
* @param filterTags 需要保留的html標簽樣式
* @return
*/
public static String trimHtml2Txt(String html, String[] filterTags){
    html = html.replaceAll("\\[\\s\\S]*?(?i)", "");//去掉head
    html = html.replaceAll("\\", "");//去掉注釋
    html = html.replaceAll("\\", "");
    html = html.replaceAll("\\]*>[\\s\\S]*?(?i)", "");//去掉樣式
    html = html.replaceAll("\\]*>[\\s\\S]*?(?i)", "");//去掉js
    html = html.replaceAll("\\]+>[\\s\\S]*?]+>(?i)", "");//去掉word標簽
    html = html.replaceAll("\\[\\s\\S]*?(?i)", "");
    html = html.replaceAll("\\]*>|]*>||(?i)", "");
    html = html.replaceAll("\\\r\n|\n|\r", " ");//去掉換行
    html = html.replaceAll("\\]*>(?i)", "\n\r");
    List tags = new ArrayList();
    List s_tags = new ArrayList();
    List halfTag = Arrays.asList(new String[]{"img","table","thead","th","tr","td"});//
    if(filterTags != null && filterTags.length > 0){
      for (String tag : filterTags) {
        tags.add("<"+tag+(halfTag.contains(tag)?"":">"));//開始標簽
        if(!"img".equals(tag)) tags.add("");//結(jié)束標簽
        s_tags.add("#REPLACETAG"+tag+(halfTag.contains(tag)?"":"REPLACETAG#"));//盡量替換為復雜一點的標記,以免與顯示文本混合,如:文本中包含#td、#table等
        if(!"img".equals(tag)) s_tags.add("#REPLACETAG/"+tag+"REPLACETAG#");
      }
    }
    html = StringUtils.replaceEach(html, tags.toArray(new String[tags.size()]), s_tags.toArray(new String[s_tags.size()]));
    html = html.replaceAll("\\

(?i)", "\n\r"); html = html.replaceAll("\\<[^>]+>", ""); html = StringUtils.replaceEach(html,s_tags.toArray(new String[s_tags.size()]),tags.toArray(new String[tags.size()])); html = html.replaceAll("\\ ", " "); return html.trim(); }

PS:這里再為大家推薦一款功能類似的在線工具供大家參考使用:

在線html/js/css代碼過濾工具
http://tools.jb51.net/code/htmlfilter

另外,關于正則操作,這里再為大家推薦兩款相關在線工具:

JavaScript正則表達式在線測試工具:
http://tools.jb51.net/regex/javascript

正則表達式在線生成工具:
http://tools.jb51.net/regex/create_reg

更多關于java算法相關內(nèi)容感興趣的讀者可查看本站專題:《Java數(shù)據(jù)結(jié)構與算法教程》、《Java字符與字符串操作技巧總結(jié)》、《Java操作DOM節(jié)點技巧總結(jié)》、《Java文件與目錄操作技巧匯總》和《Java緩存操作技巧匯總》

希望本文所述對大家java程序設計有所幫助。


網(wǎng)頁標題:JAVA過濾標簽實現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法示例
文章出自:http://weahome.cn/article/jeepio.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部