真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

pdf讀取java代碼 java獲取pdf內(nèi)容

怎樣用JAVA編程實現(xiàn)讀取PDF文件中的文字或英文保存到TXT文檔中,不使用第三方jar包。

1、創(chuàng)建一個路徑為要讀取的txt文件的file對象rFile。2、創(chuàng)建一個路徑為要寫入的txt文件的file對象wFile。3、創(chuàng)建一個FileReader對象,傳入rFile到構造器。4、準備一個char數(shù)組,F(xiàn)ileReader類有一個繼承自java.io.Reader的read(char[]cbuf)方法,將字符讀入數(shù)組。5、創(chuàng)建一個FileWriter對象,傳入wFile到構造器。6、FileWriter類有一個繼承自java.io.Writer的write(char[]cbuf)方法,可以寫入字符數(shù)組。7、最后別忘了關閉流。

站在用戶的角度思考問題,與客戶深入溝通,找到遷西網(wǎng)站設計與遷西網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗,讓設計與互聯(lián)網(wǎng)技術結合,創(chuàng)造個性化、用戶體驗好的作品,建站類型包括:網(wǎng)站制作、網(wǎng)站建設、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣、申請域名、虛擬空間、企業(yè)郵箱。業(yè)務覆蓋遷西地區(qū)。

求助:java讀取pdf文件問題.我用下面代碼讀取本地的pdf文件沒問題但是讀取遠程的pdf文件就報異常

用UrlConnetion類, 讀取http:\\pdf\8928991747799539758.pdf ,

UrlConnection 的 openStream() 方法獲得一個讀取流,就可以讀取了

用java讀取pdf

可以使用PDFBOX0.7.3控件:

import java.io.InputStream;import java.io.IOException;

import org.apache.lucene.document.Document;import org.pdfbox.cos.COSDocument;

import org.pdfbox.pdfparser.PDFParser;import org.pdfbox.pdmodel.PDDocument;

import org.pdfbox.pdmodel.PDDocumentInformation;import org.pdfbox.util.PDFTextStripper;

import com.search.code.Index;

public Document getDocument(Index index, String url, String title, InputStream is)throws DocCenterException {COSDocument cosDoc = null;br/ try {cosDoc = parseDocument(is);br/ } catch (IOException e) {

closeCOSDocument(cosDoc);

throw new DocCenterException("無法處理該PDF文檔", e);

}

if (cosDoc.isEncrypted()) {

if (cosDoc != null)

closeCOSDocument(cosDoc);

throw new DocCenterException("該PDF文檔是加密文檔,無法處理");

}

String docText = null;

try {

PDFTextStripper stripper = new PDFTextStripper();

docText = stripper.getText(new PDDocument(cosDoc));

} catch (IOException e) {

closeCOSDocument(cosDoc);

throw new DocCenterException("無法處理該PDF文檔", e);

}

PDDocument pdDoc = null;

try {pdDoc = new PDDocument(cosDoc);br/ PDDocumentInformation docInfo = pdDoc.getDocumentInformation();br/ if(docInfo.getTitle()!=null !docInfo.getTitle().equals("")){br/ title = docInfo.getTitle();}

} catch (Exception e) {

closeCOSDocument(cosDoc);

closePDDocument(pdDoc);

System.err.println("無法取得該PDF文檔的元數(shù)據(jù)" + e.getMessage());

} finally {

closeCOSDocument(cosDoc);

closePDDocument(pdDoc);

}

return null;

}

private static COSDocument parseDocument(InputStream is) throws IOException {

PDFParser parser = new PDFParser(is);parser.parse();return parser.getDocument();

}

private void closeCOSDocument(COSDocument cosDoc) {

if (cosDoc != null) {try {cosDoc.close();} catch (IOException e) {}

}}

private void closePDDocument(PDDocument pdDoc) {

if (pdDoc != null) {

try { pdDoc.close();

} catch (IOException e) {

}}}

java 如何讀取PDF文件內(nèi)容

import java.io.File;

import java.io.FileOutputStream;

import java.io.OutputStreamWriter;

import java.io.Writer;

import java.net.MalformedURLException;

import java.net.URL;

import org.pdfbox.pdmodel.PDDocument;

import org.pdfbox.util.PDFTextStripper;

public class PdfReader {

public void readFdf(String file) throws Exception {

// 是否排序

boolean sort = false;

// pdf文件名

String pdfFile = file;

// 輸入文本文件名稱

String textFile = null;

// 編碼方式

String encoding = "UTF-8";

// 開始提取頁數(shù)

int startPage = 1;

// 結束提取頁數(shù)

int endPage = Integer.MAX_VALUE;

// 文件輸入流,生成文本文件

Writer output = null;

// 內(nèi)存中存儲的PDF Document

PDDocument document = null;

try {

try {

// 首先當作一個URL來裝載文件,如果得到異常再從本地文件系統(tǒng)//去裝載文件

URL url = new URL(pdfFile);

//注意參數(shù)已不是以前版本中的URL.而是File。

document = PDDocument.load(pdfFile);

// 獲取PDF的文件名

String fileName = url.getFile();

// 以原來PDF的名稱來命名新產(chǎn)生的txt文件

if (fileName.length() 4) {

File outputFile = new File(fileName.substring(0, fileName

.length() - 4)

+ ".txt");

textFile = outputFile.getName();

}

} catch (MalformedURLException e) {

// 如果作為URL裝載得到異常則從文件系統(tǒng)裝載

//注意參數(shù)已不是以前版本中的URL.而是File。

document = PDDocument.load(pdfFile);

if (pdfFile.length() 4) {

textFile = pdfFile.substring(0, pdfFile.length() - 4)

+ ".txt";

}

}

// 文件輸入流,寫入文件倒textFile

output = new OutputStreamWriter(new FileOutputStream(textFile),

encoding);

// PDFTextStripper來提取文本

PDFTextStripper stripper = null;

stripper = new PDFTextStripper();

// 設置是否排序

stripper.setSortByPosition(sort);

// 設置起始頁

stripper.setStartPage(startPage);

// 設置結束頁

stripper.setEndPage(endPage);

// 調(diào)用PDFTextStripper的writeText提取并輸出文本

stripper.writeText(document, output);

} finally {

if (output != null) {

// 關閉輸出流

output.close();

}

if (document != null) {

// 關閉PDF Document

document.close();

}

}

}

/**

* @param args

*/

public static void main(String[] args) {

// TODO Auto-generated method stub

PdfReader pdfReader = new PdfReader();

try {

// 取得E盤下的SpringGuide.pdf的內(nèi)容

pdfReader.readFdf("E://SpringGuide.pdf");

} catch (Exception e) {

e.printStackTrace();

}

}

}

怎么用java讀取pdf文件內(nèi)容

你可以把pdf轉成word在進行讀取

推薦使用轉轉大師pdf轉word轉換器,免費的在線工具

百度搜索下,在線免費轉換就行了,不用下載注冊,很方便


當前題目:pdf讀取java代碼 java獲取pdf內(nèi)容
標題URL:http://weahome.cn/article/dodpdjs.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部