【示例 1 】提取文本
成都創(chuàng)新互聯(lián)公司專注于化德企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè),商城建設(shè)?;戮W(wǎng)站建設(shè)公司,為化德等地區(qū)提供建站服務(wù)。全流程按需網(wǎng)站開發(fā),專業(yè)設(shè)計,全程項目跟蹤,成都創(chuàng)新互聯(lián)公司專業(yè)和態(tài)度為您提供的服務(wù)
using Spire.Pdf;
using System;
using System.IO;
using System.Text;
namespace ExtractText
{
class Program
{
static void Main(string[] args)
{
//加載文檔
PdfDocument document = new PdfDocument();
document.LoadFromFile("測試文檔.pdf");
//實例化StringBuilder類,獲取文本
StringBuilder content = new StringBuilder();
content.Append(document.Pages[0].ExtractText());
//保存提取后的文本內(nèi)容到.txt文檔
String fileName = "TextFromPDF.txt";
File.WriteAllText(fileName, content.ToString());
System.Diagnostics.Process.Start("TextFromPDF.txt");
}
}
}
文本提取效果:
【示例 2 】提取圖片
using System;
using System.Collections.Generic;
using System.Text;
using System.Drawing;
using Spire.Pdf;
namespace ExtractImagesFromPDF
{
class Program
{
static void Main(string[] args)
{
//實例化PdfDocument類,并加載測試文檔
PdfDocument doc = new PdfDocument();
doc.LoadFromFile("測試文檔.pdf");
//實例化List類
List ListImage = new List();
for (int i = 0; i < doc.Pages.Count; i++)
{
// 獲取 Spire.Pdf.PdfPageBase類對象
PdfPageBase page = doc.Pages[i];
// 提取圖片
Image[] images = page.ExtractImages();
if (images != null && images.Length > 0)
{
ListImage.AddRange(images);
}
}
if (ListImage.Count > 0)
{
for (int i = 0; i < ListImage.Count; i++)
{
Image image = ListImage[i];
image.Save("image" + (i + 1).ToString() + ".png", System.Drawing.Imaging.ImageFormat.Png);
}
System.Diagnostics.Process.Start("image1.png");
}
}
}
}
圖片提取效果: