轉帖|使用教程|編輯:黃竹雯|2019-04-18 16:19:01.000|閱讀 3770 次
概述:文本和圖片是PDF文檔的重要組成部分。本文將介紹如何通過編程的方式使用Spire.PDF C#獲取PDF文檔中的文本和圖片并保存到本地路徑。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
Spire.PDF是一個專業(yè)的PDF組件,能夠獨立地創(chuàng)建、編寫、編輯、操作和閱讀PDF文件,支持 .NET、Java、WPF和Silverlight。
文本和圖片是PDF文檔的重要組成部分。本文將介紹如何通過編程的方式使用Spire.PDF C#獲取PDF文檔中的文本和圖片并保存到本地路徑。
//實例化一個PdfDocument對象
PdfDocument doc = new PdfDocument();
//加載PDF文檔
doc.LoadFromFile("測試文檔.pdf");
//實例化一個StringBuilder 對象
StringBuilder content = new StringBuilder();
//提取PDF所有頁面的文本
foreach (PdfPageBase page in doc.Pages)
{
content.Append(page.ExtractText());
}
//將提取到的文本寫為.txt格式并保存到本地路徑
String fileName = "獲取文本.txt";
File.WriteAllText(fileName, content.ToString());
//加載PDF文檔
PdfDocument doc = new PdfDocument();
doc.LoadFromFile("測試文檔.pdf");
ListListImage = new List();
for (int i = 0; i < doc.Pages.Count; i++)
{
// 實例化一個Spire.Pdf.PdfPageBase對象
PdfPageBase page = doc.Pages[i];
// 獲取所有pages里面的圖片
Image[] images = page.ExtractImages();
if (images != null && images.Length > 0)
{
ListImage.AddRange(images);
}
}
// 將提取到的圖片保存到本地路徑
if (ListImage.Count > 0)
{
for (int i = 0; i < ListImage.Count; i++)
{
Image image = ListImage[i];
image.Save("image" + (i + 1).ToString() + ".png", System.Drawing.Imaging.ImageFormat.Png);
}
}
效果圖:
Spire.PDF還有一套完整的視頻教程:,免費學習~
查看冰藍更多產(chǎn)品教程,為你推薦:
本站文章除注明轉載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@ke049m.cn