当前位置: 首页 > news >正文

威海自适应网站建设建设通下载

威海自适应网站建设,建设通下载,WordPress在线留言插件,东莞市官网网站建设品牌处理PDF文件中的内容是比较麻烦的事情#xff0c;特别是以表格形式呈现的各种数据。为了充分利用这些宝贵的数据资源#xff0c;我们可以通过程序提取PDF文件中的表格#xff0c;并将其保存为更易于处理和分析的格式#xff0c;如txt、csv、xlsx#xff0c;从而更方便地对…处理PDF文件中的内容是比较麻烦的事情特别是以表格形式呈现的各种数据。为了充分利用这些宝贵的数据资源我们可以通过程序提取PDF文件中的表格并将其保存为更易于处理和分析的格式如txt、csv、xlsx从而更方便地对表格数据进行处理、分析和可视化加快工作效率。本文将介绍如何在.NET平台使用C#代码提取并保存PDF文件中的表格数据。 文章目录 提取PDF文件中的表格并保存为TXT和CSV文件提取PDF文件中的表格并转换为Excel和CSV表格 本文所使用的方法需要用到免费的Free Spire.PDF for .NET可从官网下载或通过NuGet安装 PM Install-Package FreeSpire.PDF提取PDF文件中的表格并保存为TXT和CSV文件 提取PDF表格数据主要用到的是PdfTableExtractor类该类下的ExtractTable(int pageIndex)方法可以提取任意页的所有表格数据并返回表格的集合。在提取到表格数据后我们就可以将数据稍作处理并写入txt文件了。下面是操作示例 创建 PdfDocument 对象并再入PDF文件。 PdfDocument doc new PdfDocument(); doc.LoadFromFile(示例.pdf);创建 PdfTableExtractor 对象。 PdfTableExtractor extractor new PdfTableExtractor(doc);声明 PdfTable 数组.遍历文档页面从页面提取表格。 tableList extractor.ExtractTable(pageIndex);判断表格列表是否为空如果不为空则使用 PdfTable.GetText(int rowIndex, int columnIndex) 方法在每个表格中获取单元格中的数据并添加到StringBuilder中。将处理好的数据保存到TXT文件并关闭PDF文件。 完整代码示例 using System.Text; using Spire.Pdf; using Spire.Pdf.Utilities;namespace ExtractPdfTable {class Program{static void Main(string[] args){// 创建PdfDocument对象并加载PDF文件PdfDocument doc new PdfDocument();doc.LoadFromFile(示例.pdf);// 创建 StringBuilder 对象StringBuilder builder new StringBuilder();// 初始化 PdfTableExtractor 类的实例PdfTableExtractor extractor new PdfTableExtractor(doc);// 声明 PdfTable 数组PdfTable[]? tableList null;int tableCount 1;// 循环遍历页面for (int pageIndex 0; pageIndex doc.Pages.Count; pageIndex){// 从特定页面提取表格tableList extractor.ExtractTable(pageIndex);// 判断表格列表是否为空if (tableList ! null tableList.Length 0){// 遍历列表中的表格foreach (PdfTable table in tableList){// 获取特定表格的行数和列数int row table.GetRowCount();int column table.GetColumnCount();// 遍历行和列for (int i 0; i row; i){for (int j 0; j column; j){// 获取特定单元格的文本string text table.GetText(i, j);// 将文本添加到 StringBuilder 中并添加制表符builder.Append(text \t);}builder.Append(\r\n);}// 写入 .txt 文件File.WriteAllText($output/TXT表格/TXT表格_{tableCount}.txt, builder.ToString());tableCount 1;}}}doc.Close();}} }PDF文件 保存的TXT文件 提取PDF文件中的表格并转换为Excel和CSV表格 在提取PDF文件中的表格后我们还可以借助Free Spire.XLS for .NET将提取的表格保存为Excel和CSV表格。Free Spire.XLS for .NET可从官网下载或通过NuGet安装 PM Install-Package FreeSpire.XLS下面是操作示例 创建 PdfDocument 对象并加载示例PDF文件。 PdfDocument doc new PdfDocument(); doc.LoadFromFile(示例.pdf);创建 Workbook 对象并清除默认工作表。 Workbook workbook new Workbook(); workbook.Worksheets.Clear();初始化 PdfTableExtractor 类的实例。 PdfTableExtractor extractor new PdfTableExtractor(doc);声明 PdfTable 数组。循环遍历PDF页面并提取每页的表格。 tableList extractor.ExtractTable(pageIndex);判断表格列表是否为空如果不为空则创建Excel工作表使用 PdfTable.GetText(int rowIndex, int columnIndex) 方法从每个单元格提取数据并通过 sheet.Range[int rowIndex 1, int columnIndex 1].Value 属性将数据写入到创建Excel工作表中。将工作表保存为csv文件。 sheet.SaveToFile(output/表格/CSV表格.csv, ,, Encoding.UTF8);或保存整个Excel工作簿为xlsx文件。 workbook.SaveToFile(output/表格/Excel表格.xlsx, ExcelVersion.Version2013);关闭PDF文件和工作簿文件。 完整代码示例 using System.Text; using Spire.Pdf; using Spire.Pdf.Utilities; using Spire.Xls;namespace ExtractTablesToExcel {class Program{static void Main(string[] args){// 创建 PdfDocument 对象并加载示例PDF文件PdfDocument doc new PdfDocument();doc.LoadFromFile(示例.pdf);// 创建 Workbook 对象并清除默认工作表Workbook workbook new Workbook();workbook.Worksheets.Clear();// 初始化 PdfTableExtractor 类的实例PdfTableExtractor extractor new PdfTableExtractor(doc);// 声明 PdfTable 数组PdfTable[]? tableList null;int sheetNumber 1;// 循环遍历页面for (int pageIndex 0; pageIndex doc.Pages.Count; pageIndex){// 从特定页面提取表格tableList extractor.ExtractTable(pageIndex);// 判断表格列表是否为空if (tableList ! null tableList.Length 0){// 遍历列表中的表格foreach (PdfTable table in tableList){// 添加工作表Worksheet sheet workbook.Worksheets.Add(string.Format(Table_{0}, sheetNumber));// 获取特定表格的行数和列数int row table.GetRowCount();int column table.GetColumnCount();// 循环遍历行和列for (int i 0; i row; i){for (int j 0; j column; j){// 从特定单元格获取文本string text table.GetText(i, j);// 将文本写入指定单元格sheet.Range[i 1, j 1].Value text;}}sheet.SaveToFile(output/表格/CSV表格.csv, ,, Encoding.UTF8);sheetNumber;}}}// 保存为Excel工作簿workbook.SaveToFile(output/表格/Excel表格.xlsx, ExcelVersion.Version2013);doc.Close();workbook.Dispose();}} }输出文件 本文介绍了如何使用免费的Free Spire.PDF for .NET和Free Spire.XLS for .NET从PDF文件中提取表格数据并保存到TXT文件、CSV文件以及Excel文件的方法。其他更多功能请前往Spire.PDF for .NET教程查看。
http://www.hkea.cn/news/14266848/

相关文章:

  • 公司网站建设征稿令电商扶贫网站建设
  • 怎么弄一个网站python做网站项目
  • 网站做数据监测威海外贸网站建设多少钱
  • 全球网站访问量排名网站建设及解析流程
  • 建设商城网站的难点做视频网站广告收费
  • 网站建设创业书品牌建设对企业发展的重要性
  • 网页做得好的网站wordpress 二次元插件
  • 广州网站(建设信科网络)深圳工程建设交易中心网
  • 芜湖酒店网站建设wordpress科技网站模板
  • 做ppt的模板网站有哪些深圳网站建设找智恒网络
  • 做包装找灵感看什么网站淘宝图片做链接的网站
  • 网站模板修改教程网站建设 外文文献
  • 如何查询网站域名辽宁省建设工程信息网官网招标
  • 做个外贸网站制作网站的视频教程
  • 做喷绘可以在那个网站找广告传媒公司
  • 织梦软件展示网站源码天津招标信息网官网
  • 南谯区住房和城乡建设局网站公司建设网站的注意事项
  • 网站设计主题选择有没有专做自驾游的网站
  • 海淀做网站产品设计ppt案例
  • 如何做网站站内搜索硬件工程师
  • 免费手机建站网站福州婚庆网站建设哪个公司比较专业
  • 长沙网站制作收费明细表wordpress分享QQ插件
  • 泉州专业制作网站开发外包做网站公司
  • 企业快速建站的公司网站seo优化推广
  • 淮安市建设局网站邯郸做网站就找安联网络
  • asp网站开发技术房地产宣传推广方案
  • 北京医院网站建设jsp怎样做网站
  • 建筑建设网站搜搜提交网站入口
  • 选择合肥网站建设怎么样做一个个人网站
  • 网站建设结课总结网站定制设计师