当前位置: 首页 > news >正文

建筑论坛网站2345浏览器官方网站

建筑论坛网站,2345浏览器官方网站,wordpress论坛模版,wordpress和dada最近几天#xff0c;paddleOCR开发了新的功能#xff0c;通过将图片中的表格提取出来#xff0c;效果还不错#xff0c;今天#xff0c;作者按照步骤测试了一波。 首先#xff0c;讲下这个工具是干什么用的#xff1a;它的功能主要是针对一张完整的PDF图片#xff0c;可…最近几天paddleOCR开发了新的功能通过将图片中的表格提取出来效果还不错今天作者按照步骤测试了一波。 首先讲下这个工具是干什么用的它的功能主要是针对一张完整的PDF图片可以对文档图片中的文本、表格、图片、标题与列表区域进行分类。同时还可以利用表格识别技术完整地提取表格结构信息使得表格图片变为可编辑的Excel文件。如下图所示可以进行版面分析表格识别。 核心技术在于两个一个是PP-Structure的版面分析技术另一个是PaddleDetection开源的高效检测算法PP-YOLO v2。 PP-Structure Pipeline介绍 下面作者按照官网的说明进行安装(https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/ppstructure/README_ch.md) #step1: 首先需要安装paddle # GPU安装 python -m pip install paddlepaddle-gpu2.1.1 -i https://mirror.baidu.com/pypi/simple # CPU安装作者在这里使用CPU安装  python -m pip install paddlepaddle2.1.1 -i https://mirror.baidu.com/pypi/simple #step2安装 Layout-Parser pip  install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl #step3安装PaddleOCR包含PP-OCR和PP-Structure pip install paddleocr2.2 这样就算安装好了但是途中会有一些报错信息一个是 ImportError: DLL load failed: 找不到指定的模块。 在查阅了相关的资料之后发现重新安装也没有用作者是通过安装旧版本的软件就解决了这个问题。另一个报错是cv2.imread读取图像结果为none,这个错误是由于你的路径中有中文字体全部修改为英文的即可。 接下来就是运行主要的程序代码 1 import os2 import cv23 from paddleocr import PPStructure,draw_structure_result,save_structure_res4 5 table_engine PPStructure(show_logTrue)6 7 #你的文件结果目录8 save_folder C:/Users/hp/Desktop/pdf_ocr/output/table9  10 #输入的图片 11 img_path C:/Users/hp/Desktop/pdf_ocr/table/5.png 12 img cv2.imread(img_path) 13  14 result table_engine(img) 15 save_structure_res(result, save_folder,os.path.basename(img_path).split(.)[0]) 16  17 for line in result: 18     line.pop(img) 19     print(line) 20  21 from PIL import Image 22  23 #字体路径可以从paddleOCR的github上面下载 24 font_path C:/Users/hp/Desktop/pdf_ocr/fonts/simfang.ttf25 image Image.open(img_path).convert(RGB) 26 im_show draw_structure_result(image, result,font_pathfont_path) 27 im_show Image.fromarray(im_show) 28 im_show.save(result.jpg)运行完成后每张图片会在​​output​​字段指定的目录下有一个同名目录图片里的每个表格会存储为一个excel图片区域会被裁剪之后保存下来excel文件和图片名名为表格在图片里的坐标。 这样就可以看到识别出来的excel表格了。
http://www.hkea.cn/news/14536032/

相关文章:

  • 海西电子商务网站建设怎么弄免费的空间做网站
  • 网站怎么被搜到首页劳务外包和劳务派遣
  • 网站建设的困难做商城网站怎么做
  • 南平企业网站建设建网站做外贸
  • 做pc端网站怎么样做美容一般在哪个网站团购比较好
  • 建设银行纪念币网站中国最近战争新闻
  • 做自媒体有哪些网站wordpress好卡
  • 重庆网站平台中国新闻社在哪里
  • 网站配色案例分析国际电商平台有哪些
  • go 语言 做网站wordpress提示不安全
  • 微信公众号商城网站开发wordpress主机
  • 科学家做实验的网站php wordpress教程
  • 如何撰写网站建设方案郑州网站顾问热狗网
  • 网站络济南建网站公司
  • 免费企业网站建设条件seo顾问阿亮
  • 网站前端建设需要学会什么洛阳网站建设哪家权威
  • 网站开发语网站制作免费
  • 厦门门户网站建设如何免费制作app软件
  • 怎么才能制作网站呢南通网站推广优化公司
  • 怎么提交公司网站wordpress成品站源码
  • 教你做网站黄浦网站推广公司
  • 备案域名查询官网手机网站关键词优化
  • 自己做网站要学前端和后端网络推广费用计入什么科目
  • python 做爬虫网站北京软件有限公司
  • 西安房产网站大全企业网站建设完整教程
  • 寿光营销型网站建设网站出现转站怎么办
  • 西宁市网站设计企业谷歌seo博客
  • 高端网站建设的介绍青岛做企业网站
  • 家居网站源码美的网站建设规划书
  • 山东三强建设咨询有限公司网站房屋竣工验收备案表网上查询