当前位置: 首页 > news >正文

郑州做网站好中囯军事网

郑州做网站好,中囯军事网,商城网站都有什么功能模块,网站建设的素材整理论文OCR模型调研及详细安装 1 搭建 Tesseract-OCR 环境。 1.1 注意需先手动安装Tesseract-OCR, 下载地址:https://digi.bib.uni-mannheim.de/tesseract/?CM;OD 注意:安装的时候选中中文包(安装时把所有选项都勾上)。 安装磁盘选择…

OCR模型调研及详细安装

1 搭建 Tesseract-OCR 环境。

1.1 注意需先手动安装Tesseract-OCR, 下载地址:https://digi.bib.uni-mannheim.de/tesseract/?C=M;O=D

注意:安装的时候选中中文包(安装时把所有选项都勾上)。
安装磁盘选择与运行的代码在同一磁盘。
安装 Tesseract-OCR 后,需将 Tesseract-OCR 对应的安装路径添加到系统环境变量中。安装完成后,使用命令,查看版本号和支持语言:
cd C:\Program Files\Tesseract-OCR  
tesseract -v tesseract --list-langs -v tesseract --list-langs 若有语言方面的Error,需将中文包 chi_sim.traineddata 下载到本地C:\Program Files\Tesseract-OCR 路径下。(见1.3下载语言包)

1.2 再安装python库pytesseract

pip install pytesseract

1.3 下载语言包,并放到Tesseract的目录下

下载地址:https://github.com/tesseract-ocr/tesseract/wiki/Data-Fileshttps://tesseract-ocr.github.io/tessdoc/Data-Files

1.4 代码块

def tesseract_to_str(image_path):"""Tesseract-OCR: 提取图片中的文字,返回 text字符串"""from PIL import Imageimport pytesseractimport osif not os.path.isfile(image_path):logging.info('          路径存在问题,请检查image_path: '.format(image_path))return ''image = Image.open(image_path)# 如果没有将tesseract的安装目录添加到系统环境变量中,则需要指定安装路径,pytesseract.pytesseract.tesseract_cmd = r"D:\Program_Files\Tesseract-OCR\tesseract.exe"testdata_dir_config = '--tessdata-dir D:/Program_Files/Tesseract-OCR/tessdata'# 调用pytesseract库提取文字,识别中文需指定语言lang='chi_sim'print('-'*20,'获取图中的文字','-'*20)try:text_from_image = pytesseract.image_to_string(image,  config=testdata_dir_config, lang='chi_sim')except Exception as e:logging.info('          识别文字失败:{} '.format(e))return ''# print('-' * 20, '获取图中的文字完成', '-' * 20)# print('text_from_tesseract: \n', text_from_image)return text_from_image

2 EasyOCR: 是一个基于 PyTorch 的 OCR 库。

pip install easyocr

源码

https://github.com/JaidedAI/EasyOCR
API详解见:https://blog.csdn.net/yohnyang/article/details/130300923

模型储存路径:

windows: C:\Users\username\.EasyOCR\
linux:/root/.EasyOCR/

代码

def easyocr_to_str(image_path):import easyocr# import os# os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"# reader = easyocr.Reader(['ch_sim','en'], gpu = False)print('result:1 \n', )reader = easyocr.Reader(['ch_sim',], gpu = False)print('result:2 \n', )result = reader.readtext(image_path)print('result: \n', result)for detection in result:print(detection[1])

问题

OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.
OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program. That is dangerous, since it can degrade performance or cause incorrect results. The best thing to do is to ensure that only a single OpenMP runtime is linked into the process, e.g. by avoiding static linking of the OpenMP runtime in any library. As an unsafe, unsupported, undocumented workaround you can set the environment variable KMP_DUPLICATE_LIB_OK=TRUE to allow the program to continue to execute, but that may cause crashes or silently produce incorrect results. For more information, please see http://www.intel.com/software/products/support/.

修改:

网友说的方法:

添加如下代码

import os
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"

然而没用,然后修改了自己环境中的如下内容之后,不再报错了,即使将上述os内容注释,也不报错。

D:\ProgramFiles\miniconda3\envs\env_myenv\Library\bin路径下的libiomp5md.dll改为libiomp5md.dll.bk

识别文本示例:


3 Keras-OCR

源码

https://gitcode.com/gh_mirrors/ke/keras-ocr/overview?utm_source=artical_gitcode&index=top&type=card&webUrl

安装

安装 :keras-ocr支持Python >= 3.6和TensorFlow >= 2.0.0。
方法1: 从主分支安装
pip install git+https://github.com/faustomorales/keras-ocr.git#egg=keras-ocr
方法2: 从PyPi安装
pip install keras-ocr

4 Doctr 识别文档中的文本区域、图像和表格

项目地址

https://gitcode.com/gh_mirrors/do/doctr/overview?utm_source=artical_gitcode&index=top&type=card&webUrl&isLogin=1

安装

pip install "python-doctr[torch]"

首次运行会下载模型,存储在

C:\Users\hlj\.cache\doctr\models\db_resnet50-79bd7d70.pt
C:\Users\hlj\.cache\doctr\models\crnn_vgg16_bn-9762b0b0.pt

缺点

不支持中文模型
http://www.hkea.cn/news/171030/

相关文章:

  • 专做女装的网站网站备案是什么意思
  • 没有网站可以做seo排名吗小学生简短小新闻摘抄
  • 做程序网站需要什么代码宁波seo搜索排名优化
  • 网站建设开发语言新冠病毒最新消息
  • 怎么做1688网站网页制作工具有哪些
  • 一个网站的主题和设计风格最好用的免费建站平台
  • 网站开发主页手机优化游戏性能的软件
  • 怎么做属于自己的域名网站网络策划方案
  • destoon做的网站百度商务合作联系
  • 金山区网站制作网络营销策划书1500字
  • 厦门网站建设制作工具熊猫关键词挖掘工具
  • 徐州网站建设 网站推广百度首页快速排名系统
  • 在线转格式网站怎么做拼多多seo 优化软件
  • 成都理工疫情最新消息贵港seo
  • 网站如何防止攻击怎么自己做一个小程序
  • 企业网站建设英文百度收录
  • wordpress查版本sem和seo的区别
  • 网站设计说明书怎么写网站建设平台官网
  • 有建网站的软件阿里云域名注册万网
  • 站长工具排名分析怎么创建公司网站
  • 网站建设标书四川seo哪里有
  • 接网站开发做多少钱建一个外贸独立站大约多少钱
  • wordpress表单录入seo报告
  • python做网站显示表格星巴克seo网络推广
  • 一个com的网站多少钱管理微信软件
  • 蒙阴网站建设软文代写网
  • 用python做一旅游网站南昌seo计费管理
  • 湖北省建设厅win10优化软件哪个好
  • 湖南企业建站系统平台软文有哪些发布平台
  • 南通 网络 公司网站真正免费建站