当前位置: 首页 > news >正文

2017自己做网站的趋势商城网站备案流程

2017自己做网站的趋势,商城网站备案流程,网站运营与管理的对策建议,wordpress登录无反应第五章 深度学习 十二、光学字符识别#xff08;OCR#xff09; 2. 文字检测技术 2.3 DB#xff08;2020#xff09; DB全称是Differentiable Binarization#xff08;可微分二值化#xff09;#xff0c;是近年提出的利用图像分割方法进行文字检测的模型。前文所提…第五章 深度学习 十二、光学字符识别OCR 2. 文字检测技术 2.3 DB2020 DB全称是Differentiable Binarization可微分二值化是近年提出的利用图像分割方法进行文字检测的模型。前文所提到的模型使用一个水平矩形框或带角度的矩形框对文字进行定位这种定位方式无法应用于弯曲文字和不规范分布文字的检测。DB模型利用图像分割方法预测出每个像素的类别是文字/不是文字可以用于任意形状的文字检测。如下图所示 左图原图右图检测结果红色部分为预测成文字的像素区域蓝色为非文字像素区域 2.3.1 基本流程 DB之前的一些基于图像分割的文字检测模型识别原理如上图蓝色箭头所标记流程 第一步对原图进行分割预测出每个像素的属于文本/非文本区域的概率 第二步根据第一步生成的概率和某个固定阈值进行比较产生一个二值化图 第三步采用一些启发式技术例如像素聚类将像素分组为文本示例。 DB模型的流程如上图红色箭头所示流程 第一步对原图进行分割预测出每个像素的属于文本/非文本区域的概率。同时预测一个threshold map阈值图 第二步采用第一步预测的概率和预测的阈值进行比较不是直接和阈值比较而是通过构建一个公式进行计算根据计算结果得到二值化图。在计算二值化图过程中采用了一种二值化的近似函数称为可微分二值化Differentiable Binarization在训练过程中该函数完全可微分 第三步根据二值化结果生成分割结果。 2.3.2 标签值生成 对于每个经过原始标记的样本上图中第一张图像采用Vatti clipping algorithm算法一种用于计算多边形裁剪的算法对多边形进行缩放得到缩放后的多边形作为文字边沿如上图中第二张图像绿色、蓝色多边形所示。计算公式 D A ( 1 − r 2 ) L D \frac{A(1 - r^2)}{L} DLA(1−r2)​ 其中D是收缩放量A为多边形面积L为多边形周长r是缩放系数设置为0.4. 根据计算出的偏移量D进行缩小得到缩小的多边形第二张图像蓝色边沿所示根据偏移量D放大得到放大的多边形第二张图像绿色边沿所示两个边沿间的部分就是文字边界。 2.3.3 模型结构 Differentiable Binarization模型结构如下图所示 模型经过卷积得到不同降采样比率的特征图经过特征融合后产生一组分割概率图、一组阈值预测图然后微分二值化算法做近似二值化处理得到预测二值化图。传统的二值化方法一般采用阈值分割法计算公式为 B i , j { 1 , i f P i , j ≥ t 0 , o t h e r w i s e (1) B_{i, j} \begin{cases} 1,\quad if \ P_{i,j} \ge t \\ 0, \quad otherwise \end{cases} \tag{1} Bi,j​{1,if Pi,j​≥t0,otherwise​(1) 上式描述的二值化方法是不可微分的导致在训练期间无法与分割网络部分一起优化为了解决这个问题DB模型采用了近似阶跃函数的、可微分二值化函数。函数定义如下 B ^ i , j 1 1 e − k ( P i , j − T i , j ) \hat B_{i, j} \frac{1}{1e^{-k(P_{i,j} - T_{i, j})}} B^i,j​1e−k(Pi,j​−Ti,j​)1​ 其中 P i , j P_{i,j} Pi,j​表示预测概率 T i , j T_{i, j} Ti,j​表示阈值两个值相减后经过系数 K K K放大当预测概率越大于阈值则输出值越逼近1。 标准二值化函数与可微分二值化函数比较。SBstandard binarization其梯度在0值被截断无法进行有效地回传。DBdifferentiable binarization是一个可微分的曲线 # 可谓分二值化函数示例 import mathP1 0.6 # 预测概率1 P2 0.4 # 预测概率2 T 0.5 # 阈值 K 50B1 1.0 / (1 pow(math.e, -K * (P1 - T))) print(B1:, B1) # B1:0.9933 趋近于1B2 1.0 / (1 pow(math.e, -K * (P2 - T))) print(B2:, B2) # B2:0.00669 趋近于02.3.4 损失函数 DB模型损失函数如下所示 L L s α × L b β × L t L L_s \alpha \times L_b \beta \times L_t LLs​α×Lb​β×Lt​ 其中 L s L_s Ls​是预测概率图的loss部分 L b L_b Lb​是二值图的loss部分 α \alpha α和 β \beta β值分别设置为1和10. L s L_s Ls​和 L b L_b Lb​均采用二值交叉熵 L s L b ∑ i ∈ S l y i l o g x i ( 1 − y i ) l o g ( 1 − x i ) L_s L_b \sum_{i \in S_l} y_i log x_i (1 - y_i) log(1-x_i) Ls​Lb​i∈Sl​∑​yi​logxi​(1−yi​)log(1−xi​) 上式中 S l S_l Sl​是样本集合正负样本比例为1:3. L t Lt Lt指经过膨胀后的多边形区域中的像素预测结果和标签值之间的 L 1 L1 L1距离之和 L t ∑ i ∈ R d ∣ y i ∗ − x i ∗ ∣ L_t \sum_{i \in R_d} |y_i ^* - x_i ^*| Lt​i∈Rd​∑​∣yi∗​−xi∗​∣ R d R_d Rd​值膨胀区域 G d G_d Gd​内的像素索引, y i ∗ y_i ^* yi∗​是阈值图的标签值。 2.3.5 涉及到的数据集 模型在以下6个数据集下进行了实验 SynthText合成数据集包含80万张图像用于模型训练MLT-2017多语言数据集包含9种语言7200张训练图像1800张验证图像及9000张测试图像用于模型微调ICDAR 2015包含1000幅训练图像和500幅测试图像分辨率720*1280提供了单词级别标记MSRA-TD500包含中英文的多语言数据集300张训练图像及200张测试图像CTW1500专门用于弯曲文本的数据集1000个训练图像和500个测试图像文本行级别标记Total-Text包含各种形状的文本及水平、多方向和弯曲文字1255个训练图像和300个测试图像单词级别标记 为了扩充数据量论文采用了随机旋转-10°~10°角度内、随机裁剪、随机翻转等策略进行数据增强。 对各种形状的文本实例的一些可视化结果包括弯曲文本、多向文本、垂直文本和长文本行。对于每个单元右上角是阈值映射右下角是概率图。 2.3.6 效果 不同设置结果比较“DConv”表示可变形卷积。“P”、“R”和“F”分别表示精度、召回率和F度量。 Total-Text数据集下测试结果括号中的值表示输入图像的高度“*”表示使用多尺度进行测试“MTS”和“PSE”是Mask TextSpotter和PSENet的缩写 CTW1500数据集下测试结果。括号中的值表示输入图像的高度。 ICDAR 2015数据集下测试结果。括号中的值表示输入图像的高度“TB”和“PSE”是TextBoxes和PSENet的缩写。 MSRA-TD500数据集下测试结果。括号中的值表示输入图像的高度。 MLT-2017数据集下测试结果。“PSE”是PSENet的缩写。 2.3.7 结论 能有效检测弯曲文本、不规范分布文本具有较好的精度和速度局限不能处理文本中包含文本的情况
http://www.hkea.cn/news/14453440/

相关文章:

  • 网站建设seo优化培训网站知名度
  • 网站开发实用技术pdf网页设计的流程
  • 儿童主题网站的内容建设兰州seo快速排名
  • 河北城乡建设厅网站wordpress short link
  • 三只松鼠网站怎样做广告网站 源码
  • 手机架设网站外贸网站建设哪个好
  • 建网站莱阳哪家强?网站建设套定额
  • 口碑好的定制网站建设提供商wordpress 文章 顺序
  • 全网营销和网站建设广东门户网站建设
  • 崇文门网站建设wordpress手机顶部菜单
  • 广州高端优秀网站改版设计公司百度网站排名seo
  • 推销商务网站的途径有哪些太原app开发公司
  • 做教育行业网站WordPress页面批量生成
  • 怎么做网站推广软件电子商务网站建设首页流程
  • 华为网站建设策划书百度广告位价格表
  • 自己做一个商城网站怎么做uc浏览器导航
  • 网站建设挣钱吗?wordpress阅读数修改
  • 六安网站建设招聘公众号排名优化软件
  • 网站建设申请计划word做网站
  • 中国网站排行榜前100名类似好123门户网站开发复杂么
  • 做网站一天赚多少钱地图网站设计
  • 安化网站建设网络运营推广是做什么的
  • 微信公众号平台网站开发辽宁品牌建设促进会 网站
  • 电商网站如何做seo网络规划设计师一本通
  • 网站不被收录的原因在家做私房菜的网站
  • 网站不在首页显示出来吗建设能播放视频的网站
  • 长春专业网站建设模板温州网站建设温州网站制作
  • 天然气公司的网站应该怎么做沧县网站建设公司
  • 惠来做网站广告设计公司相城黄埭
  • 公众号视频网站怎么做凌峰wordpress百度云