当前位置: 首页 > news >正文

网站审核备案wordpress用vps搭建

网站审核备案,wordpress用vps搭建,国内免费建站网站,石家庄网络公司哪里多开源项目 敏感词核心 https://github.com/houbb/sensitive-word 敏感词控台 https://github.com/houbb/sensitive-word-admin 版本特性 大家好#xff0c;我是老马。 敏感词标签分类一直是大家比较想要的一个功能特性#xff0c;v0.24.0 了开始内置支持标签分类#xff0c…开源项目 敏感词核心 https://github.com/houbb/sensitive-word 敏感词控台 https://github.com/houbb/sensitive-word-admin 版本特性 大家好我是老马。 敏感词标签分类一直是大家比较想要的一个功能特性v0.24.0 了开始内置支持标签分类同时实现了多种策略。 快速开始 maven 引入 dependencygroupIdcom.github.houbb/groupIdartifactIdsensitive-word/artifactIdversion0.24.0/version /dependency敏感词标签 说明 有时候我们希望对敏感词加一个分类标签比如社情、暴/力等等。 这样后续可以按照标签等进行更多特性操作比如只处理某一类的标签。 主要特性支持版本v0.24.0 标签接口 这里只是一个抽象的接口用户可以自行定义实现。比如从数据库查询、文件读取、api 调用等。 public interface IWordTag {/*** 查询标签列表* param word 脏词* return 结果*/SetString getTag(String word);}内置实现 方法列表 为了方便大部分情况使用内置实现一些场景策略在 WordTags 类中 实现方法说明备注none()空实现v0.10.0 支持file(String filePath)指定文件路径v0.10.0 支持file(String filePath, String wordSplit, String tagSplit)指定文件路径以及单词分隔符、标签分隔符v0.10.0 支持map(final MapString, Set wordTagMap)根据 map初始化v0.24.0 支持lines(Collection lines)字符串列表v0.24.0 支持lines(Collection lines, String wordSplit, String tagSpli)字符串列表以及单词分隔符、标签分隔符v0.24.0 支持system()系件文件内置实现整合网络分类v0.24.0 支持defaults()默认策略目前为 systemv0.24.0 支持chains(IWordTag… others)链式方法支持用户整合实现多个策略v0.24.0 支持 格式约定 敏感词标签的格式我们默认约定如下 敏感词 tag1,tag2代表这 敏感词 的标签为 tag1 和 tag2 比如 五星红旗 政治,国家所有的文件行内容和指定的字符串行内容也建议用这种方式。如果不满足自定义实现即可。 系统内置实现默认效果 v0.24.0 版本开始默认的单词标签为 WordTags.system()。 说明目前数据统计自网络存在不少疏漏。也欢迎大家指正持续改进中… SensitiveWordBs sensitiveWordBs SensitiveWordBs.newInstance() .wordTag(WordTags.system()) .init(); SetString tagSet sensitiveWordBs.tags(博彩); Assert.assertEquals([3], tagSet.toString());这里为了压缩大小优化对应的类别用数字表示。 数字的含义列表如下 0 政治 1 毒品 2 色情 3 赌博 4 违法文件入门例子 这里以文件为例子演示一下如何使用。 final String path ~\\test\\resources\\dict_tag_test.txt;// 演示默认方法 IWordTag wordTag WordTags.file(path); SensitiveWordBs sensitiveWordBs SensitiveWordBs.newInstance().wordTag(wordTag).init();SetString tagSet sensitiveWordBs.tags(零售);Assert.assertEquals([广告, 网络], tagSet.toString());// 演示指定分隔符 IWordTag wordTag2 WordTags.file(path, , ,); SensitiveWordBs sensitiveWordBs2 SensitiveWordBs.newInstance().wordTag(wordTag2).init(); SetString tagSet2 sensitiveWordBs2.tags(零售);Assert.assertEquals([广告, 网络], tagSet2.toString());其中 dict_tag_test.txt 我们自定义的内容如下 零售 广告,网络单词标签和敏感词发现的联动 我们在获取敏感词的时候是可以设置对应的结果处理策略从而获取对应的敏感词标签信息 // 自定义测试标签类 IWordTag wordTag WordTags.lines(Arrays.asList(天安门 政治,国家,地址));// 指定初始化 SensitiveWordBs sensitiveWordBs SensitiveWordBs.newInstance().wordTag(wordTag).init();ListWordTagsDto wordTagsDtoList1 sensitiveWordBs.findAll(天安门, WordResultHandlers.wordTags()); Assert.assertEquals([WordTagsDto{word天安门, tags[政治, 国家, 地址]}], wordTagsDtoList1.toString());我们自定义了 天安门 关键词的标签然后通过指定 findAll 的结果处理策略为 WordResultHandlers.wordTags()就可以在获取敏感词的同时获取对应的标签列表。 单词标签与结果匹配联动 有时候我们可能希望对匹配的敏感词进一步限制比如虽然我们定义了【av】作为敏感词但是不希望【have】被匹配。 标签分类也可以和结果匹配联动。支持版本 v0.23.0 我们可以只返回隶属于某一种标签的敏感词。 我们指定了两个敏感词商品、AV MyWordTag 是我们定义的一个敏感词标签实现 /*** 自定义单词标签* since 0.23.0*/ public class MyWordTag extends AbstractWordTag {private static MapString, SetString dataMap;static {dataMap new HashMap();dataMap.put(商品, buildSet(广告, 中文));dataMap.put(AV, buildSet(色情, 单词, 英文));}private static SetString buildSet(String... tags) {SetString set new HashSet();for(String tag : tags) {set.add(tag);}return set;}Overrideprotected SetString doGetTag(String word) {return dataMap.get(word);}}测试用例如下我们模拟了两个不同的实现类每一个关注的单词标签不同。 // 只关心SE情 SensitiveWordBs sensitiveWordBsYellow SensitiveWordBs.newInstance().wordDeny(new IWordDeny() {Overridepublic ListString deny() {return Arrays.asList(商品, AV);}}).wordAllow(WordAllows.empty()).wordTag(new MyWordTag()).wordResultCondition(WordResultConditions.wordTags(Arrays.asList(色情))).init();// 只关心广告 SensitiveWordBs sensitiveWordBsAd SensitiveWordBs.newInstance().wordDeny(new IWordDeny() {Overridepublic ListString deny() {return Arrays.asList(商品, AV);}}).wordAllow(WordAllows.empty()).wordTag(new MyWordTag()).wordResultCondition(WordResultConditions.wordTags(Arrays.asList(广告))).init();final String text 这些 AV 商品什么价格; Assert.assertEquals([AV], sensitiveWordBsYellow.findAll(text).toString()); Assert.assertEquals([商品], sensitiveWordBsAd.findAll(text).toString());小结 希望本文对你有所帮助如果喜欢欢迎点赞收藏转发一波。 我是老马期待与你的下次相遇。 敏感词系列 sensitive-word-admin 敏感词控台 v1.2.0 版本开源 sensitive-word-admin v1.3.0 发布 如何支持分布式部署 01-开源敏感词工具入门使用 02-如何实现一个敏感词工具违禁词实现思路梳理 03-敏感词之 StopWord 停止词优化与特殊符号 04-敏感词之字典瘦身 05-敏感词之 DFA 算法(Trie Tree 算法)详解 06-敏感词(脏词) 如何忽略无意义的字符达到更好的过滤效果 v0.10.0-脏词分类标签初步支持 v0.11.0-敏感词新特性忽略无意义的字符词标签字典 v0.12.0-敏感词/脏词词标签能力进一步增强 v0.13.0-敏感词特性版本发布 支持英文单词全词匹配 v0.16.1-敏感词新特性之字典内存资源释放 v0.19.0-敏感词新特性之敏感词单个编辑不必重复初始化 v0.20.0 敏感词新特性之数字全部匹配而不是部分匹配 v0.21.0 敏感词新特性之白名单支持单个编辑修正白名单包含黑名单时的问题 v0.23.0 敏感词新特性之结果条件拓展内置支持链式单词标签 v0.24.0 新特性支持标签分类内置实现多种策略
http://www.hkea.cn/news/14348705/

相关文章:

  • 有哪些做共享充电宝的网站上海网络营销公司
  • 做自媒体怎么在其它网站搬运内容北京集团公司注册流程
  • 网站404报错深圳企业黄页网站
  • 佛山网站建设公司哪家最好上海网络公司查询
  • 衡阳网站网站建设厦门seo关键词优化运营
  • 怒江企业网站建设哪个企业做网站
  • 网站制作流程详解(学做网站第一步)wordpress 最强大主题
  • 自己如何建立网站电影网站开发技术
  • 中小型企业网站建设企业上海虹口网站建设
  • 东莞做营销型网站软件技术是什么专业
  • 添加网站关键词建设网站方法
  • 重庆专业网站推广报价云主机上传网站
  • 有声小说网站开发百姓网站制作
  • 龙岗网站建设多少钱中国做视频网站有哪些
  • 怎样创建网站网站换模板对seo
  • 做国外商品的网站推荐网站网页
  • 个人网站怎么做才能值钱建设移动门户
  • 基础网站建设的实施步骤wordpress权限控制
  • 中文绿色环保网站模板泰安做网站建设的公司
  • 侵入别人的网站怎么做制作网站协议书
  • 沈阳网站建设选网龙建立选区快捷键ps
  • 网站推广优化wordpress还是thinkphp
  • 谷歌网站地图怎么做免费的企业网站
  • 医院信息化建设网站通用软件开发
  • 苏州建设厅网站做电影网站多少带宽
  • 做网站有用nodejs微信开发者文档官网
  • 做网站接私活高校门户网站的建设方案
  • 高清的广州网站建设南宁建设网站公司
  • 会用框架做网站能找到工作吗北京企业建站技术
  • 网站商城的公司运营结构上海十大公关公司排名