当前位置: 首页 > news >正文

电子商务网站建设 实验分析网站维护运营主要是做什么的

电子商务网站建设 实验分析,网站维护运营主要是做什么的,网站建设公司服务公司,wordpress数据库导出网址链接文章目录一、关于 langid二、基本使用Normalization多个语言中选择一个三、训练模型1、需要2、工具是3、过程4、代码调用自定义模型一、关于 langid https://github.com/saffsd/langid.py 用于检测语言 二、基本使用 import langidlangid.classify(This is a testThis is a test) (en, -54.41310358047485)Normalization 可以使用 0–1 之间的数据来衡量 from langid.langid import LanguageIdentifier, model identifier LanguageIdentifier.from_modelstring(model, norm_probsTrue)identifier.classify(This is a test) # (en, 0.9999999909903544)多个语言中选择一个 上述方式很多时候存在语言不准的情况可以设置默认语言让 langid 来选取 langid.set_languages([de,fr,it])langid.classify(I do not speak english) (it, 0.99999835791478453)def detect():identifier LanguageIdentifier.from_modelstring(model, norm_probsTrue)identifier.set_languages([th, zh, en])arr [I do not speak english,ผู้สื่อข่าวได้รับแจ้งว่ามีประชาชนเ,得亲密。,由泰国当红男星film Rattapoom Toekongsap和泰国超模]for str in arr:print(identifier.classify(str))三、训练模型 1、需要 1、单语文档语料库 2 层深的文件夹层次结构域 – 语言类型 – 文档文件 每个文档应该是一个单独的文件每个文件应该在一个 2 层深的文件夹层次结构中语言嵌套在域中。 ./corpus/domain1/en/File1.txt ./corpus/domainX/en/001-file.xml2、工具是 index.py - 索引语料库。生成文件、语料库、语言对的列表。tokenize.py - 获取索引并标记相应的文件DFfeatureselect.py - 按文档频率选择特征IGweight.py - 计算语言和领域的 IG 权重LDfeatureselect.py - 获取 IG 权重并使用它们来选择一个特征集scanner.py - 基于功能集构建扫描仪NBtrain.py - 使用索引语料库和扫描仪学习 NB 参数 3、过程 1、索引 $ python index.py ./corpus2、标记 python tokenize.py corpus.model3、识别最频繁的标记 通过文档频率识别最频繁的标记 python DFfeatureselect.py corpus.model4、计算每个顶级特征的 IG 权重 以下两个都需要执行 python IGweight.py -d corpus.model python IGweight.py -lb corpus.model5、计算每个令牌的 LD 分数 python LDfeatureselect.py corpus.model这将生成用于构建 NB 模型的 LD 特征的最终列表。 6、组装扫描仪 python scanner.py corpus.model扫描仪是对特征集的编译 DFA可用于计算文档中每个特征在单次遍历文档中出现的次数。此 DFA 是使用 Aho-Corasick 字符串匹配构建的。 7、朴素贝叶斯参数 最后我们学习实际的朴素贝叶斯参数 python NBtrain.py corpus.model4、代码调用自定义模型 1从指定位置加载模型并进行 normalize identifier LanguageIdentifier.from_modelpath(model_path, norm_probsTrue)model 本质是一个长字符串 2从字符串加载模型 from langid.langid import LanguageIdentifier, modelidentifier LanguageIdentifier.from_modelstring(model, norm_probsTrue) 3命令行中使用 # normalize $ python langid.py -n你好呀 (zh, 0.9998446372669386)# normalize custom model $ python langid.py -n -m /Users/xxx/langid.py/langid/train/corpus.model/model 这是美好的开始 (zh, 0.999999927953073) 伊织 2021-09-07
http://www.hkea.cn/news/14562963/

相关文章:

  • 一个网站可以做多少个关键词建设银行网上营业厅
  • 新网站怎么做友情链接广州推广优化
  • 南宁最高端网站建设做门名片设计网站
  • 江苏网站推广公司哪家好做装修的网站
  • wordpress 整站sslseo网站营销推广全...
  • 移动互联和网站开发最大的外包公司有哪些
  • 网站制作建设公司推荐wordpress发布的文章如何不显示
  • 怎样免费建设免费网站seo二级目录
  • 做商业网站去哪里弄好网站怎样优化seo
  • 专业模板网站制作服务郑州建站价格
  • 深圳最好的网站开发公司在那儿能找网站建设
  • 做咩有D网站响网吧上不了改版一个网站多少钱
  • 微网站网站模板建站网站设置高度
  • 做微商怎样加入网站卖东西赚钱宁波怎么建网站模板站
  • 复兴网站制作深圳做网站三网合一
  • 成都网站建设行业分析建设银行网站不能打开
  • 如何保持网站中的图片合肥专业网站制作
  • 桂林市电力建设公司网站门户网站建设的书籍
  • 网站几几年做的怎么查做流量网站吗
  • 网站建设孝感网络整合营销的概念
  • 网站qq在线代码怎么取消网站备案
  • 四川建设厅网上查询网站首页南京制作网页学校
  • 建设厅官方网站企业库淮南做网站
  • 做网站不赚钱了线上推广什么意思
  • 服饰网站建设建设游戏网站
  • visual studio制作网站开发医院网站建设多少钱
  • 做这个网站多少钱软件开发模型有哪些
  • 微商手机网站制作公司wordpress微信机器人下载地址
  • 重庆网站备案在那里如何备份wordpress数据库
  • 建设电子商务网站门户网站建设经济交流材料