当前位置: 首页 > news >正文

广州中国建设银行网站首页企业产品展示网站模板

广州中国建设银行网站首页,企业产品展示网站模板,logo在线制作免费网站,新网站设计最简单的软件1.理论知识 Apriori是一种常用的数据关联规则挖掘方法#xff0c;它可以用来找出数据集中频繁出现的数据集合。该算法第一次实现在大数据集上的可行的关联规则提取#xff0c;其核心思想是通过连接产生候选项及其支持度#xff0c;然后通过剪枝生成频繁项集。 Apriori算法的…1.理论知识 Apriori是一种常用的数据关联规则挖掘方法它可以用来找出数据集中频繁出现的数据集合。该算法第一次实现在大数据集上的可行的关联规则提取其核心思想是通过连接产生候选项及其支持度然后通过剪枝生成频繁项集。 Apriori算法的主要思想是找出存在于事务数据集中最大的频繁项集再利用得到的最大频繁项集与预先设定的最小置信度阈值生成强关联规则。 图1.1关键名词解释 2.算法流程图 3.实现代码 def item(dataset): # 求第一次扫描数据库后的 候选集c1 [] # 存放候选集元素for x in dataset: # 求这个数据库中出现了几个元素然后返回for y in x:if [y] not in c1:c1.append([y])c1.sort()return c1# 计算支持度 def get_frequent_item(dataset, c, min_support):cut_branch {} # 用来存放所有项集的支持度的字典for x in c:for y in dataset:if set(x).issubset(set(y)):cut_branch[tuple(x)] cut_branch.get(tuple(x),0) 1Fk [] # 支持度大于最小支持度的项集 即频繁项集sup_dataK {} # 用来存放所有 频繁 项集的支持度的字典for i in cut_branch:if cut_branch[i] min_support:Fk.append(list(i))sup_dataK[i] cut_branch[i]return Fk, sup_dataK# 计算候选集 def get_candidate(Fk, K): # 求第k次候选集ck [] # 存放产生候选集for i in range(len(Fk)):for j in range(i 1, len(Fk)):L1 list(Fk[i])[:K - 2].sort()L2 list(Fk[j])[:K - 2].sort()if L1 L2:if K 2:new list(set(Fk[i]) ^ set(Fk[j]))else:new set()for x in Fk:if set(new).issubset(set(x)) and list(set(Fk[i]) | set(Fk[j])) not in ck:ck.append(list(set(Fk[i]) | set(Fk[j])))return ck# Apriori算法 def Apriori(dataset, min_support2):c1 item(dataset)f1, sup_1 get_frequent_item(dataset, c1, min_support)F [f1]sup_data sup_1K 2while len(F[K - 2]) 1:ck get_candidate(F[K - 2], K) # 求第k次候选集fk, sup_k get_frequent_item(dataset, ck, min_support)F.append(fk) # 把新产生的候选集假如Fsup_data.update(sup_k) # 字典更新加入新得出的数据K 1return F, sup_data # 返回所有频繁项集 以及存放频繁项集支持度的字典 Apriori算法 定义A 1, B 2, C 3, D 4, E 51 [A C D] 1 3 4 2 [B C E] 2 3 5 3 [A B C E] 1 2 3 5 4 [B E] 2 5min_support 2 # 主函数 if __name__ __main__:# 数据dataset [[1, 3, 4],[2, 3, 5],[1, 2, 3, 5],[2, 5]]# 最小支持度设置为2min_support 2F, sup_data Apriori(dataset, min_support)print(最小支持度为:\n , min_support)print(------------------------------------------------------)print(已知关系:\n , dataset)print(------------------------------------------------------)print(所有的频繁项为:\n {}.format(F))print(------------------------------------------------------)print(对应的支持度为:\n {}.format(sup_data))4.实验结果 测试数据 表1 Apriori算法输入的数据 (最小支持度设置为2) 序号 数据项 替换 1 [A C D] 1 3 4 2 [B C E] 2 3 5 3 [A B C E] 1 2 3 5 4 [B E] 2 5 实验结果与分析 图 1.2 Apriori关联规则算法实验结果 算法优缺点 优点 Aprioi算法采用逐层搜索的迭代方法算法简单易于实现。数据采用水平组织方式采用Apriori 优化方法适合事务数据库的关联规则挖掘。适合稀疏数据集:根据以往的研究,该算法只能适合稀疏数据集的关联规则挖掘也就是频繁项目集的长度稍小的数据集。 缺点 对数据库的扫描次数过多。Apion算法可能产生大量的候选项集。在频繁项目集长度变大的情况下,运算时间显著增加。采用唯一支持度,没有考虑各个属性重要程度的不同。算法的适应面窄。 其他实验我是芒果酱点一个关注吧(σ′▽‵)′▽‵)σ k-Means聚类算法 HNUST【数据分析技术】(2024)-CSDN博客PageRank Web页面分级算法 HNUST【数据分析技术】(2024)-CSDN博客KNN分类算法 HNUST【数据分析技术】(2024)-CSDN博客Apriori关联规则算法 HNUST【数据分析技术】(2024)-CSDN博客
http://www.hkea.cn/news/14319502/

相关文章:

  • 滨州制作网站php网站开发实战
  • 十堰响应式网站建设中建国际建设有限公司网站
  • 安徽省省博物馆网站建设杭州战争网站建设
  • 北京网站建设小鱼在线杭州手机网站建设
  • 石家庄专业做网站公司怎样做网络推广产品
  • 聊城网站制作需要多少钱跟黄聪学WordPress主题开发
  • 政务网站建设需求分析网站建设属于什么科目
  • 2014网站设计惠州seo排名收费
  • 做网站需要域名免费注册个人个人网站
  • 长春火车站需要核酸检测报告吗湖州网站建设服务公司
  • 邯郸网站设计怎么注册男女做爰视频网站
  • 国外网站用什么dns如何粘贴网站统计代码
  • 北京制作网站公司排名著名的营销成功的案例
  • 网站改版 如何改版广西网站建设liluokj
  • 免费建站手机百度app免费下载
  • 网站维护计划网站建设分为哪些方面
  • 建设厅网站关于建筑资质合并高校校园网站建设与运行
  • 淘宝网站打算找人做无锡做百度网站
  • 怎样登入网站后台青岛做网站建设价格低
  • 做网站移动云手机网页版
  • 汕头整站优化菏泽定陶网页设计培训
  • 阿里云申请域名做网站华美天一建筑公司网站
  • 珠海网站关键词排名服务商网页界面设计总结
  • 和镜像网站做友链制作网站需要注意的细节
  • 山东省住房与城乡建设网站网站登录验证码怎么做
  • 当前网站建设的主要方法织梦cms模板
  • 网站模板上传打不开中国建设网app下载
  • 临沂网站备案公司WordPress怎样创建登录页面
  • 在线网站建设wordpress建设购物网站
  • 花瓣网设计网站网站开发中数据库的设计原则