当前位置: 首页 > news >正文

宿州网站推广朔州市住房与城乡建设厅网站

宿州网站推广,朔州市住房与城乡建设厅网站,免费网站大全下载,在线制作条形码免费生成器文章目录 赛题思路一、简介 -- 关于异常检测异常检测监督学习 二、异常检测算法2. 箱线图分析3. 基于距离/密度4. 基于划分思想 赛题思路 #xff08;赛题出来以后第一时间在CSDN分享#xff09; https://blog.csdn.net/dc_sinor?typeblog 一、简介 – 关于异常检测 异常… 文章目录 赛题思路一、简介 -- 关于异常检测异常检测监督学习 二、异常检测算法2. 箱线图分析3. 基于距离/密度4. 基于划分思想 赛题思路 赛题出来以后第一时间在CSDN分享 https://blog.csdn.net/dc_sinor?typeblog 一、简介 – 关于异常检测 异常检测outlier detection在以下场景 数据预处理病毒木马检测工业制造产品检测网络流量检测 等等有着重要的作用。由于在以上场景中异常的数据量都是很少的一部分因此诸如SVM、逻辑回归等分类算法都不适用因为 监督学习算法适用于有大量的正向样本也有大量的负向样本有足够的样本让算法去学习其特征且未来新出现的样本与训练样本分布一致。 以下是异常检测和监督学习相关算法的适用范围 异常检测 信用卡诈骗制造业产品异常检数据中心机器异常检入侵检测 监督学习 垃圾邮件识别新闻分类 二、异常检测算法 import tushare from matplotlib import pyplot as pltdf tushare.get_hist_data(600680) v df[-90: ].volume v.plot(kde) plt.show()近三个月成交量大于200000就可以认为发生了异常天量嗯要注意风险了…… 2. 箱线图分析 import tushare from matplotlib import pyplot as pltdf tushare.get_hist_data(600680) v df[-90: ].volume v.plot(kde) plt.show()大体可以知道该股票在成交量少于20000或者成交量大于80000就应该提高警惕啦 3. 基于距离/密度 典型的算法是“局部异常因子算法-Local Outlier Factor”该算法通过引入“k-distance第k距离”、“k-distance neighborhood第k距离邻域”、“reach-distance可达距离”、以及“local reachability density局部可达密度 ”和“local outlier factor局部离群因子”来发现异常点。 用视觉直观的感受一下如图2对于C1集合的点整体间距密度分散情况较为均匀一致可以认为是同一簇对于C2集合的点同样可认为是一簇。o1、o2点相对孤立可以认为是异常点或离散点。现在的问题是如何实现算法的通用性可以满足C1和C2这种密度分散情况迥异的集合的异常点识别。LOF可以实现我们的目标。 4. 基于划分思想 典型的算法是 “孤立森林Isolation Forest”其思想是 假设我们用一个随机超平面来切割split数据空间data space, 切一次可以生成两个子空间想象拿刀切蛋糕一分为二。之后我们再继续用一个随机超平面来切割每个子空间循环下去直到每子空间里面只有一个数据点为止。直观上来讲我们可以发现那些密度很高的簇是可以被切很多次才会停止切割但是那些密度很低的点很容易很早的就停到一个子空间了。 这个的算法流程即是使用超平面分割子空间然后建立类似的二叉树的过程 import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import IsolationForestrng np.random.RandomState(42)# Generate train data X 0.3 * rng.randn(100, 2) X_train np.r_[X 1, X - 3, X - 5, X 6] # Generate some regular novel observations X 0.3 * rng.randn(20, 2) X_test np.r_[X 1, X - 3, X - 5, X 6] # Generate some abnormal novel observations X_outliers rng.uniform(low-8, high8, size(20, 2))# fit the model clf IsolationForest(max_samples100*2, random_staterng) clf.fit(X_train) y_pred_train clf.predict(X_train) y_pred_test clf.predict(X_test) y_pred_outliers clf.predict(X_outliers)# plot the line, the samples, and the nearest vectors to the plane xx, yy np.meshgrid(np.linspace(-8, 8, 50), np.linspace(-8, 8, 50)) Z clf.decision_function(np.c_[xx.ravel(), yy.ravel()]) Z Z.reshape(xx.shape)plt.title(IsolationForest) plt.contourf(xx, yy, Z, cmapplt.cm.Blues_r)b1 plt.scatter(X_train[:, 0], X_train[:, 1], cwhite) b2 plt.scatter(X_test[:, 0], X_test[:, 1], cgreen) c plt.scatter(X_outliers[:, 0], X_outliers[:, 1], cred) plt.axis(tight) plt.xlim((-8, 8)) plt.ylim((-8, 8)) plt.legend([b1, b2, c],[training observations,new regular observations, new abnormal observations],locupper left) plt.show()
http://www.hkea.cn/news/14524534/

相关文章:

  • 沈阳沈河区网站建设页面设计比例
  • vue做pc网站怎么做娱乐网站
  • 南沙网站建设价格用flask做的网站有哪些
  • 哪家网络公司做网站好php网站开发需要学什么软件
  • 百度网站大全企业邮箱哪个比较好用
  • 国内优秀的网站设计越众做的绿色建筑的网站
  • 深圳微交易网站开发江苏专业做网站的公司
  • 网站视频下载wordpress 菜单 插件
  • 网站中的表单怎么做企业公司网站制作
  • 网站后台编辑框无法显示网站直播间怎么做
  • 江苏省建设厅网站官网辽宁省住房和城乡建设厅网站上不去
  • 淘宝电商网站怎么做的php做网站要多久
  • 网站建设合同标准范本建设局是干嘛的单位
  • 网站建设预付款如何付网站开发会什么软件
  • 箱包东莞网站建设软件项目设计方案
  • 网站做招聘需要什么资质布吉做棋牌网站建设哪家技术好
  • 中国建设银行网站的主要功能中企动力是国企还是私企
  • 黄山风景区门票价格成都网站建设优化公司电话
  • 如何设公司产品购物网站快云助手网站建设视频
  • 潍坊市建设工程质量安全监督站网站WordPress模仿腾讯
  • 电子商务网站建设维护实训报告网络营销工程师
  • 淘宝网站用什么语言做的怎么用微信做网站
  • 中国建设银行网站对公账户首页内蒙古企业网站制作
  • 网站建设完成之后要索取哪些如何做公司网站优化
  • 免费的求职简历模板网站做资讯网站需要哪些资质
  • 徐州网站建设商城制作网站推广seowordpress页脚居中
  • 网站有域名没备案王者荣耀是哪家公司开发的
  • 电子拜年贺卡在线制作网站韩城建设局网站
  • 做兼职网站装修设计师一般多少钱
  • 太原市做网站公司做的网站用户密码在哪里找