当前位置: 首页 > news >正文

黑龙江恒泰建设集团网站网页版米游社

黑龙江恒泰建设集团网站,网页版米游社,visio画网站开发类图,h5制作软件教程目录 方法一 方法二 需求目的#xff1a;针对模型训练输入#xff0c;按照6:2:2的比例进行训练集、测试集和验证集的划分。当前数据量约10万条。如果针对的是记录条数达上百万的数据集#xff0c;可按照98:1:1的比例进行切分。 方法一#xff1a;切分训练集和测试集针对模型训练输入按照6:2:2的比例进行训练集、测试集和验证集的划分。当前数据量约10万条。如果针对的是记录条数达上百万的数据集可按照98:1:1的比例进行切分。 方法一切分训练集和测试集采用机器学习包sklearn中的train_test_split()函数 方法二切分训练集、测试集以及验证集针对dataframe手动切分 方法一 采用Sklearn包中的sklearn.model_selection.train_test_split()函数该函数功能是将原始数据按照比例切分为训练集和测试集。 函数形式 sklearn.model_selection.train_test_split(*arrays, test_sizeNone, train_sizeNone, random_stateNone, shuffleTrue, stratifyNone)参数解读 *arrays等长的列表、数组或者dataframe等 test_size: 0和1之间默认0.25 train_size: 0和1之间默认1 random_state: 传递一个int值以便在多个函数调用之间产生可复制的输出 shuffle: 拆分前是否进行洗牌 strafity: 是否对数据进行分层返回结果 输入序列的train test分割序列 例子 import numpy as npfrom sklearn.model_selection import train_test_splitX, y np.arange(10).reshape((5, 2)), range(5)X array([[0, 1],[2, 3],[4, 5],[6, 7],[8, 9]])list(y) [0, 1, 2, 3, 4] X_train, X_test, y_train, y_test train_test_split( ... X, y, test_size0.33, random_state42) ...X_train array([[4, 5],[0, 1],[6, 7]])y_train [2, 0, 3]X_test array([[2, 3],[8, 9]])y_test [1, 4] 方法二 手动切分代码如下。输入采用Python的DataFrame同样输出三个文件。如果需要每次都输入同样的切分数据可采用random.seed()定义随机数种子。 def split_train_test_valid():# read fileinput_path E:\\Data\\file flow.csvdf_flow pd.read_csv(input_path file, headerNone, encodinggbk)# define the ratios 6:2:2train_len int(len(df_flow) * 0.6)test_len int(len(df_flow) * 0.2)# split the dataframeidx list(df_flow.index)random.shuffle(idx) # 将index列表打乱df_train df_flow.loc[idx[:train_len]]df_test df_flow.loc[idx[train_len:train_lentest_len]]df_valid df_flow.loc[idx[train_lentest_len:]] # 剩下的就是valid# outputdf_train.to_csv(input_pathtrain.txt, headerFalse, indexFalse, sep\t)df_test.to_csv(input_pathtest.txt, headerFalse, indexFalse, sep\t)df_valid.to_csv(input_pathvalid.txt, headerFalse, indexFalse, sep\t) 参考资料https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
http://www.hkea.cn/news/14364472/

相关文章:

  • 四川省建设厅消防网站网站管理端怎么做
  • 信誉好的扬中网站建设在线图片编辑器软件
  • flash打开网站源码自己公司怎样做免费的网站
  • 福建泉州做淘宝的拿货什么网站网站是怎么制作的
  • 大连投诉网站江苏省工程建设信息网
  • 建站工具有哪些论坛洛阳制作网站的公司哪家好
  • 2018网站建设网站建设哪几家好一些
  • 网站建设与维护 前台做营销型网站的企业
  • 郓城网站建设网址查询服务器地址
  • iis 多网站安全设置wordpress与thinkphp
  • 简易网站模板wordpress首页缓慢
  • 天津市北辰区建设与管理局网站广告投放平台
  • 生鲜电商网站开发网站 html5
  • 工信部网站原来是下载app免费下载app
  • 婚庆网站建设公司400电话网站源码
  • 天元建设集团有限公司建设租赁分公司武夷山网站建设wzjseo
  • 个人网站建设心得体会wordpress 3.3.1漏洞
  • html5做网站心得体会推荐几个响应式网站做参考
  • tp5第二季企业网站开发auth权限认证商城网站开发项目分工
  • 做空间的网站网站显示速度的代码是什么情况
  • 免费招聘网站平台有哪些企业网站开发 语言 收录
  • 广告 网站举例做外贸的阿里巴巴网站是哪个更好
  • div布局在线音乐网站设计社交网站 ui
  • 菏泽网站建设价位不用囤货
  • 如何进行网站推广电商网站项目建设
  • 巴中模板建站价格多少网站建设时如何调用qq微信
  • 福州建设网站设计wordpress如何增加导航
  • 郑州网站模板哪里有建设事业单位网站多少钱
  • 沧州模板建站开源项盿在线制作图片的软件
  • 总工会网站建设方案图片网站模版