当前位置: 首页 > news >正文

宿迁做网站企业在线查询

宿迁做网站,企业在线查询,什么网站做私人空间好,腾讯企点怎么删除好友实验16#xff1a;网络爬虫 1.实验目标及要求 #xff08;1#xff09;掌握简单爬虫方法。 2. 实验主要内容 爬取中国票房网 ① 爬取中国票房网#xff08;www.cbooo.cn)2019年票房排行榜前20名的电影相关数据 代码部分: import time from selenium.webdriver impor…实验16网络爬虫 1.实验目标及要求 1掌握简单爬虫方法。 2. 实验主要内容 爬取中国票房网 ① 爬取中国票房网www.cbooo.cn)2019年票房排行榜前20名的电影相关数据 代码部分: import time from selenium.webdriver import Edge from selenium.webdriver.common.by import By from selenium.webdriver.support.select import SelectwebEdge() web.get(https://www.endata.com.cn/BoxOffice/BO/Year/index.html) # 定位下拉列表 sel_elweb.find_element(By.XPATH,//*[idOptionDate]) selSelect(sel_el) sel.select_by_value(2019) time.sleep(2) # 输出标头信息 theadweb.find_element(By.XPATH,//*[idTableList]/table/thead/tr) print(thead.text) # 查询前二十个电影 for i in range(1,21):trweb.find_element(By.XPATH,//*[idTableList]/table/tbody/tr[str(i) ])print(tr.text.replace(\n, )) web.close()输出结果 影片名称 类型 总票房(万) 平均票价 场均人次 国家及地区 上映日期 1 哪吒之魔童降世 动画 500,359 36 24 中国 2019-07-26 2 流浪地球 科幻 468,150 45 29 中国 2019-02-05 3 复仇者联盟4终局之战 动作 424,922 49 23 美国 2019-04-24 4 我和我的祖国 剧情 312,366 39 36 中国/中国香港 2019-09-30 5 中国机长 剧情 290,354 38 27 中国 2019-09-30 6 疯狂的外星人 喜剧 221,275 42 30 中国 2019-02-05 7 飞驰人生 喜剧 172,733 42 25 中国 2019-02-05 8 烈火英雄 灾难 170,339 36 19 中国 2019-08-01 9 少年的你 剧情 155,623 36 16 中国 2019-10-25 10 速度与激情特别行动 动作 143,430 36 15 美国 2019-08-23 11 蜘蛛侠英雄远征 动作 141,751 36 17 美国 2019-06-28 12 扫毒2天地对决 剧情 131,143 36 17 中国/中国香港 2019-07-05 13 大黄蜂 动作 114,956 36 11 美国 2019-01-04 14 攀登者 剧情 109,501 37 22 中国 2019-09-30 15 惊奇队长 动作 103,518 37 14 美国 2019-03-08 16 比悲伤更悲伤的故事 爱情 95,792 31 15 中国台湾 2019-03-14 17 哥斯拉2怪兽之王 科幻 93,737 37 15 美国 2019-05-31 18 阿丽塔战斗天使 动作 89,698 38 14 美国/加拿大/阿根廷 2019-02-22 19 银河补习班 剧情 87,772 34 16 中国 2019-07-18 20 误杀 剧情 83,173 34 15 中国 2019-12-13综合爬虫统计数据 ② 请编程实现如下操作从网址http://www.kanunu8.com/book3/6879/上爬取小说《动物农场》的所有章节分析小说《动物农场》按词频输出三个字的词汇前 10 项根据词频画出这10个词汇的直方图并另存为文件“动物农场词频.png”。 代码部分:爬虫部分 import time from selenium.webdriver import Edge from selenium.webdriver.common.by import BywebEdge() web.get(https://www.kanunu8.com/book3/6879/131779.html) textopen(动物农场.txt, a, encodinggbk) # 循环十章 for _ in range(10):# 定位到文章内容pweb.find_element(By.XPATH,/html/body/div/table[5]/tbody/tr/td[2]/p)text.write(p.text.replace(\n,))time.sleep(2)# 点击下一页clickweb.find_element(By.XPATH,/html/body/div/table[7]/tbody/tr/td/table/ tbody/tr/td[3]/strong/a).click()time.sleep(20) 输出结果代码部分:词频分析部分 import jieba import matplotlib.pyplot as pltsopen(动物农场.txt, r, encodingutf-8,errorsignore).read() jieba.load_userdict(动物农场.txt) wordsjieba.lcut(s) # 进行分词操作stopwords_list[] # 创建中文停用词列表 with open(./作业十二/stopword.txt,r,encodingutf-8) as f:for line in f:line line[:-1]stopwords_list.append(line)words_dict{} for word in words:# 长度大于和不在停用词中的词 保存到字典并记录词频if word not in stopwords_list and len(word)!1:words_dict[word]words_dict.get(word,0)1 words_listlist(words_dict.items()) words_list.sort(keylambda x:x[1],reverseTrue) #按词频大小排序 # 分别记录三个字词和词频 three_words[] three_words_num[] num0 for three_word in words_list:if len(three_word[0])3 and num10 and three_word[0]!实际上 and three_word[0]!第一次:three_words.append(three_word[0])three_words_num.append(three_word[1])num1# 画图 plt.bar(three_words,three_words_num) # 写上高度 for i in range(len(three_words)):plt.text(three_words[i],three_words_num[i],three_words_num[i],vabottom, hacenter) plt.rcParams[font.sans-serif] [SimHei] plt.rcParams[axes.unicode_minus]False plt.savefig(动物农场词频.png) plt.show()
http://www.hkea.cn/news/14263627/

相关文章:

  • dz做网站缺点杭州仪器网站制作
  • 设计师a 网站上海公司名字大全
  • 杭州网站建设哪家权威域名邮箱登录入口
  • 网站标题关键优化网站建设要做哪些
  • 沈阳网站营销电话销售网站建设多少钱一个月
  • 淄博网站建设培训wordpress短代码插件TD
  • 重庆实惠网站建设护肤品 网站建设策划书
  • 长沙做网站最好的公司有哪些广告制作方案
  • 长春网站设计团队魔方优化大师官网下载
  • 保定专业网站建设wordpress更改域名修改站内链接
  • 网站建设制作怎么弄崇文网站建设
  • 小鱼在线网站建设媒体门户网站建设方案
  • 有没有帮人做机械设计的网站徐州旅游的网站建设
  • 成都学网站建设费用电子商务电商网站饿建设
  • 如何申请免费域名做网站wordpress上传数据库
  • wordpress做社交网站设计深圳网站制作
  • 网站安全性要求记录开发wordpress主题
  • 旅游网站模板html免费下载网站建设 虚拟化
  • 中国商标网官方查询网站陕西省建设厅便民服务网站
  • 机械网站建设开发做产品表情的网站
  • 网站与app的本质区别昆明网站建设那家好
  • 做网站的费用会计分录wordpress 有点慢
  • 上海网站建设seo公司哪家好电子商务网站网站建设
  • 十堰建设局网站wordpress邮箱发文
  • 建设模板网站报价营销网站报备
  • 用vs2008做网站做网站如何获得阿里巴巴投资
  • 水果网站开发所需的成本舆情分析论文
  • 网站设计与开发想象力做网站
  • 杭州平面设计公司排行合肥seo推广培训
  • 网站建设的过程divider wordpress