当前位置: 首页 > news >正文

为什么 要建设网站做非洲国际贸易网站

为什么 要建设网站,做非洲国际贸易网站,wordpress进入后台超时,wordpress实现图片幻灯展示效果这篇博客将详细说明如何从 Java 应用程序调用一个 Python 脚本#xff0c;并在此过程中传递参数给一个 Scrapy 爬虫。最终目标是让 Java 控制爬虫的行为#xff0c;如爬取数量和特定的运行参数。 一、Scrapy 爬虫的修改 首先#xff0c;我们需要确保 Scrapy 爬虫能接收从命…这篇博客将详细说明如何从 Java 应用程序调用一个 Python 脚本并在此过程中传递参数给一个 Scrapy 爬虫。最终目标是让 Java 控制爬虫的行为如爬取数量和特定的运行参数。 一、Scrapy 爬虫的修改 首先我们需要确保 Scrapy 爬虫能接收从命令行传递的参数。这涉及到修改 Scrapy 的启动文件和爬虫文件。 创建 Python 启动脚本 run.py 这个脚本负责解析从 Java 传来的命令行参数并将其传递给 Scrapy 爬虫。 # run.py import sys from scrapy import cmdlineif __name__ __main__:# 接受从外部传入的参数# spider_name sys.argv[1] # 爬虫名称# token sys.argv[2] # 接受令牌# num sys.argv[3] # 接受数字参数# map_json sys.argv[4] # 接受JSON格式的字典# 测试数据spider_name pictoken 123num 100map_json {a: 1, b: 2}# 构建 Scrapy 命令command [scrapy, crawl, spider_name,-a, ftoken{token},-a, fnum{num},-a, fmap{map_json}]cmdline.execute(command)修改 Scrapy 爬虫以使用这些参数 # pic_spider.py import scrapy import jsonclass PicSpider(scrapy.Spider):彼岸图网站图片爬虫https://pic.netbian.com/name pic# allowed_domains [netbian.com]start_urls [https://pic.netbian.com//]def __init__(self, tokenNone, numNone, java_mapNone, *args, **kwargs):super(PicSpider, self).__init__(*args, **kwargs)self.token tokenself.num int(num) if num else 100 # 接收数字并提供默认值self.map json.loads(java_map) if java_map else {} # 正确的条件检查def parse(self, resp, **kwargs):print(resp.text)二、Java 端的实现 在 Java 端需要构建一个命令行字符串并使用 Runtime.exec() 来调用 Python 脚本。 import java.io.BufferedReader; import java.io.InputStreamReader; import java.util.HashMap; import java.util.Map;public class RunScrapyFromJava {public static void main(String[] args) {try {String pythonScriptPath path/to/run.py;String spiderName pic;String token some_token;int num 100;MapString, Object map new HashMap();map.put(key1, value1);map.put(key2, value2);String jsonMap new Gson().toJson(map);if (jsonMap.isEmpty()) {jsonMap {}; // 确保总是传递一个 JSON 字符串}// 构建命令String command String.format(python %s %s %s %d %s,pythonScriptPath, spiderName, token, num, jsonMap);Process p Runtime.getRuntime().exec(command);p.waitFor();BufferedReader reader new BufferedReader(new InputStreamReader(p.getInputStream()));String line;while ((line reader.readLine()) ! null) {System.out.println(line);}} catch (Exception e) {e.printStackTrace();}} }总结 这个过程实现了从 Java 端通过 Python 启动脚本向 Scrapy 爬虫动态传递参数使得爬虫行为可以根据外部输入进行调整。此方法适用于需要从 Java 控制 Python 爬虫的场景如企业应用中的数据采集任务。
http://www.hkea.cn/news/14585226/

相关文章:

  • 海南高端网站建设定制书籍扉页页面设计模板
  • 网站开发公司代理常熟网站制作设计
  • 成都建设网站标化最新表格做引流推广的平台
  • 网站开发留言板昆明网站建设哪家公司好
  • dw个人网站设计现在由哪些网站可以做外链
  • 国内网站欣赏网站建设时间怎么查询
  • 开网站供免费下载企业网站建设协议
  • 自己给自己网站做seo长宁区网站建设公司
  • 唐山建网站网站版块设计
  • 上海做网站的小公司上海网站建设公司站霸网络
  • 做网站高手加盟网站制作费用
  • 移动 网站 素材十大ui培训机构
  • 海淀网站建设公司电话vs网站开发入门
  • 由一个网页建成的网站企业内部培训app软件
  • 自己做网站需要购买服务器吗短链接生成器免费下载
  • 上海微信网站公司哪家好wordpress文章阅读数更改
  • 优秀响应式网站本溪网站建设公司
  • 网站经营许可备案号深圳罗湖企业网站建设报价
  • h5 技术做健康类网站网站设计师是什么部门
  • 教育网站开发需求说明书湘潭做网站选择磐石网络
  • 摄影个人网站模板网站导航是怎么做的
  • 免费建立网站的网站都有啥网站宣传方式有哪些
  • 个人网站能允许做哪些网站过期就可以抢注
  • 零基础怎么做网站合肥做百度网站
  • 旅游网站模板大全wordpress百家主题
  • 网站互动方式wordpress分表
  • 做搞笑app好还是做电影网站好怎样做网站导航界面
  • 莱芜网站建设自助建站优化做一款小程序需要多少钱
  • 网站正能量下载直接进入主页可以吗安全吗h5怎么制作进入下一页
  • 贸易网站建设公司网站换空间 site