推广公司起名,wordpress seo插件中文版,网页设计策划书怎么写,做公司网站怎么做手机版天命#xff1a;只要没反爬#xff0c;一切都简单 这次爬取的是绿盟的威胁情报的PDF
先看一下结构#xff0c;很明显就是一个for循环渲染 burp抓包会发现第二次接口请求 接口请求一次就能获取到了所有的数据
然后一个循环批量下载数据即可#xff0c;其实没啥难度的
imp… 天命只要没反爬一切都简单 这次爬取的是绿盟的威胁情报的PDF
先看一下结构很明显就是一个for循环渲染 burp抓包会发现第二次接口请求 接口请求一次就能获取到了所有的数据
然后一个循环批量下载数据即可其实没啥难度的
import requests,osres requests.get(https://nti.nsfocus.com/api/v2/report/notie/?page1size200orderreported)
data_dict res.json() # 提取json格式
当前相对路径 os.getcwd() # 获取绝对路径每个人电脑不一样所以预算是相对路径
os.mkdir(PDF) # 在当前文件夹下创建一个PDF文件夹# 提取data字段
data data_dict[data]
for 数据 in data:日期 数据[created]日期 日期.split(T)[0]标题 数据[title]文件名 数据[children][0][file_name]url https://nti.nsfocus.com/api/v2/report/pdf/?file 文件名 最终文件名 日期标题文件名response requests.get(url, streamTrue) # 开始下载文件f open(f{当前相对路径}\\PDF\\{最终文件名},wb)for 文件流 in response.iter_content(chunk_size1024): # 应该是提取每一页f.write(文件流) # 把每一页写入PDF中print(文件已下载)