浏阳网站建设公司,对门户网站建设情况的报告,wordpress网站建设公司,重庆网站开发公项目中#xff0c;需要获取所有的学校、院系、专业数据#xff0c;目前项目中都是自己添加的#xff0c;只有很小的一部分#xff0c;而且很不全面。正好这次打算重构这块#xff0c;就想着从其他大型平台上看如何获取数据大型网站的对于这种大型数据的获取#xff0c;一…项目中需要获取所有的学校、院系、专业数据目前项目中都是自己添加的只有很小的一部分而且很不全面。正好这次打算重构这块就想着从其他大型平台上看如何获取数据大型网站的对于这种大型数据的获取一般都是通过 ajax 或 js文件 载入。(之前获取智联的行业、职位分类就是这么找的)对于学校想到了大学时的 人人网找了个人设置中的修改学校添加学校里面有选择学校找页面请求定位到了http://s.xnimg.cn/a85690/allunivlist.jsjson解析过程各种费劲各种问题 json数据内容、编码可能有问题导致解析不正确里面可能有特殊字符目前只匹配国内院校即可进行处理$school_json file_get_contents(http://s.xnimg.cn/a85690/allunivlist.js);$school_json strstr($school_json, [);// 这个是表示只匹配第一组即 中国$school_json substr($school_json, 0, (strpos($school_json, }]}) 3));$school_json . ];$school_json str_replace(\t, , $school_json); // 安徽某个院校录入时有人不小心使用了 \t(我找了N久)$school_json preg_replace(/\/, \, $school_json);$school_json preg_replace(/:\/, :, $school_json);$school_json preg_replace(/\}/, }, $school_json);$school_json preg_replace(/(?Pkey\w):/i, $1:, $school_json);$school_array json_decode($school_json, true);注意对于字符、编码这边处理非常不合适我只是死方法、笨方法处理的附同事找的一篇文章正好也是处理的人人网的学校、院系https://www.cnblogs.com/handt/archive/2013/03/11/2954511.html