一个网站3个相似域名,查关键词排名,秦洁婷seo博客,青岛建设集团介绍
最近工作上需要对word,excel,ppt,pdf等各类型文档密码检测#xff0c;对文件进行分类#xff0c;有密码的和没密码的做区分。查了一堆资料和GPT都不是很满意#xff0c;最后东拼西凑搞了个相对全面的检测工具代码类#xff0c;希望能给需要的人带来帮助。
说明
这段…介绍
最近工作上需要对word,excel,ppt,pdf等各类型文档密码检测对文件进行分类有密码的和没密码的做区分。查了一堆资料和GPT都不是很满意最后东拼西凑搞了个相对全面的检测工具代码类希望能给需要的人带来帮助。
说明
这段代码提供了一个全面的工具类用于检测多种办公文档.xls, .xlsx, .doc, .docx, .pdf, .ppt, .pptx是否设置了密码保护。以下是该实现的核心逻辑和要点 1、通用检测入口通过isFileProtected(File file, String fileExtension)方法根据文件扩展名调用特定的检测方法。 2、Excel文件检测(isExcelProtected(File file)): 使用WorkbookFactory.create()尝试打开文件如果文件加密会抛出EncryptedDocumentException异常。 3、Word文件检测(isWordProtected(File file)): 利用WordExtractor尝试读取文件内容当文件加密时会抛出EncryptedDocumentException异常或者从异常信息中判断文件是否加密。 4、PDF文件检测(isPdfProtected(File file)): 使用PDFBox库的Loader.loadPDF()加载文件然后检查PDDocument实例的isEncrypted()状态或捕获InvalidPasswordException来判断是否加密。 5、PPT文件检测(isPptProtected(File file)): 对于.ppt文件使用HSLFSlideShow尝试读取通过捕获异常并检查消息中是否包含“encrypted”关键字来判断文件是否加密。注意对于.pptx文件理论上应该使用与.xlsx类似的处理方式但示例中未单独区分。 6、资源管理使用try-with-resources语句确保文件输入流和各种文档对象在操作完成后能被正确关闭同时利用自定义的IoUtil.close()方法进一步确保资源的释放假设这是您项目中的一个辅助方法。 7、日志记录在捕获异常时记录错误日志有助于追踪问题。
实现步骤
添加依赖
poi-4.1.2hu-toolpdfbox
dependencygroupIdcn.hutool/groupIdartifactIdhutool-all/artifactIdversion5.8.21/version/dependencydependencygroupIdorg.apache.poi/groupIdartifactIdpoi-scratchpad/artifactIdversion4.1.2/version/dependencydependencygroupIdorg.apache.poi/groupIdartifactIdpoi/artifactIdversion4.1.2/version/dependencydependencygroupIdorg.apache.poi/groupIdartifactIdpoi-ooxml/artifactIdversion4.1.2/version/dependencydependency!-- jsoup HTML parser library https://jsoup.org/ --groupIdorg.jsoup/groupIdartifactIdjsoup/artifactIdversion1.17.2/version/dependencydependencygroupIdorg.apache.pdfbox/groupIdartifactIdpdfbox/artifactIdversion3.0.2/version/dependency工具类
public class TestFileEncrypt {private static final Logger log LoggerFactory.getLogger(TestFileEncrypt.class);public static void main(String[] args) {String filePath d:/tmp/enc/data0.xls; // 替换为你要检查的文件路径boolean isLikelyEncrypted isExcelProtected(FileUtil.newFile(filePath));System.out.println(文件是否加密的: isLikelyEncrypted);}// 创建通用方法根据文件后缀名识别文件类型调用不同的方法进行检测public static boolean isFileProtected(File file, String fileExtension) {switch (fileExtension.toLowerCase()) {case xls:case xlsx:return isExcelProtected(file);case doc:case docx:return isWordProtected(file);case pdf:return isPdfProtected(file);case ppt:case pptx:return isPptProtected(file);default:return false;}}// 检查XLSX文件是否受密码保护public static boolean isExcelProtected(File file) {boolean isProtected false;Workbook sheets null;try (FileInputStream fis new FileInputStream(file)) {sheets WorkbookFactory.create(fis);// 尝试打开XLSX文件sheets.close();} catch (EncryptedDocumentException e) {isProtected true; // 抛出异常表示文件受密码保护} catch (IOException e) {log.error(读取Excel文件失败{},{},file.getName(),e.getMessage());} finally {if (sheets ! null) {IoUtil.close(sheets);}return isProtected;}}public static boolean isWordProtected(File file) {boolean isProtected false;WordExtractor extractor null;try (FileInputStream fis new FileInputStream(file)) {// 创建WordExtractor以读取内容这一步可能会在文件受保护时失败extractor new WordExtractor(fis);extractor.close(); // 关闭提取器} catch (EncryptedDocumentException e){isProtected true;} catch (IOException e) {if(e.getMessage().indexOf(EncryptedPackage) ! -1){isProtected true;}else{log.error(读取Word文件失败{},{},file.getName(),e.getMessage());}} finally {if(extractor!null){IoUtil.close(extractor);}return isProtected;}}// 检查PDF文件是否受密码保护public static boolean isPdfProtected(File file) {boolean isEncrypted false;try (PDDocument document Loader.loadPDF(file)) {if (document.isEncrypted()) {isEncrypted true;}} catch (InvalidPasswordException e) {isEncrypted true;} catch (IOException e) {log.error(读取pdf文件失败{},{},file.getName(),e.getMessage());}finally {return isEncrypted;}}public static boolean isPptProtected(File file) {boolean isProtected false;HSLFSlideShow pptnull;try (FileInputStream fis new FileInputStream(file)) {ppt new HSLFSlideShow(fis);ppt.getPageSize();ppt.close();} catch (Exception e){if(e.getMessage().toLowerCase().indexOf(encrypted)!-1){isProtected true;}} finally {if(ppt!null){IoUtil.close(ppt);}return isProtected;}}}