深圳最火的网站,网站开发域名注册,江门seo外包服务,吉林华商建设集团网站由来
这是一个从开发需求中诞生的工具#xff0c;在工作中因为有一个 excel 转 html 的任务#xff0c;又没找到一个专门做这方面的工具#xff08;其他工具几乎都是简单的转换#xff0c;无法还原 excel 样式#xff0c;而且转换的宽高有点儿差距#xff09;#xff0…由来
这是一个从开发需求中诞生的工具在工作中因为有一个 excel 转 html 的任务又没找到一个专门做这方面的工具其他工具几乎都是简单的转换无法还原 excel 样式而且转换的宽高有点儿差距所以干脆自己动手写了一个。几乎能够还原 excel 样式且宽高几乎一致。
用法
需要注意的是仅支持 xlsx 格式且默认 dpi 是 96因为不同屏幕的 dpi 可能不太一样大多数是 96所以尽量前端传过来前端获取屏幕 DPI 参考https://blog.csdn.net/jl15988/article/details/144737210
引入依赖
dependencygroupIdcom.jl15988.excel2html/groupIdartifactIdexcel2html/artifactIdversion0.0.1/version
/dependency使用 ListHtmlPage htmlPages new Excel2Html(new File(respVO.getTempPath())).setDpi(dpi).setCellHandler(new ICellHandler() {Overridepublic void handleStyle(ParserdStyleResult parserdStyleResult, Cell cell, int rowIndex, int cellIndex) {// 去掉第一行单元格顶部边框if (rowIndex 4) {parserdStyleResult.cellStyle.remove(border-top);}}}).buildHtmlWithSheetIndex(4, null, 4, 46, 0, 29);
ListString wbContent htmlPages.stream().map(htmlPage - htmlPage.setHasHtmlContainer(false).toHtmlString()).collect(Collectors.toList());支持自定义单元格处理器setCellHandler单元格内容格式化处理setCellValueFormater
还有其他构建 html 方法
buildHtml(Sheet sheet, Integer startRowIndex, Integer endRowIndex, Integer startColIndex, Integer endColIndex)buildHtmlWithSheetIndex(int sheetIndex, Integer startRowIndex, Integer endRowIndex, Integer startColIndex, Integer endColIndex)buildHtmlWithSheetIndex(Integer startSheetIndex, Integer endSheetIndex, Integer startRowIndex, Integer endRowIndex, Integer startColIndex, Integer endColIndex)buildHtml(Sheet sheet)buildHtmlWithSheetIndex(int sheetIndex)buildHtmlWithSheetIndex(Integer startSheetIndex, Integer endSheetIndex)
难点均实现
难点是实现的时候比较难不代表没有实现。因为使用的是 apache.poi 依赖读取 excel该依赖仍有某些不足成为转 html 难点。
读取 excel 图片。excel 中图片有两种第一种是浮动式第二种是嵌入式浮动式还好说 poi 能读取到但是嵌入式只能自己解析 excel 内容然后找到对应图片。excel 其实是一个压缩包将其解压读取 xml 配置即可渲染图片位置。因为获取到的浮动式图片位置为 emu 单位且是所在单元格坐标的信息单位转换和坐标计算有所难点列宽。poi 读取到的列宽不准确poi 中默认列宽写死了一个 8字符宽度这个 8 只是大概值准确值需要自己计算而且 poi 像素值都是乘了一个写死的 7.001699924468994字符像素大小这个值也是不准确的这个值应该是 excel 默认字体的像素大小一般国内都是默认宋体像素大小为 8差距也有点儿大这个需要建立映射表通过脚本将系统所有字体像素大小放到映射中使用的时候再读取富文本解析。富文本是指在同一个单元格使用不同的字体样式。这个需要对单元格内容单独解析构造 html 样式这个难点不算太大空白字符处理。在 excel 中连续空白字符是保留的html 默认只显示一个需要单独写样式这个比较简单如果单元格内容尾部含有空白字符且自动换行空白字符是不占用空间的目前看是这样这个需要单独判断。