因为项目需要解析文档,而且 doc 文档还不少,全网能找到的靠谱的解析doc甚至是将doc转txt的方案实际上不多。这个是部分文件统计
.Net 和 java 有一个收费的解决方案,但是我确实没钱spire.doc
C#有另外的微软解决方案,例如Microsoft word xxxx 14.0(中间内容忘了),但是这个实在配不起来,java的方案有两个,一个是 org.apache.poi 一个是com.jacob ,我用的就是第二个,原因是我只能找到第二个的代码,我不怎么会java,不是来引战那个库好用的。
正文开始
我的系统是 Windows10,java环境是 jdk 1.8.0_201
一、将jacob-1.18-x64.dll/jacob-1.18-x86.dll到系统盘:\Windows\System32下,内容见压缩包复制 dll
二、开始写代码测试(我用的是 Intellij IDEA)
新建工程(原谅我java不行,新建一个 maven管理的项目)新建项目
然后将 jacob.jar 复制到 src\main\resources\lib 中,并在pom里面添加以下内容
(懒得维护git,代码乱了照图片敲一遍就好)
com.jacob
jacob
1.19
system
${basedir}/src/main/resources/lib/jacob.jar
添加内容
如果你也用 idea 记得在右下角点击 import changes右下角
开始写代码,在 src\main\java\ 中新建一个 Main.java
代码放在码云上
/IBAS0742/shareCode/blob/master/2031_DocToDocx.javamain.java
既然来了就将他改成一个命令行工具,jar以上传,在JavaConvertDocToDocx.zip
一、改主函数main 函数修改
二、配置打包配置 jar 打包
三、打包打包
四、测试(打包前我家里一句将会把xxx转化为xxx,懒得重新截图)测试结果
用到的内容如下:
/b00nee6ad密码:2bvo里面的pconline.zip、JavaConvertDocToDocx.zip
参考文章如下:
//07/09/java实现doc与docx互转/
其实还参考了其他很多项目,但是现在都没法找了,整个历史记录几百条,参考的时候都是怀着试试看能不能成功的心态,所以真心有借鉴到的也没记录下来