当前位置:  开发笔记 > 后端 > 正文

如何用ruby解析word文档?

如何解决《如何用ruby解析word文档?》经验,为你挑选了1个好方法。

有没有人知道我可以在OS X/Linux上使用的库来解析Word文件并将内容输出为HTML?

我已经看过win32ole,但据我所知它只适用于Windows,虽然我可能错了.

有什么建议?



1> Chris Lloyd..:

Word文档格式(暂时忽略docx)非常糟糕且不断变化.恕我直言,这就是为什么有那么少的(读:零)Ruby库来解析它们.

我建议做的是使用JRuby和一些已建立的Java库来读取doc格式.谷歌应该帮助你:http://schmidt.devlib.org/java/libraries-word.html.

有一个用于读取MIcrosoft文件格式的Java项目,POI(http://poi.apache.org/),他们确实有Ruby绑定(http://poi.apache.org/poi-ruby.html),但我我不确定那些是最新的.在他们的网站上,它说Ruby绑定是针对1.8.2 ......

推荐阅读
手机用户2502852037
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有