我希望将任何格式转换为HTML或从HTML转换.
我想支持DOC,DOCX,PDF,ODT,RDF,DocBook和TXT.
我发现了许多格式到格式的转换实用程序,但为了方便实现,最好使用单个工具.随着供应商或开源项目扩展库,这也将使添加新格式变得更加容易.
理想的"集线器"格式是HTML,但我也可以使用其他集线器格式.
要运行服务器端,最好是Java库,或者C/C++库,COM或命令行工具; 但不是打印机驱动程序,在线服务或GUI工具.商业和开源都没关系.
OpenOffice.org
从这个链接:
OpenOffice.org不太出名的功能之一是它作为服务运行的能力.你可以将这种能力用于一些巧妙的用途.例如,您可以将OpenOffice.og转换为转换引擎,并使用它通过基于Web的界面或命令行工具将文档从一种格式转换为另一种格式.JODConverter可以帮助您释放OpenOffice.org的文件转换功能.
这听起来像你正在寻找的.这一切都在Java中.
这个链接告诉你更多关于上面提到的JODConverter.