作为一个自学成才的python爱好者,我将如何学习使用标准格式导入和导出二进制文件?
我想实现一个脚本,它采用ePub电子书(XHTML + CSS压缩)并将其转换为mobipocket(Palmdoc)格式,以便让亚马逊Kindle读取它(作为一个更大的项目的一部分,我'我正在努力).
已经有一个很棒的开源项目来管理电子书库:Calibre.我想尝试将其作为一种学习/自学练习来实现.我开始查看他们的python源代码并意识到我不知道发生了什么.当然,在任何事情上自学成才的重大危险就是不知道你不知道什么.
在这种情况下,我知道我不太了解这些二进制文件以及如何在python代码中使用它们(struct?).但是我想我可能一般都缺少很多关于二进制文件的知识,我想帮助理解如何使用它们. 以下是 mobi/palmdoc标题的详细概述.谢谢!
编辑:没问题,好点!您是否有任何关于如何获得使用二进制文件的基本知识的提示?特定于Python会有所帮助,但其他方法也可能有用.
TOM:编辑为问题,添加了介绍/更好的标题
您应该从结构模块开始,正如您在问题中指出的那样,当然,将文件作为二进制文件打开.
基本上你只是从文件的开头开始,然后一块一块地将它分开.这是一个麻烦,但不是一个大问题.如果文件被压缩或加密,事情会变得更加困难.如果您从一个知道其内容的文件开始,这将是有帮助的,所以您不会一直猜测.
尝试一下,也许你会发展出更具体的问题.