epub文件格式介绍
文件集成
未加密的epub电子书由以下三部分组成:
1.mimetype
2.META-INF(文件夹,带有文件container.xml)
3.OEBPS(文件夹,包括images文件夹,很多xhtml文件,*。css文件和content.opf文件)
1.文件模拟类型
每本epub电子书都包含一个名为mimtype的文件,内容不变,用来解释epub的文件格式。文件内容是:
2.目录:元信息
META-INF用于存储容器信息。默认情况下,该目录包含一个名为container.xml的文件,其内容如下:
container.xml文件的主要作用是告诉读者电子书根文件的路径和打开格式。一般来说,除非改变根文件的路径和文件名,否则container.xml文件不需要任何修改。除了container.xml文件,OCF还指定了以下文件:
Manifest.xml文件列表
Metadata.xml元数据
Signatures.xml数字签名
Encryption.xml加密
Rights.xml权限管理
这些目录是可选的。
3.目录:OEBPS
OEPBS目录用于存储OPF文件、CSS文件和NCX文件。
OPF档案(★)
OPF文档是epub的核心文件,也是标准的xml文件。根据OPF规范,该文件的根元素是
其内容主要由五部分组成:
1.& lt元数据& gt
元数据信息,是图书的出版信息,由两个子元素组成。
(1)& lt;DC-元数据& gt,其元素构成15核心元素使用dubline core(DC),包括:
(2)& lt;x-metada & gt;
扩展元素。如果某些信息无法在上述元素中描述,请在此元素中展开。
例如:
2.& ltmainfest & gt
File list,列出了书中发布的所有文件,但不包括:mimetype、container.xml、content.opf,由一个子元素组成。
在…之中
Id:文件的id号
Href:文件的相对路径。
媒体类型:文件的媒体类型。
例如:
3.& ltspine toc = " ncx " & gt
书脊,其主要功能是提供书籍的线性阅读顺序。由子元素组成:
在…之中
idref:
也就是说,引用清单中列出的id。
例如:
4.& lt指南& gt
指南,一次列出电子书的具体页面,如封面、目录、前言等。,属性值指向文件存储地址。一般来说,epub电子书可能不会用到这个元素。
例如:
5.& lt旅游& gt
阅读指导,根据不同读者的水平或阅读目的,按照一定的顺序,可以选取电子书中的部分页面,形成阅读指导。一般来说,epub电子书可能不会用到这个元素。
NCX档案(★)
NCX文件是epub电子书的另一个核心文件,用来制作电子书的目录,文件名通常是toc.ncx,ncx文件也是一个xml文件。
ncx
代表“导航中心扩展”,大致意思是导航文件,与目录直接相关。
中最重要的节点。ncx文件是navMap。导航图节点由许多导航点节点组成。navPoint节点由两个子节点navLabel和content组成。
(1)在navpoint节点中,playOrder属性定义了当前项目在目录中的显示顺序。navLabel子节点中的文本节点定义了每个目录的名称。
(2)内容子节点的src属性定义了每个章节对应的文件的具体位置。
NvaPoint节点可以嵌套,即书籍的目录是一个层次目录。
下面是toc.ncx文件的一个例子。