epub文件格式介绍

epub电子书本身就是一个ZIP文件。在我们改变后缀之后。epub电子书格式的epub。zip,我们可以通过解压软件(比如winrar、winzip)浏览或者解压。

文件集成

未加密的epub电子书由以下三部分组成:

1.mimetype

2.META-INF(文件夹,带有文件container.xml)

3.OEBPS(文件夹,包括images文件夹,很多xhtml文件,*。css文件和content.opf文件)

1.文件模拟类型

每本epub电子书都包含一个名为mimtype的文件,内容不变,用来解释epub的文件格式。文件内容是:

2.目录:元信息

META-INF用于存储容器信息。默认情况下,该目录包含一个名为container.xml的文件,其内容如下:

container.xml文件的主要作用是告诉读者电子书根文件的路径和打开格式。一般来说,除非改变根文件的路径和文件名,否则container.xml文件不需要任何修改。除了container.xml文件,OCF还指定了以下文件:

Manifest.xml文件列表

Metadata.xml元数据

Signatures.xml数字签名

Encryption.xml加密

Rights.xml权限管理

这些目录是可选的。

3.目录:OEBPS

OEPBS目录用于存储OPF文件、CSS文件和NCX文件。

OPF档案(★)

OPF文档是epub的核心文件,也是标准的xml文件。根据OPF规范,该文件的根元素是

其内容主要由五部分组成:

1.& lt元数据& gt

元数据信息,是图书的出版信息,由两个子元素组成。

(1)& lt;DC-元数据& gt,其元素构成15核心元素使用dubline core(DC),包括:

(2)& lt;x-metada & gt;

扩展元素。如果某些信息无法在上述元素中描述,请在此元素中展开。

例如:

2.& ltmainfest & gt

File list,列出了书中发布的所有文件,但不包括:mimetype、container.xml、content.opf,由一个子元素组成。

在…之中

Id:文件的id号

Href:文件的相对路径。

媒体类型:文件的媒体类型。

例如:

3.& ltspine toc = " ncx " & gt

书脊,其主要功能是提供书籍的线性阅读顺序。由子元素组成:

在…之中

idref:

也就是说,引用清单中列出的id。

例如:

4.& lt指南& gt

指南,一次列出电子书的具体页面,如封面、目录、前言等。,属性值指向文件存储地址。一般来说,epub电子书可能不会用到这个元素。

例如:

5.& lt旅游& gt

阅读指导,根据不同读者的水平或阅读目的,按照一定的顺序,可以选取电子书中的部分页面,形成阅读指导。一般来说,epub电子书可能不会用到这个元素。

NCX档案(★)

NCX文件是epub电子书的另一个核心文件,用来制作电子书的目录,文件名通常是toc.ncx,ncx文件也是一个xml文件。

ncx

代表“导航中心扩展”,大致意思是导航文件,与目录直接相关。

中最重要的节点。ncx文件是navMap。导航图节点由许多导航点节点组成。navPoint节点由两个子节点navLabel和content组成。

(1)在navpoint节点中,playOrder属性定义了当前项目在目录中的显示顺序。navLabel子节点中的文本节点定义了每个目录的名称。

(2)内容子节点的src属性定义了每个章节对应的文件的具体位置。

NvaPoint节点可以嵌套,即书籍的目录是一个层次目录。

下面是toc.ncx文件的一个例子。