电子书格式,是对使用电子书时的文件编码方式,文件结构的一种约定,便于区分。如同一把钥匙开一把锁,不同的文件要用不同的方法去读,去显示,去写,去打开或运行。分为PC电子书格式、手机电子书格式和其他电子书格式(这里主要针对kindle用户),PC电子书格式包括EXE、TXT、HTML、HLP、CHM、LIT、PDF、WDL、CEB、ABM等,手机电子书格式包括UMD、JAR等,Kindle电子书格式包括MOBI,TXT,AZW3,PDF,这些电子书格式利用相应的软件工具就可以相互转换,如HTM(HTML)转TXT、PDF转TXT、JAR转TXT等。
电脑格式
EXE不需要安装专门的阅读器,下载后就可以直接打开。单击目录可以直接打开所需的内容,而PDF需要一页一页翻。
TXTTXT它在电脑上是记事本的扩展名,这种现在普遍应该到电子产品中,现在最常见的就是TXT小说,不仅方便的在电脑上打开,还可以下载到的MP3和手机中,现在网上TXT小说网站也很多,比如著名的飘零书社就是专业的TXT格式小说下载网站,可以很方便的下载自己的手机或MP3中,省去很多购买书的费用。
HLP帮助文件格式,在Windows上可直接打开;一般在程序中按F1可以打开。
CHM同HLP文件格式一样,也是帮助文件,但其支持多种视音频格式,让电子书显得更加生动美观。
LIT微软的文件格式,需下载MicrosoftReader软件来阅读。
PDFPDF是ADOBE公司开发的电子读物文件格式,是目前使用最普及的电子书格式,它可以真实地反映出原文档中的格式、字体、版式和图片,并能确保文档打印出来的效果不失真。
WDL这是北京华康公司的文件格式,使用也很普遍。用DynaDoc免费阅读软件即可打开WDL和WDF格式。
CEB此格式是由北大方正公司独立开发的电子书格式,由于在文档转换过程中采用了“高保真”技术,从而可以使CEB格式的电子书最大限度地保持原来的样式。
ABM一种全新的数码出版物格式,这种格式最大的优点就是能把文字内容与图片、音频甚至是视频动画结合为一个有机的整体。在阅读时,能带来视觉、听觉上全方位的享受。
PDG超星公司把书籍经过扫描后存储为PDG数字格式,存放在超星数字图书馆中。如果你要想阅读这些图书,则必须使用超星阅览器(SuperstarReader),把阅览器安装完成后,打开超星阅览器,点击“资源”,我们就可以看到按照不同科目划分的图书分类,展开分类后,每一本具体的书就呈现在我们面前了。
CAJCAJ为中国学术期刊全文数据库英文缩写(ChinaAcademicJournals);CAJ是中国学术期刊全文数据库中文件的一种格式。可以使用CAJ全文浏览器来阅读。CAJ全文浏览器是中国期刊网的专用全文格式阅读器,它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可以在线阅读中国期刊网的原文,也可以阅读下载到本地硬盘的中国期刊网全文。它的打印效果可以达到与原版显示一致的程度。
CAJViewer又称为CAJ浏览器或是叫CAJ阅读器,由同方知网(北京)技术有限公司开发,用于阅读和编辑CNKI系列数据库文献的专用浏览器。CNKI一直以市场需求为导向,每一版本的CAJViewer都是经过长期需求调查,充分吸取市场上各种同类主流产品的优点研究设计而成。CAJViewer自2003年发展至今主要推出5.5、6.0、7.0三个版本。经过几年的发展,它的功能不断完善、性能不断提高,它兼容CNKI格式和PDF格式文档,可不需下载直接在线阅读原文,也可以阅读下载后的CNKI系列文献全文,并且它的打印效果与原版的效果一致,逐渐成为人们查阅学术文献不可或缺的阅读工具。
HTML网页格式,可用网页浏览器直接打开;
EPUBEPUB是可重排版(reflowable直译可回流)的基于XML格式的电子书或其它数字出版物,是数字出版业商业和标准协会InternationalDigitalPublishingForum(IDPF)制定的标准。IDPF于2007年10月正式采用EPUB,随后被主流出版商和设备生产商迅速采用。有各种开放源代码或者商业的阅读软件支持几乎所有的主流操作系统。象SonyPRS之类的e-ink设备或者AppleiPhone之类的小型设备上都能阅读EPUB格式的电子出版物。
手机格式
JARJAR文件格式以流行的ZIP文件格式为基础。与ZIP文件不同的是,JAR文件不仅用于压缩和发布,而且还用于部署和封装库、组件和插件程序,并可被像编译器和JVM这样的工具直接使用。在JAR中包含特殊的文件,如manifests和部署描述符,用来指示工具如何处理特定的JAR。
Kindle电子书格式
这几种电子书格式从本质上来说都是从HTML文档转换而来,大多数HTML标签和CSS样式表的特性它们都支持,它们之间的主要区别在于对排版及新特性的支持与否上,为了更方便清晰的理解,笔者将这几种格式分门别类地为各位小伙伴详细解释一下:
txt小说是指txt文本格式小说,现在一般手机,mp3,mp4等可移动设备上面都能够阅览txt小说。现在支持doc的阅读器价格不菲,如果在doc文件中遇到喜欢的内容,可以复制粘贴到txt文本文档中,这样就可以阅读了。
使用txt格式的原因:由于微软的记事本软件是每个windows系统都具备的,所以txt格式就作为最普遍的格式流传下来,因此现在的移动设备都提供最基本的txt格式支持
txt格式的优势:
1:体积小、存储简单方便
2:txt格式比较简单,
3:txt格式是电脑和很多移动设备的通用格式
txt格式的缺点:
用记事本阅读,不支持标签记录,不可以标记书签.
只能支持纯文字,不支持图像,不够生动.
移动设备支持:
TXT文本格式小说在一些手机中,会出现乱码,无法显示的情况.可按以下操作进行格式转换.
TXT格式有四种编码:ANSI,Unicode,Unicodebigendian,UTFT-8。不知道你的手机支持哪种编码方式。不过各种编码是可以在电脑上很容易的转换的。打开TXT,文件>另存为>编码>选择。这样就另存出了一份,符合要求的编码的TXT文件了。手机自带的电子书阅读器若打开某种txt文本乱码,在电子书设置里也可更换文本编码方式以解决乱码
什么是mobi、azw格式
目前市面上的mobi文件大部分是来自两种途径:epub、pdf或者txt转换成的mobi,从Amazon商店流出来的mobi。前者没什么好说的,后者要么是Amazon官方制作,要么就是自出版作者通过KDP(KindleDirectPublishing,作者可以绕过出版社直接在Amazon上发售电子书)平台发布,通过KDP平台发布时,作者只需要上传Word文档,其他的事情也是Amazon官方来做,从而保证了mobi文件的规范程度。
什么是azw3格式
azw3的本质是KF8,是随着2011年Amazon推出KindleFire平板时一起推出的。它填补了Mobi对于复杂排版支持的缺陷,支持很多HTML5(目前尚不支持HTML5的视频和音频标签)和CSS3的语法,这就大大改善了原来mobi或azw内容排版上的一些缺陷,单纯从读者的角度来讲,是不输epub格式的。目前从Amazon购买的书,大部分已经是azw3格式了,而以前主流的mobi格式则越来越少,它正逐渐取代mobi成为Kindle电子书的主流格式。
什么是epub格式
下面是维基百科对epub的一段定义:
EPUB(ElectronicPublication的缩写,电子出版)是一种电子图书标准,由国际数字出版论坛(IDPF)提出;其中包括3种文件格式标准(文件的附文件名为.epub),这个格式已取代了先前的OpeneBook开放电子书标准。
epub格式对于复杂的排版,图表,公式等元素的兼容性比mobi格式好很多,在脚本,公式,矢量图形的支持方面也强过mobi格式,现阶段epub格式的优势体现在图文混排、图片嵌入字体等,未来可预测的优势是epub格式对于声音,影像等多媒体内容互动的支持上。
epub格式是开放标准,所以在开发工具上也会有更大的选择,像Sigil、Calibre、Jutoh等软件都可以让用户自助制作epub格式电子书,但因为良莠不齐的制作也导致一个问题:大量的epub文件其实是不符合标准,无法保证在所有支持epub的硬件和软件上都可以顺利阅读,这就和iOS系统和Android系统的区别有些相似。
亚马逊为什么不采用开放标准的epub格式呢?
为什么亚马逊不选择epub这种竞争对手(如Google、苹果)和图书馆普遍采用的标准电子书格式呢?亚马逊解释说他们的创新速度很快,采用它们自己的标准格式,能够将创新成果迅速结合到产品中去。例如,Whispersync技术(该技术通过无线接入互联网,将电子书阅读进度信息同步到各种阅读器上)以及字号放大缩小的技术。采用其他格式的电子书阅读器,以后也能把这些功能结合进来。但是,我们在提高产品性能上动作十分迅速。采用自己的格式是非常有利的,因为不用等第三方格式跟进之后再动手。
对于我们普通读者来说,其实只需要知道越新的格式其支持的特性多,更能改善、提升我们的阅读体验就可以了。
各软件间文字的转换
HTM(HTML)转TXT
所需软件:HTML2TXT.exe[2]
说明:启动软件,单击“添加文件”按钮找到需要转换的HTML文件;选择一个输出文件夹,然后单击“开始”按钮即可得到反编译后的HTM文件。
CHM转TXT
所需软件:CHMEncoder
说明:启动软件,单击“打开”按钮,找到需要转换的CHM文件;选择一个输出文件夹,然后单击“开始”按钮,即可得到反编译后的HTM文件。接下来执行上面讲过的HTM(HTML)转TXT的步骤,即可得到TXT文件。
PDF转TXT
所需软件:PDFTextConverter
说明:启动软件后,先在左上方的浏览器窗口内找到PDF文件所在的文件夹,此时左下方的文件列表窗口中会显示出该文件夹中的PDF文件,选中欲转换的文件,单击工具栏上的“添加文件”按钮,即会在右上方的窗口中列出等待转换的文件,添加完成后,单击齿轮形状的“转换”按钮,即可完成转换,转换好的TXT文件保存在源文件所在文件夹内。
JAR转TXT
所需软件:WinRAR
WinRAR
说明:只要你的电脑上安装了WinRAR,即可右击JAR文件,直接将其解压缩。此时你需要做的,就是将这些没有扩展名的文件加上TXT的扩展名并合并。
UMD转TXT
所需软件:XBookMaker
说明:启动软件后,单击左上方的“Openfolder”按钮,定位到包含UMD电子书的文件夹,此时会在左边的的“Files”窗口列出该文件夹内包含的所有UMD格式的电子书,点击一个UMD文件,左下方的“Chapters”窗口中即会显示该电子书中所包含的章节。单击任意一个章节,即可在右边的窗口中看到该章节的内容。现在你只需将其复制并将其粘贴到记事本中,保存为TXT即可。
EXE转TXT
所需软件:miniKillEBook
说明:先打开想要转换的EXE电子书,再启动miniKillEBook,勾选“以文本方式保存”复选框,拖动图中的图标到电子书窗口中,单击“开始”按钮,软件即会自动将电子书“逐页翻过”并将每一页的内容存为TXT文本。
4格式比较
TXT电子书,其实就是未做任何加工的电子文本,是最简单的展现文本,它的编码分为ansi、unicode、unicodebigendian、utf-8,这几种代码电脑中都可以正常浏览,我们电脑中常规用的是ansi编码,但手机就不同了,手机一般默认的是unicode编码,编码不认的情况下会出现乱码,当然随着手机的逐渐发展这种情况会有所改善,简而言之,txt电子书最制作最简单的,将常规编码的电子资料“另存为”的时候将编码改成unicode编码形式的即可。
EXE电子书,众多电子书格式中制作起来算是最复杂的一种,但也是最美观,功能最多的一种,它的过程是先将txt格式的内容文本,按章节分开多个TXT文本,再分别制成一个html的集合(页面插图及电子书封面),最后通过电子书的封装软件,制成一个后缀为.exe的电子书文件。
PDF电子书,一般是用FoxitPDFEditor来制作的,基本分为两种一种是文字版的,另一种更直接将纸质书籍文字全版影印成图片,集合一下便是pdf电子书。
JAR电子书,其实就是将txt电子文本,转码成unicod编码,然后通过手机电子书制作软件,再次将功能实用性提升了一下,基本相当于txt电子书的升级版。
优势劣势
TXT电子书的优势:为体积小,是各种电子书的原始载质。劣势:没有功能,不美观。
EXE电子书的优势:美观漂亮,功能多,可实现章节目录,翻页滚屏,排版整齐,不需要借助任何阅读软件。缺点:体积相对txt大,目前不能在手机上阅览。
PDF电子书的优势:直观,有章节目录,美观度一般,功能一般,比如:ADOBEACROBATPROFESSIONAL软件可以极为方便的添加(标注、文字、图片等)注释。劣势:在所有电子书格式中pdf电子书体积最大,不能在手机阅览(目前在安卓、苹果等智能机通过第三方软件可打开阅览)。
PDF转换器
JAR电子书的优势:功能相对txt而言,加入了书签分节功能。劣势:仅限于在手机上观看,体积比txt格式稍大,不能在电脑中阅览。
EPUB电子书的优势:有章节目录,文字显示大小可选,排版自由,适合比例屏幕阅读。劣势:PC上使用,体积比txt格式稍大,不能添加备注等,不过如果只是阅读且兼顾文件大小的话epub是个不错的选择。
哪种格式的电子书好?
其实任何事物无所谓绝对的好与坏,没有最好,只有更适合,如果你喜欢在电脑中看电子书,不讲究美观的建议你看TXT或PDF格式电子书,如果讲究赏心悦目那选择EXE电子书,如果你只喜欢在手机上观看电子书,建议你选TXT或者JAR,如果想更细致一点,那就选择JAR格式的。如果你是一个电子书发烧友,那仍然建议你选择EXE电子书。以上各种电子书网络都中都不乏见,TXT的更是多如牛毛像起点中文网,红袖添香等都不少,EXE格式的相对较少点例如58L电子书,或者无忧都挺不错的,随着时代的发展,我们的手机将会如电脑一样,或者说,手机与电脑基本相当于小电脑与大电脑的差别,相信到了那时候,所谓的任何形式的电子书的展现将会是一马平川,不存在介质的障碍。
日本电子式格式的发展共识
日本各大图书出版商及数字出版公司日前达成共识,将选用EPUB3.0标准作为电子书出版格式。
EPUB是一种电子图书标准,由国际数字出版论坛(IDPF)提出,是一个自由的开放标准,包括3种文件格式标准(文件的附档名为.epub)。目前EPUB在欧美已被广泛使用,取代了先前的OpeneBook开放电子书标准。