PDF实用指南系列(十五):PDF字体管理(一)
以下当笔者说字体其实就是指计算机字体, 字体是所有计算机使用者最常用的东西,
只要开着计算机或打字,计算机就会显示文字,即系计算机使用了一些字体。看似很简单及容易掌握的东西,
其实字体最令出版及输出人员头痛, 根据美国GATF几年前的一个调查,十大电子画稿问题的首位便是字体,
笔者相信它仍然是现今头号输出敌人。笔者花了一定的时间从书本、杂志、互联网、课堂及工作经验等方面学习字体,希望多了解字体技术从而避免或解决字体所产生的输出问题,
但我不是研究人员,
也不想花大多时间单单在这一方面,事实上字体的数据非常丰富,比任何一个印前系统手册或黄页还要厚。现在就和大家分享一点字体知识、问题及在PDF世界里的处理方法。
字体常识
相信很多负责设计、出版和输出人员都知道计算机里常见的字体格式有PostScript及TrueType
字,除此之外也许接触或使用Open Type、Multiple Master 简称MM)、Type 0、Type
1、Type 2、Type 3、Type 4、Type 5、Type 42、CID字等等,究竟它们有什么分别,有什么优点呢?
1 . PostScript 字体 — 笔者未知第一个字体格式是什么,但在PostScript字之前已有个人计算机及输入/
输出设备等使用字体。在1985年Adobe公司推出PostScript页面描述语言,使桌面出版、PostScript字体及PostScript打印设备大放异彩!也使苹果计算机公司的Mac机得到支持及发展,八、九十年代可以在桌面出版一支独秀,当然今天已有很多人用PC机做稿或输出。之前提及的Type
0、Type 1、Type 2、Type 3、Type 4、Type 5字等等(还有Type 32
及其它不能尽录),都属于PostScript字,但它们的组织及用途或目的各自有分别,现在就逐一简说,
如想知道很详细的说明,可以在Adobe 网页或本文末端找到有关字体技术的参考数据。
一般人最常遇到的PostScript字应该是Type 1,其余的例如Type 0、Type 2、Type
3等等则较少接触,为什么会有这个现象?Type 1字是一种很稳妥的格式, 只用了一部份PostScript
指令(subset),但已经可以描述任何形状的平面字体; 而Type 3字则可以使用全部PostScript指令(full
set),所以有人称它是完全PostScript字,它可以描述更复杂的字体设计,例如渐变及花纹等效果,Type
3字常用于花纹字及图案。但由于Type 3
字的结构可以很复杂,字体档案较大,所以输出比较慢,也对旧或甚至新系统产生兼容或输出困难。相反Type
1字比较简单,而且可附带hints信息,无论大小字仍然保持线条优美,但Type
3字没有hints技术,如细字就会出现线条粗糙。Type
0是早期的一种PostScript字体,可以支持有大字表(large character
set)的亚洲文字,后来出现表现更好的CID字体。另外,每个Type
1字是由一对或两个字体文件所组成,就是我们所谓打印字及屏幕字。要分辨窗口系统及苹果系统的Type
1字并不困难,在窗口系统,打印字及屏幕字的延伸名称(extension)分别是PFB( Printer Font
Binary )及PFM(Printer Font Metrics)或AFM(Adobe Font
Metrics)文件,在苹果系统的Type 1字,我们可以凭它的icon 或文件类别来确认,Adobe Type
Manager(ATM 或桌面出版软件同时需要这两个文件才可以打印优质字体, 如只是屏幕显示,那只要屏幕字档就足够。Type
4及5字体不能安装在工作站或个人计算机,分别必须安装到打印机的硬盘及只读记忆(ROM)内,现在已很少人使用Type 4字体。
2. TrueType字体 — 它也是一种很流行字体格式,穿梭于各种计算机系统。有人称它为Type 42,也有人将Type
42归纳为PostScript字的一种,我个人认两个观点都各有道理, 似乎笔者很矛盾?在PostScript
输出环境,当文件有TrueType 字体, 桌面出版软件会用PostScript指令将它包装为Type
42字体,其实内容仍然是TrueType字体,当PostScript打印机或解释器接收之后,其内部的TrueType
Rasterizer便解释TrueType字体。相对来说,Type 1字体比TrueType或Type
42更兼容于PostScript作业环境,尤其多字节较复杂的文字,例如中、日、韩文字,而大部份的英文或罗马文字只须单字节或8-bit
字表便足够安置所有字母、数字及符号,所以很多出版及输出专业人员都偏爱PostScript或Type 1字体。
3. OpenType字体 — TrueType及OpenType都是由Adobe及Microsoft共同合作发展的,前者早在九十年代开始出现,后者在二十世纪出现,是一种较新的字体技术。OpenType包含PostScript
及TrueType字体的技术及优点,主要优点有跨平台,一个字体兼容苹果及窗口系统,而且一个档案包含所有字体数据,不分打印字、屏幕字及其它有关字体的数据,再者它由多字节组成,支持Unicode国际统一编码,一个字体可包含多国文字或多个字体款式,也包括opticals大小字(指不同的point
size)的形态,确保大字及小字同样优美。(早期TrueType是由苹果计算机开发的,后来转让微软公司。)
4. Multiple Master字体 — 简称MM字体,是Type 1
字体的延伸,特点是一个字体内包含两个或多个字体设计,有一个或多个变化轴心,可模仿多个字款,
当缺字款时便可用MM字代替之,但始终不是相同字体, 字形会有分别,而且经常制造输出问题, 不是所有软件或系统支持的。
5. CID字体 — 它是现今最流行的一个多字节字体方案(例如亚洲文字),提供可靠及快速的输出,全名是Character
Identity-keyed Fonts,每个CID字体都有一个独一无二的编号, 由Adobe发给字体开发公司。CID
字体必须安装在RIP伺服机或印前系统内,安装程序有点复杂,通常由字体供货商或系统管理员安装。CID
字体是PostScript Type 1字体的延伸,但也可以是CID-OpenType字体。通常CID-PostScript字体分前端字及后端字互相呼应,前端可以是TrueType字,安装在工作站(PC或Mac机
,而后端字可以是CID-PostSc ript字体,就是必须安装在RIP伺服机或印前系统。
备注:
1. 以上笔者只引述出版及输出最常用的五类字体格式, 并不涵盖所有字体种类。另外,有些TrueType及Type
1字体其实都可以跨平台,关乎字体开发公司是否释放权限。
字体问题案例
1. 案例一 因为RIP伺服机或印前系统与Type
0或Composite字体兼容问题,以往旧系统偶然不能解释包含这些字体的PDF文件(即不能通过RIP或Render动作)。解决办法是将这些字体转为外框图形,或者改用其它字体,又或者用较新的系统去处理。
2. 案例二 虽说PostScript Type 1 字体很可靠,如果用了特殊字符, 当放大或输出时一些标点会消失。如图8,
图中的特殊字符原来由两部份组成, 一部份是真正字体,另一部份其实是外框图形,
并不是字体,因为此部份为白色,当放大后或输出时可能就会失…… 。
3. 案例三
PDF文件没有内嵌字体,当送到RIP伺服机或印前系统解释时会有三种情况,第一个是不能通过系统而取消工作,第二个是通过了系统但用了代替字,
而第三个是通过了及系统选择了正确字体输出。第二种情况因为改变了字款或客户的设计,而且代替字往往会令内容移位,
一般情形都不会接受。
待续:
下期继续PDF字体管理, 将介绍今期未讲完的Acrobat字体管理及一些实用字体处理工具。
参考数据/网页
http://www.adobe.com/type/topics/info9.html#truetype
http://partners.adobe.com/public/developer/opentype/index_font_formats.html
http://partners.adobe.com/public/developer/en/font/T1_SPEC.PDF
http://partners.adobe.com/public/developer/en/font/5174.CID_PS.pdf