印刷新闻 印刷技术 印刷展会 印刷词典 院校社团 印刷企业 印刷杂志 电子书库

PDF档案格式中文嵌入现况与问题探讨——台湾学生论文(6.1)

台湾中国文化大学印刷传播学系 林威宇 更新日期:2003-05-23


摘要

在目前的状况来说,英文PDF档案格式在网路上、与文件交换的应用上已经可以说非常成熟了,但是中文方面的应用还比其他亚洲国家存在着更多的问题,以致於其应用的范围无法普及。本文的主旨在於探讨PDF档案格式的组成、制作以及制作後的档案特性,是以一种测试及探讨的方式来制作的。 

 


壹、前言

由Adobe公司所开发的PDF档案格式,打着”跨文字、跨语言、跨平台、跨媒体、跨软体、跨世纪的电子文件交换格式”,以及”这就是未来”的口号出现在我们眼前,这样的一种文件,它到底有何特别之处,有什麽能耐呢? 

 


贰、何谓PDF档案

所谓「PDF可携式文件格式」是一种开放式电子文件格式(符合美国Adobe公司Acrobat 之PDF标准),不论使用何种电脑平台或应用软体编辑的文件,几乎都可转换成「PDF」格式互通使用。除了在萤幕上浏览与印刷效果(文字、图型、影像)完全相同的式样外,更提供多种注记工具让使用者更有效率地阅读文件。 通常我们会把Acrobat及PDF看作是同一件事,PDF是「Portable Document Format」的缩写,它主要目的就是要在各种不同的电脑平台上创造出一个共通的文件格式。换句话说,就是希望不管在那一种电脑上制作的文件,只要能转成PDF格式,拿到另一种电脑上就能毫无困难地打开阅读,更能维持制作当时的格式与版面,看起来跟原来的格式一模一样。 这个问题是在不同电脑平台之间长期以来所存在的,常常在PC上制作的文件拿到MAC上,如果没有对等的软体或版本,即使有同样的软体,版本不同或中、英文版不同可能都没办法互相打开对方的档案,因而造成相当大的不便。如PDF格式的出现,就能使一个文件在不同平台上畅行无阻,而且看到的样子都一样,在也不用再花力气把档案格式转来转去。

 

叁、PDF档案格式介绍

Portable Document Format可携带文件格式是将难以处理的PostScript码精化成一个页面与物件的资料库。它包含字型、影像及经压缩的向量物件,它是高度精简的文件格式。正如其名-可携带文件格式-它为统一可预测的高品质输出及可转用於多媒体用途作最佳化处理。PDF具有设备及媒介独立的特性,它支援CMYK、特殊色及合并的色域定义。PDF是一个支援补漏白、拼大版及可转换之页面取向的档案,一般人可以利用免费的Acrobat Reader软体在麦金塔电脑、视窗环境、Unix及网际网路浏览器浏览。

制作PDF的程序有许多种,可以制作出许多不同性质及不同用途的PDF档。例如其中一种方法叫做”蒸馏”,利用Adobe Acrobat Distiller软体,可以将PostScript档案转换成PDF档案;另外也可以利用一种可选择周边设备的工具叫Adobe PDF Writer,利用它可自动将文件储在成PostScript档案,再自动转换成PDF档案,或者利用程序巨集或其他自动功能也可以将单独或多个PostScript档案转换成PDF档案。在以往的印前工作流程里客户若需作最後一刻修改,则需回原编辑应用程式修改,再重新列印一次,而在PDF工作流程中,只需使用Acrobat 直接修改PDF档,无需再重回原编辑应用程式修改列印。


一、PDF档案组成 

1.第一层包含文件的文字与图像。

2.第二层包含增效部份,例如书签,超文字连结、导览等。

3.第叁层包含档案的基本资讯,例如字形资讯和交换参考表。 


二、PDF档案格式的特点 

PDF为PostScript纯化过後的档案,它已经去除了PostScript在解译时所可能发生的不确定性,所以成功的转换成PDF档後,也就确保在後续的工作流程中能顺利的进行。您可以将任何应用软体产生的页面转换成PDF档案,完整的将原文件之文字、图形、影像、声音及链结嵌入PDF档案之中,让你可以在最後一刻做编辑修改而无须重回应用程式修改列印。在转换时可以选择将文字包入PDF文件之中,即使一个中文PDF档案亦可在无安装中文字型的纯英文系统中正确的开启列印,真正的达到档案交换网路无国界。PDF亦可转换成内含字型的EPS档案,而转换成的EPS档案可以再组版或其他软体汇入再使用。

(一)高压缩

PDF档案使用多种方法来达到缩减原PostScript文件的目的,在图片压缩的部分亦可支援述种格式压缩,一般档案通常可以压缩至原来的数十到数百分之一。尤其当使用者要在网路上发行电子文件时,为了速度的考虑,高压缩比就显得特别重要。

1.JPEG: Joint Photographic Expert Group专业摄影联合组织,所推广的是一种减损性的静态影像压缩演算,为一种破坏性的压缩方法来压缩影像品质,其应用范围对於彩色的连续调图片较为适合。 

2.Zip 是用Jean-loup Gailly Mark Adler的Zlib套装软体的延伸开发而成,压缩方式是适台有花纹、底纹或大片重复影像图档。Acrobat 1.0分别提供了4bit及8bit的不同压缩比的演算,具取样方法是以重复的资料为主。 

3.CCITT Group1.CCITT Group4 是国际电话电信组织(International Coordinating Committee for Telephony & Telegraphy)所订定的压缩标准,用来压缩黑白影像绘图软体所绘制的图档,或单色扫描图档以及线条稿。Acrobat 1.0提供这两种压缩方式适合单色调线条稿,如传真品质的档案。

4.Run length 是针对单色线条稿的压缩,尤具有大区域的单色色块图档。

5.Compress text & Line Art 文字及线条都可以加以压缩。 <注一> 

(二)设备独立

一般 PostScript档案中包含了多种可能的合法程式码,在某些条件下 可能无法运行。例如那些依赖某些特殊字体结构、或输出设备的程式码。相反的,PDF格式不含任何程式结构,因而使得它更加安全,也更适合 以电子资料形式储存或传输。PDF是为整合多种输出选项的网路所设计的,它是标准化及设备独立最佳化输出格式。 对中文PDF文档之要求,不采用中文系统时,仍可独立显示中文;采用中文系统时,则可搜寻中文词汇。

(叁)各页独立

PostScript文件的各页间是相互关联的。这意味着你在跳到某页之前必 须把它前面所有的页都处理过。而PDF格式并没有这个限制。你可以直接 阅读PDF档案的任何一页,无须考虑其他页。 

(四)注记

PDF档案可以包含各种各样的注记–例如书签,缩影,链接,备注,文串,标识和媒体盒。你可以用这些“注记”以提高档案的质量及可读性。这些“注记”更可以有效的协助档案管理工作–例如制作、发送、 签注、修正、完稿、以及出版发行。

(五)档案保护 

PDF档案可容许设定密码和其他多种保护方式,以防止非法使用。例如 必须使用密码才允许阅读、允许或不允许列印、复制、签注、或修改。

 


肆、中文PDF档案制作流程


一、网页格式转存PDF档案格式:

PDF档案在英文字型的产生方面,已可轻而易举的制作,但在中文部分入前尚无法轻易地将网页直接转为PDF档,而必须间接的靠一些转换才能将网页转为PDF档。在目前的情况来说呢,在Acrobat1.0中以开启网页的功能只能用在英文网页上,只需使用Web Capture输入URL即可将英文网页转成PDF档,且可保留其超连结部分的格式。但在中文网页部分,中文字体则会变成乱码,所以必须藉助Acrobat writer以及Distiller来列印PDF档案,虽然无法保留其超连结的格式,但可设定列印超连结表。


二、排版软体转存PDF档案格式:

目前常见的排版软体对於PDF档案格式直接的支援程度并不高,大部分的排版软体无法直接转存PDF档,而必须靠列印的方式来产生。对於支援直接转存PDF档案的软体来说,Microsoft Office系列算是最完整的了,基本上只需要将Acrobat 1.0在Office之後安装,即可在工具列产生一个Icon,使用者只需直接点选即可启动一名为PDF Maker的程式,轻易的将文件转为PDF档。其他如Page Maker、Quark Xpress或Illustrator则必须加装外挂程式才可以直接转存PDF档。基本上各种软体所产生含中文字体的PDF档案,大致上可分为以"Acrobat Writer″、"Acrobat Distiller″以及"曲线″叁种产生方式,其中档案容量最大的是转为曲线的方式,其次为Distiller产生,最小的是以Acrobat Writer产生。当以相同的格式产生,使用的软体不同时,其档案大小会因为内含资讯的不同而有些少许的出入,但其档案的特性却是相同的。

其大致上的制作流程如下:


叁、PDF档案格式在於输出时的作业流程:

PDF档案在专业输出时需搭配PostScript 3之RIP方能发挥最大生产效能,因为PostScript 3直接支援PDF档案格式,当档案列印至PostScript 3 RIP时,RIP只需进行处理过网,所以处理速度相对提升,且列印品质较佳(如渐层)。而若您原有的RIP只支援PostScript Level 2,则在列印PDF档案时会需要多一个转换成PostScript Level 2的流程。

前端在Mac平台上的排版软体使用CID ATM字型显示及编辑,产生PDF档案;後端再使用Postscript字型或相容输出机输出。