中文字体字级乘以扫描解析度与中文光学辨识系统之辨识率关系之研究——以蒙恬认识王专业版为例
作者:辛炳宏,黄英铨,罗子尧,施军宇 更新日期:2008-09-09
本文来源:台湾艺术大学图文传播艺术学系94级毕业论文
摘要
现今这信息爆炸的社会中,早期记錄保存文字资料的方式已不再适合,尤其在现今讲求效率、速度及精确的工作品质下,我们会透过中文光学文字辨识系统将纸本信息转为文本文件,将文字作数位归档、编排及整理,除了可防止印刷品老化流失甚至失传,还可将文字信息作更有弹性的运用,例如书籍翻新、网路传播,甚至强化学术界的信息交流机制。
本研究主要的目的在于研究市售的专业版中文辨识软件,对于一般书籍中文字辨识能力,本研究采用蒙恬认识王专业版,对常見内文字进行辨识能力测试,并探讨其『辨识能力』、『扫描解析度』、『字级大小』以及与『扫描解析度与字级乘积大小』的关系,藉此了解最佳辨识效果的字级与扫瞄解析度组合,例如当辨识的文件是12 级字时,以300DPI 的解析度扫瞄后再进行辨识,即可得到最好的辨识率,如此一來可让我们在选择扫瞄解析度时有客观的依据,也可节省文稿扫瞄及档案存取时间。
在早期的研究中,可以得知中文光学文字辨识系统在于字级、扫瞄解析度和辨识结果有着显著的相关联性,因此本研究将同一字型,不同字级影像文件加以辨识,取得各字级最好之辨识率,这样一來当我们拿到有需辨识的文件时,便可以直接对文件加以判断,得到最好的辨识效果。