Google和Adobe一联手就干了件大事

Mark Wilson

内附下载地址

3
分享到新浪微博
分享到腾讯微博

二十三年前,肯·隆德(Ken Lunde)参加了Unicode会议。参与者有一个共同的焦点——从斯瓦希里语到孟加拉语,全世界不同的语言,该如何在互联网上传播。


会议室里挤满同行,肯·隆德指出,世界五分之一人口面临着的问题,这也是他们行业一开始所忽视的问题,被称为“Pan-CJK”语言的中日韩文有一个共同特点,它们都用单独的字来表示一个意思的。

英语的26个字母可以在英语、西班牙语和德语之间任意转换,只要你知道单词怎么拼写,就能被键入。




Pan-CJK不一样。它们每个字都有特殊的意思,而不是用字母构成一个词。这些字词在意思上可能相互关联,但在字形上又千差万别。

因此,1950年代之后,在一系列计算机标准化的改革中,它们被设置为不同的字体。这意味着如果你想用日语(汉字)输入法输出传统汉字的话,你必须在输入的时候把Times New Roman转换成Helvetica,而这会改变页面间距,影响读者阅读。


而且还需要在键入过程中,进行多种字体之间的安装、切换,这又会影响网页浏览器的印刷可靠性。坦白说,在苛刻的数字字体设计界中,它看上去很俗气。


15年来,Lunde先后两次提出这个问题,却没有人能够成功地把他们统一在同一个字体体系里。




Lunde在Adobe上做了很多努力,他既是字体设计师,也是高级计算机学家。此外隆德还邀请了谷歌的员工们,一起创建可以囊括世界所有语言的自由字体。

在接下来的两年中,Google和Adobe让他们的律师计算这笔投入是否划算。两家的公司将合作开发出pan-CJK通用字体。




2014年,他们分别发布了合作的第一批产品——Adobe思源黑体(Source Han Sans )和谷歌思源黑体(Noto Sans CJK)。无衬线字体版本,更适用于屏幕和现代应用程序。


在本月,他们又发布了第二批:Source Han Serif 和 Noto Serif CJK,有衬线字体版本,适用于打印和其他常规用途。



这个设计是2014年该作品的增编,其辐射范围大到几乎不可估量:必须产生30,000个表意文字(构成CJK单词的复杂形状),表现为45万个单独的字形,能够呈现出我们所期待的灵动字体。

为了建立这个系统,创建团队先使用日文字形。这听起来好像是种倒退,因为日文字实际上来源于中文。接着,从实用性出发,Adobe使用最多的东方字体是日语,这给创作团队带来的好处是,用最少的人力构建其他文字。

“韩文的使用规范参照多是日文的语法习惯。所以通过可用的日文,能够映射出一些相关的韩文。每不到200字就需要一个新的韩文表达形式。”Lunde补充到,“我花了两个星期来弄清楚这一点,解决这个问题需要对着7500个字研究,它们就像细齿梳一样密密麻麻。”

但是,中文跟它们不具备那么高的兼容性。他意识到,需要手工创作成千上万个新汉字。Adobe有一个24秒钟的视频,介绍了一个相对有效率的制作过程。你会看到它的表意文字素材库,它将表意文字的笔画分解成不同的部分,通过鼠标滑动调整长宽和角度等等。“这些虽然简化了设计过程,被拆解的部分需要以更适当的方式整合,”Lunde说,“这就是为什么这个项目花了两年时间才能完成。”




多亏了Adobe和Google的共同努力,pan-CJK字体的核心问题终于在千辛万苦之下被解决。你现在可以在Typekit,Github,Google的Noto网站上找到该字体。(点击阅读原文下载)

但是,还有更大的学术难题仍未解决。虽然这个项目涵盖了CJK内的30,000个表意文字,但这仍是很小的一部分。Unicode具有90,000个表意文字的占位符——换句话说,Unicode表示CJK仍然有6万个字没有完整。




对于现代用法,这些表意文字并没有受到特别关注,就像我们大多数人在口语中不再需要使用“尔(汝)”一样。 但是,当涉及到对东方历史文献的数字化时,这是不可避免的问题——仍需要有6万个新的表意文字。


“做这个工作,因为它需要设计这么多文字,要付出数年的努力,而不是数月,”Lunde说,“我们要怎么完成它?我还不确认。”


扫描二维码关注,获取更多创新资讯



关键字: 大事
有0条评论

发表评论