后备字体
后备字体(Fallback font)是指在当时显示的字型缺乏某些字元时,被用于显示缺失字元的字体。因为其作为显示的最后一道防线,后备字体应该尽可能包含所有Unicode字元。
当缺失字元没有后备字体用于显示时,通常会将缺失字元改为黑色方块、白色空心方块、问号、Unicode占位字元(U+FFFD)显示,或者干脆略过该字元。在实务上,像是CSS等支援字体列表依序显示的系统,通常会将一或多套后备字体置入列表最后,以防止缺字的情况发生。
Unicode BMP Fallback字型
2 0
Unicode BMP Fallback是一套最早用于侦错用途的后备字型。BMP代表的是Unicode字元平面的基本多语言平面(Basic Multilingual Plane)。在该字型中,每个字元都是用方框围住的四位数十六进位编码。[1]左方的图案是该字型的示意图,展示了一个空白字元(U+0020)。
不像下述的Unicode Last Resort字型,Unicode BMP Fallback字型只能显示Unicode标准的第零平面,也就是基本多语言平面中的65536种字元。这是因为其字体设计每字元容纳四个编码,因此只能对应U+0000(=0)至U+FFFF(=65535)的字元,也就是第零平面。
Unicode Last Resort字型
此字型是统一码联盟在制定Unicode 5.0时所提供一套包含所有Unicode平面的后备字型。该字型是Mac OS X Last Resort系统字型的衍生版,由苹果公司授权让统一码联盟在非苹果平台上使用。[2] 该字型在 Unicode 14.0 版(2021 年)中以SIL开源字体授权释出。[3]
该字型的字元以粗黑圆角方框围住,中间以该编码区段的代表字元显示,让使用者能大略知道缺失文字的语言。在粗框的左右,各记载了该区段的Unicode十六进位编码起始值与终止值,上下则写出该区段的叙述。[4]
不像Unicode BMP Fallback或GNU Unifont,Unicode Last Resort字型不会针对每个字绘制不同的字元,而是对该区段直接用同一字元显示。这样的设计事实上是对常见字体标准,TrueType、OpenType、PostScript、WOFF等的妥协。由于常见的字体标准皆采用sfnt定址,因此只允许在十六位元的定址空间内提供最多65536(FFFF)个不同的字元。然而,今日的Unicode已经有超过十万种字元,理论定址空间也超过一百万种字元,是sfnt定址允许的约15倍大小。因此,尽管随著时间推进,Unicode定义的字元只会越来越多,Unicode Last Resort后备字型却仍能将未来的所有字元全部收录。
参见
参考资料
- ^ SIL International (March 20, 2008), Unicode BMP Fallback font. Retrieved August 28, 2011.
- ^ Apple Computer (November 2, 2002), Last Resort font (页面存档备份,存于互联网档案馆). Retrieved August 27, 2011.
- ^ Last Resort Font, The Unicode Consortium, 2022-02-10 [2022-02-11], (原始内容存档于2022-02-11)
- ^ Apple Computer (February 2, 2002), Last Resort Font Glyph Table (页面存档备份,存于互联网档案馆). Retrieved August 28, 2011.