中州韵详解02:码表结构


码表概述

码表类输入法的「码表」,无非「单行单义」与「单行多义」两类。

单行多义

kkkk 口 㗊
fcu 去 云 支

单行单义

口	kkkk
㗊	kkkk
去	fcu
云	fcu
支	fcu

同一张表,可以写成「单行单义」或「单行多义」两种格式。两种格式,仅是书写方式上的不同,通常而言,「单行单义」有更好的可扩展性。仅以无词频信息的纯两列码表而言,排在上头的条目优先权高于下面的,这样就天然处理掉了「重码排序」问题。如果有第三列词频信息,还可以计频排序。「单行多义」表,就失去了一次性定义这些信息的可能性。故中州韵,采用的便是「单行单义」表。

表头的声明

sort: by_weight
columns:
  - text
  - code
  - weight
  - stem

「by_weight」表明以「词频」排序,而下面则定义了,表体结构依次是「汉字列,编码列,词频列,造词码列」。

咱们五笔用户,是拒绝调频的,在这个表里,词频唯一的意义就是——它们是重码排序时的依据。

表尾的符号

,	yz	1000000	
。	yz	1000000	
!	yz	1000000	
、	yz	1000000	
?	yz	1000000	
:	yz	1000000	
—	yz	1000000	
;	yz	1000000

文章作者: 五笔小筑
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 五笔小筑 !
评论
  目录