码表概述
码表类输入法的「码表」,无非「单行单义」与「单行多义」两类。
单行多义
kkkk 口 㗊
fcu 去 云 支
单行单义
口 kkkk
㗊 kkkk
去 fcu
云 fcu
支 fcu
同一张表,可以写成「单行单义」或「单行多义」两种格式。两种格式,仅是书写方式上的不同,通常而言,「单行单义」有更好的可扩展性。仅以无词频信息的纯两列码表而言,排在上头的条目优先权高于下面的,这样就天然处理掉了「重码排序」问题。如果有第三列词频信息,还可以计频排序。「单行多义」表,就失去了一次性定义这些信息的可能性。故中州韵,采用的便是「单行单义」表。
表头的声明
sort: by_weight
columns:
- text
- code
- weight
- stem
「by_weight」表明以「词频」排序,而下面则定义了,表体结构依次是「汉字列,编码列,词频列,造词码列」。
咱们五笔用户,是拒绝调频的,在这个表里,词频唯一的意义就是——它们是重码排序时的依据。
表尾的符号
, yz 1000000
。 yz 1000000
! yz 1000000
、 yz 1000000
? yz 1000000
: yz 1000000
— yz 1000000
; yz 1000000