永不可能理想

词库里「啥都有」,对于任何一种中文输入方案都是不现实的。不同场合,不同行业,所需的「词汇」各有不同。所以类似『细胞词库』的概念特别流行。
饶是如此,「打空」或「重码位次不理想」也是中文输入法的常态。我们在输入时,总不免下意识地去考量词库中有没有相应词汇,利用一些技巧或熟练度来避免无效击键。比如拼音用户可以选择有语料库支持的商业输入法云词库,而五笔用户们则会下意识地拆解一些合成词、或直接对专用名词打单,比如「段小楼」=「段+小楼」。

理论上,我们无可避免这样的痛楚。任何技巧,都只是降低一些尴尬度罢了。只有「单字」才是破解这个问题的唯一解,但是「单字」的便利性也是有门槛的,需要相当程度的熟练度才成。2011~2014 年跟言大混击键圈,狂练击键到突破前五百单字乱序 11 击键,挂词赛文冲到两百六七以上,甚至落下了腱鞘炎的病根。

后来深刻体会到其实看打赛文这种机械性的活动,跟实际工作生活的差异是非常大的,实际生活中打字速度的制约条件是「语言组织与构思速度」。另一方面,「智勇多困于所溺」——我养成的几乎已成条件反射的精悍词库,除了打赛文这种吹水体之外,几乎毫无用处,遂转向打单。(作者系下图中的「清新」)

pic

自造词的折衷方案

其实任何有「自造词」功能的五笔,都是「机械」性地组合上屏汉字。这一来,废词几乎无法避免。由于缺乏妥善的「消废词」方案,这个功能在「五笔用户」中几乎意义不大。但是今天我们实现了一个非常理想的折衷方案:小狼毫98五笔助手。

一:「精准造词」模式下,造出的词条永久保留,可以抽出或合并到码表内。
二:机械词汇,在「上屏」过一次后,便永久保留,亦可抽出或合并到码表内。

在这里解释一下第二条内容:当你在「单字模式」下,打过「红豆生南国」后,如果你的「自造词长度」策略为「2」,则有:

  • 红豆 xagk
  • 豆生 gktg
  • 生南 tgfm
  • 南国 fmlg

我们观察到,「豆生」与「生南」是明显的「废词」。但是「五笔」有其「特殊」之处,即词组的编码是按五笔规则生成的。当你用过一段时间后,「红豆」与「南国」大概率还会被用到,而「豆生」与「生南」则大概率不会。于是清废词时,我们以上屏过的「机械词汇」算「有用词汇」,没有上屏过的「机械词汇」一律清除,你就获得了切实有用的词汇。

当然,这可能意味着少数没有上屏过的「也确实是个词组」的「词组」被清掉,但是你至少获得了按五笔编码打过的词——永久保留了。

这样一来,你可以真实意义上地「养词库」了,因为这是从零开始,保证 100% 有效有用词汇持续在码表内「生长」的,行之有效的办法。

简例如下:

pic

新的「小狼毫助手」

小狼毫助手,已实现了对「小狼毫98五笔专版」的全面控制。

pic