宇浩拆分禁手
拆分之「禁手」,指的是无论任何时候都不应当出现一些拆分情形。它高于一切拆分规则。一旦某一个拆分候选中出现了「禁手」,则直接淘汰。禁手包括:散件不分割、竖向不包夹、横间不穿心。
散件不分割
有一部分字根,本身存在离散的部件,比如「戈」字右上的点、「犬」字的右上的点、「三」字的三个横等等。为了保证拆字的直观,保证检字(尤其是大字集下)的便捷性,我们需要对字根的连续性做出要求,并将它认定为字根的内在属性。
字根的连续性定义如下:
非连续写成、且被全包围结构或半包围结构分割的部件,不视为一个字根。
例字
「为」字的两点不可以被视为字根「两点」,因为它们非连续写成、且被半包围结构分割。
「卵」字不拆「卯⺀」而拆成「卯丶丶」,因为「卯」字的两点非连续写成、且被半包围结构分割。
竖向不包夹
不少字根中存在若干分散的部件。
例字
「二」和「三」中的横画是分离的。
「合」分为了「人」「一」「口」三个部分。
「儿」分为了「丿」「乚」两个部分。
这给了它们包夹其他字根的可能。如「亘」可看成「二」包夹「日」。
为了防止拆分不直观,我们做出规定,一个字根可以横向包夹,但不能纵向包夹。
例字
「卿」拆「卯」
「胤」拆「儿幺月」
「亘」拆「一日一」
「僵」拆「亻一田一田一」
这是因为,汉字的左右对称多于上下对称。左右包夹是可预测的,但上下包夹往往不可预测,必须要观察到最下方。
为什么「衣」字根不应当设置
某些输入法设置了「衣」字根,且允许包夹其他的字根。这是不妥当的。原因有二:
首先,「亠」和「𧘇」的出现并不总是成对的,必须看到最下方才能正确判断。
其次,「衣」中的「亠𧘇」部件是相连的,如果允许将它们分离并竖向包夹其他字根,则会出现「𡉊」是否应当被拆分为「王八」的问题。
横间不穿心
为了使拆分更加直观,符合笔顺,防止字根交叉粘连,我们规定:
「工土士干千禾キ王壬龶丰末未生古矢缶早羊虫」等字根的「一一」之间不允许穿插其他字根。
这个规定在常用字中比较少见。
例字
「再」不拆「王冂」,而拆「一冂土」。
「垂」不拆「壬龷」,而拆「千龷一」。
「禹」不拆「丿虫冂」,而拆「丿口冂丄丶」。
「妻」不拆「キコ女」或「龶乛女」,而拆「十彐女」。
