Skip to content

字根的内在屬性

上面我們提到了宇浩拆分規則的優先級。其實,在「字根最少」之上,還有一個隱藏的原則,也就是:字根的内在屬性

何爲字根的内在屬性?其實就是指某一個字根區別於另一個字根的内在特點。

「吉」拆成「士口」而不是「土口」,「周」拆成「⺆土口」而不是「⺆士口」,這是因爲「土」的下面一筆更長,而「士」的下面一筆更短。這是區別兩個字根的本質原因和内在屬性。

「内在屬性」可以解釋爲什麽有些字這樣拆而不是那樣拆,有些字爲什麽看上去違反了「字根最少」的原則。

「敝」拆爲「丷巾八攵」而非「氺巾攵」,這看似違反了「字根最少」原則,但其實沒有。注意到,「敝」字左下的筆畫是撇不是提;在「氺」中,左下角的筆畫是提不是撇。故而,「敝」字裡並不存在「氺」字根。正因爲如此,我們取四根「丷巾八攵」而非三根「氺巾攵」。

在這個章節,我們就詳細討論字根的内在屬性,討論某些字根在宇浩拆分中被分離或者被合併的原因,從而讓某些字的拆分原因更加明確。

日曰之辨

不少輸入法對與「日」「曰」兩字的區分,比較複雜。大概有兩種情況:

  • 有些是基於形狀的,凡是長大於高的都爲「曰」,凡是長短於高的都爲「日」。但這個方法會跟隨着字體的不同而不同,有時候不合字源,也不統一。例如:「書」字源於「聿者」,「曹」古字爲「東東口」。
  • 另外一種區分方法是基於字源。也就是説:凡是在古文中作「口」形,之後隸變爲「曰」形或「甘」形的字,都作「曰」。但這個方法對方一般的使用者難度太大,且分析字源會有疏漏之處,不應用於輸入法。

我們必須注意到,在漢字中,存在「日曰」對立的字形,只有三組,分別爲:「日曰」、「汨汩」、「曶㫚」。在其他的情況下,不存在對立,也就不存在混淆問題。

因此,我基於實用主義原則,對這兩個字根不多加以區分,而採取更簡單的方法。即:除了上述三組對立情況外,全部取「日」根。換句話説,「曰」根只需要在對立情況下才會使用,即:「曰」「汩」「㫚」三個字。

這樣一來,可以顯著降低使用者的記憶和學習負擔。

勹之辨

「旬」的外框「勹」,同「敖」左下的「」都是撇加橫折鉤。宇浩輸入法不做區分。

點之辨

這裡對含點字根的識別和歸併作出解釋。

含點字根

  • 單點「丶」和捺「乀」視爲同一個字根。
  • 相重疊的兩點,即「头」「冬」中的部分,和「二」同碼位。
  • 左對點「冫」和右對點「飞右」,和「二」同碼位。
  • 下對點「八」爲一個字根。
  • 上對點「丷」「䒑」「リ」同大碼。
  • 左「⺦」爲一個字根。
  • 左三點「氵」都在一個大碼。
  • 上三點「」都在一個大碼。
  • 所有四點「灬」都在一個大碼。

「为」「卵」等字的兩點和「冬」下的兩點不同,非連續筆畫,且被半包圍或全包圍分割,故而不認定爲「兩點」。詳「散件不分隔」禁手

人八入之辨

「人」「八」「入」三字易混,這裡做出區分。

左撇右捺

  1. 凡左撇不低於右捺,視作「人」根。

  2. 凡左撇低於右捺,視作「入」根。

  3. 凡左撇右捺分離,視作「八」根。

  4. 凡左撇右捺的中間被其他筆畫隔開,視作「」根,和「八」歸併。

kǒuwéi之辨

kǒu」和「wéi」。這兩個根如何區分?

答案是,如果方框裡有完整的筆畫,用「wéi」。否則一律用「kǒu」。

「国」字的方框中,有完整的筆畫,故而必須用「wéi」。

「中」字的方框中,雖然「⼁」穿方框而過,但並未被完全包含在方框中。由於方框中沒有完整的筆畫,故而用「kǒu」。

為防止拆分不直觀,此規定也適用於另外幾個包含「口」或者封閉空間的字根:「口古合户戶戸目皿罒自見早」等等。

例字

「古」下的「口」中如果包含完整的筆畫,應該拆如「十囗」。例如:「鄙」左下方的「口」中有「口」,故而應該拆成「口十囗口阝」。


「合」下的「口」中如果包含完整的筆畫,應該拆如「人一囗」。例如:「會」中間的「口」中有「小」,故而應該拆成「人一日」。

一體寫就字根

部分字根,不能分成兩次書寫,必須一體寫就,稱爲一體寫就字根。這些字根的特點是存在離散的部件。如果被其他字根穿插,會導致極難辯認。

這部分字根比較少,主要是一些出現散件的字根。這同「散件不分割」禁手類似。包括「貝頁見贝页见」等。

「夔」字中的「一自八」不作「頁」字根拆,因爲它被「止㔾」穿插。

對稱不擠壓

對稱形態的字根,不允許其中分散的一部分被擠壓到一邊。

這個規定在常用字中比較少見。

「命」不拆「合卩」,而拆「人口一卩」。

宇浩輸入法官網