1 字根 五筆字根是五筆輸入法的基本單元,86版使用234個字根,98版使用259個字根,新世紀(jì)版使用了226個字根。 2 取碼原理 之所以叫作五筆,是將漢字筆劃分為橫、豎、撇、捺、折五種。把字根或碼元按一定規(guī)律分布在25個字母鍵上(即標(biāo)準(zhǔn)的QWER鍵盤,不包括Z)。取碼時最長四碼,最短一碼。 2006年12月,王永民又在此基礎(chǔ)上,研究出用于手機(jī)輸入的基于6個碼元和“右手法則——前四末一”取碼法的數(shù)字王碼。 3 鍵名字 鍵名是指各鍵位左上角的黑體字根,它們是組字頻度較高,而形體上又有一定代表性的字根,它們中絕大多數(shù)本身就是漢字,只要把它們所在鍵連擊四次就可以了。如:王:11 11 11 11(GGGG) 4 成字字根 在每個鍵位上,除了一個鍵名字根外,還有數(shù)量不等的幾種其它字根,它們中間的一部分其本身也是一個漢字,我們稱之為成字字根。 輸入方法:鍵名代碼+首筆代碼+次筆代碼+末筆代碼(如果該字根只有兩筆畫,則補(bǔ)空格鍵結(jié)束) 4.1 86版五筆字根 五筆字型輸入法 - 1區(qū)橫起筆 11G 王旁青頭戔(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石廠 14S 木丁西 15A 工戈草頭右框七
- 2區(qū)豎起筆 21H 目具上止卜虎皮 22J 日早兩豎與蟲依 23K 口與川,字根稀 24L 田甲方框四車力 25M 山由貝,下框幾
- 3區(qū)撇起筆 31T 禾竹一撇雙人立,反文條頭共三一 32R 白手看頭三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺點(diǎn)無尾魚,犬旁留兒一點(diǎn)夕,氏無七(妻)
- 4區(qū)點(diǎn)起筆 41Y 言文方廣在四一,高頭一捺誰人去 42U 立辛兩點(diǎn)六門疒 43I 水旁興頭小倒立 44O 火業(yè)頭,四點(diǎn)米 45P 之字軍蓋道建底,摘礻(示)衤(衣)
- 5區(qū)折起筆 51N 已半巳滿不出己,左框折尸心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴馬,丟矢矣 55X 慈母無心弓和匕,幼無力
4.2 98版五筆字根 - 1區(qū)橫起筆 11 G 王旁青頭五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石廠 14 S 木丁西甫一四里 15 A 工戈草頭右框七
- 2區(qū)豎起筆 21 H 目上卜止虎頭具 22 J 日早兩豎與蟲依 23 K 口中兩川三個豎 24 L 田甲方框四車?yán)铩?5 M 山由貝骨下框集
- 3區(qū)撇起筆 31 T 禾竹反文雙人立 32 R 白斤氣丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登頭單人幾 35 Q 金夕鳥兒犭邊魚
- 4區(qū)點(diǎn)起筆 41 Y 言文方點(diǎn)誰人去 42 U 立辛六羊病門里 43 I 水族三點(diǎn)鱉頭小 44 O 火業(yè)廣鹿四點(diǎn)米 45 P 之字寶蓋補(bǔ)礻衤
- 5區(qū)折起筆 51 N 已類左框心尸羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶馬失蹄 55 X 幺母貫頭弓和匕
4.3 新世紀(jì)版五筆字根 - 1區(qū)橫起筆 11 G 王旁青頭五一提 12 F 土士二干十寸雨 13 D 大三肆頭古石廠 14 S 木丁西邊要無女 15 A 工戈草頭右框七
- 2區(qū)豎起筆 21 H 目止具頭卜虎皮 22 J 日曰兩豎與蟲依 23 K 口中兩川三個豎 24 L 田框四車甲單底 25 M 山由貝骨下框里
- 3區(qū)撇起筆 31 T 禾竹牛旁臥人立 32 R 白斤氣頭叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭風(fēng)頭幾 35 Q 金夕犭兒包頭魚
- 4區(qū)點(diǎn)起筆 41 Y 言文方點(diǎn)在四一 42 U 立帶兩點(diǎn)病門里 43 I 水邊一族三點(diǎn)小 44 O 火變?nèi)龖B(tài)廣二米 45 P 之字寶蓋補(bǔ)示衣
- 5區(qū)折起筆 51 N 已類左框心尸羽 52 B 子耳了也乃齒底 53 V 女刀九巡錄無水 54 C 又巴甬矣馬失蹄 55 X 幺母絞絲弓三匕
5 規(guī)則 5.1 單字輸入 除鍵名字和成字字根漢字之外的漢字,如果一個字可以取夠四個字根,就全部用字根鍵入,只有在不足四個字根的情況下,才有必要追加識別碼。 5.2 末筆字型識別碼 當(dāng)一個字拆不夠4個碼元時,它的輸入編碼是:先打完碼元,再追加一個“末筆字型識別碼”,簡稱“識別碼”。末筆字型識別碼由漢字的末筆畫代碼和字型代碼組成。 5.3 拆分原則 5.4 詞組的錄入 取第一字的前兩位編碼和第二字的前兩位編碼 取第一字的第一位編碼,第二位的第一位編碼,第三字的前兩位編碼 取每一個字的第一位編碼 取一、二、三、末字的第一位編碼 5.5 簡碼字 指一些較常用字可以用一、二或三字母編碼打出,分別稱為一、二、三級簡碼 一級簡碼包含漢語(尤其是官方語體)最常用字中的25個,為了盡可能全面地安排最常用的漢字,部分一級簡碼并非是該字全碼的首位。 但所有的二級或三級簡碼均為該字全碼的前二或三位 一級簡碼如下,86版、98版和新世紀(jì)版通用 編碼 | A
| B
| C
| D
| E | F | G | H | I | J | K | L | M | 文字
| 工 | 了 | 以 | 在
| 有
| 地
| 一
| 上
| 不
| 是
| 中
| 國
| 同
|
編碼
| N
| O
| P
| Q
| R
| S
| T
| U
| V
| X
| W
| Y
| 文字 | 民
| 為
| 這
| 我
| 的
| 要
| 和
| 產(chǎn)
| 發(fā)
| 經(jīng) | 人 | 主
| 6 特殊鍵 6.1 “Z”鍵 由于五筆字型中,采用了五種筆劃,每個字根或碼元只取前兩劃定位它們在鍵盤上的位置,所以五筆字型漢字編碼只用到了5×5=25個字母鍵。每個字的編碼中都沒有“Z”。后來大部分五筆輸入軟件都附與Z鍵查詢功能,又叫作“萬能鍵”或“萬能學(xué)習(xí)鍵”。初學(xué)者可以在對某個字不確定其拆分時,使用“Z”鍵代替不確定的字根或碼元。也有一些五筆輸入法使用“Z”鍵來實(shí)現(xiàn)拼音反查五筆或符號輸入功能。 6.2 “L”鍵 與“Z”鍵的用途為大多數(shù)熟知不同,“L”鍵在五筆編碼中也有許多人不太了解的特殊用途: 6.3 單筆畫字 編碼方案對單筆畫字的編碼規(guī)定為兩個單筆畫字母+兩個L:即一(GGLL)、丨(HHLL)、丿(TTLL)、丶(YYLL)、乙(NNLL),由于豎、撇、捺構(gòu)成的字不為大多數(shù)人認(rèn)識,而“一”字有一級簡碼(G),乙字又不常用(偶爾用到時,一般不記得正確編碼的輸入者常會用別的輸入法代替輸入),所以這一編碼方案細(xì)節(jié)常被人忽略。 6.4 罕用字與常見詞組的沖突 詞組“勞動”與“蔻”字,如果按編碼方案,其編碼均為(APFC),按照一般的規(guī)定,重碼時,應(yīng)是單字優(yōu)先,可是相比之下,“勞動”是常用詞,而“蔻”字幾乎不會單獨(dú)出現(xiàn),通??偸且栽~組“豆蔻”的形式出現(xiàn),所以,為了方便輸入、減少重碼,在最終方案中蔻字的編碼被強(qiáng)制設(shè)為(APFL) 7 版本 王永民自1983年發(fā)明五筆字型以來,共推出了三種編碼方案,即86版、98版和新世紀(jì)版: - 86版也就是老式的五筆,又稱4.5版。使用130個字根,可處理GB 2312漢字集中的6763個漢字。由于習(xí)慣問題,它至今仍然是擁有用戶群最為巨大的編碼方案。
- 98版是一種改進(jìn)型的方案,其編碼的科學(xué)性更強(qiáng)、更易于學(xué)習(xí)和使用。使用259個碼元,可處理中、日、韓大字集中21003個漢字。但二者在編碼原則上大同小異。
- 新世紀(jì)版于2008年1月28日推出,采用新設(shè)計的字根體系更加符合分區(qū)劃位規(guī)律,更加科學(xué)易記而實(shí)用,按規(guī)范筆順寫漢字的人,取碼輸入更容易,可以處理27533個簡繁漢字。
7.1 版本的使用情況 設(shè)計者認(rèn)為,86版的字根設(shè)置不如98版和新世紀(jì)版科學(xué)。但是由于86版較先發(fā)布,且98版和新世紀(jì)版五筆字型編碼的專利權(quán)尚掌握在王碼公司手中,而王碼公司反對其他公司在未授權(quán)的情況下開發(fā)和發(fā)行五筆字型輸入法[4],因此86版五筆字型編碼及相關(guān)軟件的用戶和輸入法程序都比98版和新世紀(jì)版多。 - 從學(xué)習(xí)的角度看,有的人包括設(shè)計者在內(nèi)的認(rèn)為三個版本五筆相比較,86版較難學(xué)習(xí),很多筆畫多的字沒有字根,導(dǎo)致很難拆分;也有的人認(rèn)為由于86版較先發(fā)布,很多人已經(jīng)掌握了86版的字根排布,很難再接受98版或新世紀(jì)版的五筆字根排布。
- 重碼問題一直是困擾漢字輸入法的一道難題,五筆字型一樣會有重碼。三個版本的重碼相差不大,而新世紀(jì)版五筆在重碼實(shí)用頻度得到降低。
- 從字形上看,86版很多字都沒有以簡化字的字形出發(fā),而以舊字形編碼,造成很多字不按規(guī)則輸入,形成特例字。98版已經(jīng)較為改進(jìn)這一類情況,使得輸入此類字的時候能正確區(qū)分其左右,上下,外內(nèi)等因素,但并沒有根本解決此問題。
- 折的部分由于向右偏移,造成不順手、不習(xí)慣。
- 86版過分在乎重碼字,以規(guī)則去區(qū)分兩個形近字,如(日與曰,未與末),但加入詞組后,重碼仍無法避免(尤、萬、尢)。98版在修改字根排布之后較少出現(xiàn)這類情況。
- 86版設(shè)計的時候只適用于簡化字,目前只有少數(shù)輸入法支持五筆輸入繁體字,而且繁體字輸入在極少字根下十分困難。98版和新世紀(jì)版的更新中把一些拆分過量的字根和碼元進(jìn)行了集成,使之更容易支持繁體字。
8 輸入軟件 8.1 王碼五筆輸入軟件 - 王碼五筆型18030推出,是由于部分用戶不適應(yīng)98版,而又有輸入更多漢字的需要而出現(xiàn)的。它基本延用86版的編碼,而能處理中國國家的強(qiáng)制性標(biāo)準(zhǔn)GB 18030-2000字集的漢字,該字集可以處理27533個漢字。
- 王碼大一統(tǒng)五筆字型輸入法軟件是現(xiàn)在的正式五筆字型輸入法軟件,安裝包默認(rèn)帶有86、98和新世紀(jì)3個版本。
8.2 其它五筆輸入軟件 在王碼五筆出現(xiàn)之后,又出現(xiàn)了許多其它的五筆輸入法。由于86版編碼的專利開放,它們大多采用86版的編碼方式,但也有使用者個人提供98編碼的碼表。它們在造詞等功能上加以改進(jìn),也獲得了一定的用戶群。這其中也有一部分是以五筆編碼形式為主的輸入平臺,它們不僅可以以五筆方式來輸入,也可以根據(jù)用 五筆字型輸入法 戶的需求安裝不同的碼表以提供其它編碼的輸入方式。
|