热门问题
时间线
聊天
视角

呒虾米输入法

台灣人劉重次發明的中文輸入法 来自维基百科,自由的百科全书

嘸蝦米輸入法
Remove ads

呒虾米输入法,为台湾刘重次发明的中文输入法。它是一种形码输入法,将汉字分拆成字型结构,再以字型结构的形、音、义与英文字母加以联想,拼出汉字。呒虾米输入法的发想始于刘重次在欧洲留学期间(1969年 - 1975年左右),当时因为Telex电传系统(电报机)普及,刘重次于是想创造一种便利中文资讯沟通的方法,于是投入中文检字法的世界,经过数十年后呒虾米输入法才告完成,并于1990年成立“行易有限公司”[2]

事实速览 原作者, 开发者 ...
事实速览 发明人, 发明年份 ...
Remove ads

名称

呒虾米一词,为台语“无啥物”(台罗:bô-siánn-mi̍h)之官话音译,意思为“没什么”。其外文名称使用“Boshiamy”一名;另外软件档案使用“Liu”一名,则取自发明人的姓氏──。例如2007年可下载之Windows试用版档名为“liu2007b.exe”。

然而,据输入法官网所称,以“呒虾米”作为输入法的名字,“意思是说,要取大根,不要取‘虾米根’。”

依据《教育部重编国语辞典修订本》,“呒”字的国语读音,注音为ㄨˇ(汉语拼音:wǔ)[3]

字根

呒虾米输入法字根数量多,为目前著名形码输入法之中最多者。依官方的字根总表统计,基本字根有341个[4],简速字根有156个[5]。然而有输入法研究者指官方列表上省去了或遗漏一些近形字根,例如只列出“夂”却省去“攵”,只列出“佳”却省去“隹”等。如果计算回省去或遗漏的字根,实际字根数量不止于此。[6]据呒虾米用户Deltazone(洋葱)的罗列,呒虾米实际上有基本字根580个,简速字根175个,加起来字根总数有755个。[7]。“呒虾米查码程式”制作者liuzmd1还直言呒虾米有“隐藏字根”[8]

呒虾米输入法的基本字根,依据官方的分类,绝大部分的字根可分为“形”、“音”、“义”三大类,以26个英文字母做联想与运用,但仍有11个字根必须另行记忆。官方称,这样的配合联想方法,是便利初学者熟记它的三百多个字根与英文字母的对应。

至于简速字根,乃为提升速度而设。同一个字,即使不使用简速字根,也可以用基本字根来组成。但若在基本字根以外,额外多记这156个简速字根,可减少部分字的输入码数,详见下方“缩短码长”段落。依据官方说明,大部分简速字根都能纳入“形”、“音”、“义”。[9]

当中字根与英文字母配合的关系有:

Remove ads

“形”

取字根的形状,中文字根与英文字母形状相似。例如:

更多信息 汉字, 字根 ...

其中某些字根,或许会使初学者感到困惑,如“寸”“口”“言”“丁”字,应该取其“形”还是“音”。原则上,若这个字根能念的出来,大部分是取其“音”,然而少数字根,其与“形”更容易联想,“形”对于初学者而言,是最直觉也最容易记忆的字根,故字根能够发音但仍然归属于“形”者,要稍作留意。

“音”

取字根的发音,中文字根与英文字母发音相似。例如:

更多信息 汉字, 字根 ...

大部分的字根,依据其本身的“声母”或“韵母”或“谐音”联想,如:

  • “B”之字根:“半”“不”“比”“八”,皆来字于其“声母”
  • “C”之字根:“西”“夕”,皆来字于其“谐音”
  • “D”之字根:“大”“刀”“豆”“歹”“鬥”“斗”,皆来字于其“声母”

当中,某些字根为“笔顺”,此时以其笔顺名的发音或特征做联想,如:

  • “丿”,其笔顺名为“撇”,故取其声母“P”
  • “㇏”,其笔顺名为“捺”,故取其声母“N”
  • “乛”“𠃌”,其特征为“歪”,故取其谐音“Y”

但特别注意的是,某些字根不以其本身的发音或谐音联想,而是借助某一带有其字根的汉字做联想,这点须留意,如:

  • “糸”,应以“絲”的谐音做联想,为“S”
  • “虍”,应以“據”的谐音做联想,为“Z”
  • “黽”,应以“繩”的谐音做联想,为“X”

另外,亦有少数字根与音的联想,需要借助额外的意义做联结,如:

  • “弓”“冎”,以其内喉发音的特征做联想,为“Q”
  • “食”“氏”“升”“黽”,声母皆为“ㄕ”,将它们与“ㄙ”“ㄒ”发音做区别,为“X”

有一些要用台语发音做联想,或者用变化发音做联结,如:

  • “户[11]”是“F”,不是“H”
  • “臼”是“G”,不是“J”
  • “气”是“K”,不是“Q”

故初学者开始学习与“音”有关的字根时,应多加留意其与英文字母之间的发音关系,以不致于发生困惑而导致学习上的困难。

还有一些取音的字根,曾被输入法研究者指发音过于牵强[6],例如属于“E”的“尹、酉、与”:

  • “尹[12]”与“寅”都念ㄧㄣ,但前者是“E”后者是“N”
  • “酉”与“又”都念ㄧㄡ,但前者是“E”后者是“U”
  • “与”与“雨”都念ㄩ,但前者是“E”后者是“U”

注音符号象形的字根大多依注音符号取音,但也有一些例外,例如:

  • 字根“ㄅ”不算作“B”,而算作“K”
  • 字根“ㄙ”不算“S”或“X”,而算作“U”
  • 字根“ㄍ”不算“G”,而算作“R”

等等,都要特别记住。

Remove ads

“义”

取字根意思的联想,共分成三个部分:

数目字

以下全部列举:

  • “〇”为“O”(形)[13]
  • “一”为“E”(音)
  • “二”为“R”(音)
  • “三”为“S”(音)
  • “四”为“F”(英文Four)
  • “五”为“W”(音)
  • “六”为“L”(音)
  • “七”为“C”(音)
  • “八”为“B”(音)
  • “九”为“K”(闽南语发音)
  • “十”为“J”(闽南语发音)

英文

以下全部列举:

  • “車”为“C”(Car)
  • “中”“央”为“C”(Center)
  • “日”为“D”(Day)
  • “女”为“G”(Girl)
  • “手”为“H”(Hand)
  • “心”为“H”(Heart)
  • “我”为“I”(I)
  • “王”为“K”(King)
  • “斤”为“K”(Kilo)
  • “亻”为“P”(People)
  • “木”为“T”(Tree)
  • “佳”为“V”(Very good)
  • “水”为“W”(Water)

摇头摆尾

指的是字根“形状”上(不是“字义”上)的变化,可以想像把一个字根的形状拿在手上,用力摇它,会被摇成另一个样子。如:

  • “干、千、チ、乇”[14]“ㄐ、爿”等,取“G”
  • “乚、厂、广”“六、亠”“立、辛”等,取“L”
  • “幺、了”“辶、廴”等,取“W”
  • “彐、⺕、ヨ、习、尹[12]、丑、聿”“山、屮、屲、屯”“爫、爪”等,取“E”

其中,数目字的延伸也有大量的摇头摆尾字根,特别要注意的字根就是“八”的摇头摆尾“人”“入”,要与“亻”做区别。

摇头摆尾可以说是字根为数最多的,故学习时,掌握好基础的字根,与摇头摆尾的字根一串一串地吸收,才能达到事半功倍的效果。

更多信息 汉字, 字根(摇头摆尾字根以双引号标示) ...
Remove ads

必须以硬背来记忆的字根

有一部分字根,与英文字母的形、音、义都无法关联,用户必须以硬背来记忆。以下全部列举:

  • “欠”是“I”。
  • “黃”是“K”。(可用联想法,如:黄金 → K金、黄帝 → King)
  • “至”是“P”。
  • “兼”是“Q”。
  • “𧰨(“豕”无最上面一横)”是“Q”。
  • “才”是“U”。
  • “衤”是“V”。(从好几个角度看都有“V”的形状在这个部首上面)
  • “鬼”是“V”。(可用联想法,如:鬼很吓人 → Very scary 、很怕鬼 → Very afraid)
  • “牙”是“X”。(“X”形状像是上下两颗尖牙)
  • “士”是“Y”。
  • “土”是“Y”。

然而,“黄”“兼”“鬼”这三个字根事实上是可以以拆码的方式输入的,分别是“REQB”“BEEF”“PQRU”,且可以类推于其它的汉字。而“豕(无最上面一横)”,官方又将其视为“犭”的摇头摆尾[15]。故这四个字根,学习者可以视情况选择要不要死记。

必须以简化字来记忆的字根

还有一些字根,必需以简体字的字形做联想,以下全部列举:

  • “言”作偏旁时简化作“讠”,像小草“i”形,所以“言”归入“I”。
  • “堅”简化作“坚”,所以“臣”归入“〢”即“R”。
  • “齊”简化作“齐”,所以“齊”的上方归入“文”即“W”。
  • “婁”简化作“娄”,所以“婁”的上方归入“米”即“M”,等等。

潜规则

呒虾米输入法在拆字时,会应用到一些潜规则,虽然官方没独立说出来,但在分解汉字时实际上会用到。个别学习者或许会有所困惑,另一些学习者会主张背简码来输入这些有困惑的汉字。例如:

  • 除了官方的字根表外,输入法内还有一些“隐藏字根”(undocumented),官方并没有列出,要用户自行发现[8]。例如:
    • “撲”、“璞”、“僕”等字的“菐”可以取“FB”。“對”的左旁,“業”、“叢”上方可以取“F”。
    • “楠”、“蝻”、“献”等字的“南”可以取“N”。
    • “蜷”、“圈”、“倦”等字的“卷”可以取“P”。
    • “拔”、“茇”、“蛂”等字的“犮”可以取“A”。但“盋”字不可以这样取。
  • 如果没有该字根,在拆字时要借用样貌相似的字根。其实即是官方遗漏的摇头摆尾字根。例如:
    • “唯”字没有“隹”字根,所以借用样貌相似的“佳”字根。
    • “己”字没有“コ”字根,所以借用样貌相似的“ユ”字根。
    • “草”字没有“艹”字根,所以借用样貌相似的“廾”字根。
    • “敬”字没有“卝”字根,所以借用样貌相似的“廾”字根。
    • “罪”字没有“罒”字根,所以借用样貌相似的“四”或“皿”字根。
    • “鬲”字没有“丅”字根,所以借用样貌相似的“丁”字根。
    • “敵”字没有“攵”字根,所以借用样貌相似的“夂”字根。
    • “亦”字没有“赤(无土)”字根,所以借用样貌相似的“㣺”字根。
    • “兵”字没有“丘(无底横)”字根,所以借用样貌相似的“斤”字根。
    • “錄”字没有“彑(无底横)”字根,所以借用样貌相似的“夕”字根。
    • “叟”字没有“𦥑”字根,所以借用样貌相似的“臼”字根。
    • “卫”字没有“ㄗ”字根,所以借用样貌相似的“卩”字根。
    • “除”字没有“余(无人)”字根,所以借用样貌相似的“禾”字根。
    • “冒”字没有“⺜”字根,所以借用样貌相似的“日”字根。
    • “牆”字旧版没有“啬(无回)”字根,所以借用样貌相似的“巫”字根。新版已加上此字根。

不过用户同时要注意,有些形状不能以样貌相似的字根借代,必须再分拆,例如“无”字不能借用“旡”字根,要分拆作“一”“尢”。“刁”字不能借用“刀”字根,要分折作“𠃌”“㇀”。所以官方遗漏的字根能否套用“摇头摆尾”的方法,是有限制的,并不是无限摇头摆尾。

Remove ads

取码原则

大根原则

取码时,先取较大的字根。例如:

  • “給”取“SAO”:即“糸”“亼”“口”。不取“WSAO” (“ㄠ”“小”“亼”“口”)。
  • “春”取“FND”:即“丰”“㇏”“日”。不取“SBD”(“三”“八”“日”)
  • “畫”取“EQE”:即“聿”“田”“一”。不取“EYQE”(“肀”“土”“田”“一”)。

但是亦有例外:(依官方所述,有些字会以为主,但仍不跳脱大根原则)

  • “捨”取“JBGO”:即“扌”“人”“干”“口”。但“JAJO”(“扌”“亼”“十”“口”)比“JBGO”更符合大根原则。
  • “註”取“IAK”:即“言”“丶”“王”。但“ILY”(“言”“亠”“土”)比“IAK”更符合大根原则。
  • “喪”取“JOOK”:即“十”“口”“口”“畏(无田)”。但“YOOK”(“土”“口”“口”“𧘇(无首笔)”)比“JOOK”更符合大根原则。
  • “囧”取“ORN”:即“囗”“儿”“冂”。但“FNO”(“四”“冂”“口”(补根))比“ORN”更符合大根原则。
  • “無”取“VFF”:即“𠂉”“卌(有底横)”“灬”。但“WSF”(“午”“丗”“灬”)比“VFF”更符合大根原则。
  • “兵”取“POB”:即“丿”“丘(无丿)”“八”。也取“KEB”:即“斤”“一”“八”。第一个方式不符合大根原则,是容错码。
  • “天”取“GNN”:即“チ”“㇏”“㇏”。也取“EDN”:即“一”“大”“㇏”。第二个方式不符合大根原则,是容错码。
  • “物”取“SNM”:即“牛”“勹”“〃”。但“SDP”(“牛”“ㄉ”“丿”)比“NMP”更符合大根原则。

例外字当中,有一部分是因为呒虾米输入法把一些形状当成分水岭,会顺高底次序取分水岭上方、分水岭、分水岭下方的部件。常见的分水岭包括:四面包围型(方框形)的字根,三面包围型的字根,一点、两点、三点、四点或其类似形状,和“氺”“氶”“龰”“止”“𠂉”“个”“禾”“畏(无田)”“王”“𧰨”等字根。因此,像“註”“喪”等字可以据此解释。但仍有一些字未能解释。

取码顺序

  1. 取码顺序多数按照书写顺序为原则,包括“辶”、“廴”为最后取码。
  2. “平头”的文字则从左至右取码。
  3. “不平头”的文字,从上至下取码,较高出的根先取。
  4. 但若可以截断笔画取出部件的话,或者在一些能以视觉辨识的原理来分解的字中,就以目视来分拆字的轮廓,称为“眼顺”,不与笔顺符合。
  5. 连体字,如“東、申、由”等字,需要将“四面包围”的字根,如此处三个字中的“田”字,独立取码。
  6. “三面包围”的字根,如“勿、易、阳”中的“勹”字,独立取码。
  7. 将一点、两点、三点、四点等字根独立取码。
  8. “戈(无丶)”“弋(无丶)”这两个字根,应先取上方的一点,即“A”,接着取“戈(无丶)”“弋(无丶)”,再取下方的字根。
  9. 像“戈、弋”同类的字,例如“犬、求、甫、术”等,亦先取上方的一点,即“A”,再取下方的部件,即是将中间部件视为分水岭取码。
  10. 有两旁相称的根夹另一字根时,把被夹的字根分为上下两个字根。换言之被夹的字根要被从中间腰斩,破开为上下两个根。

例如:

更多信息 汉字, 字根 ...

截长

“截长”指的是一个字如拆码超过四码,则只取首、二、三、尾码,其余舍去。例如:

更多信息 汉字, 未截长时的字根 ...

补短

“补短”指的是一个字拆码如不足三码,则须加上补根,就是最后一笔划或形状。例如:

更多信息 汉字, 未补短时的字根 ...

不过,十一个数目字“〇、一、二、三、四、五、六、七、八、九、十”的使用率很高,所以不必添加补根,只须一码即可输入。但若做为其它汉字的字根时,则不适用这个规则,如:“仁”字,应取“PRE”。

缩短码长

因为补短原则,腾空了很多二码位置和部分一码位置,这空间便用来加上最常用的字,以缩短输入码长,计有简速字根、一码简码字和二码简码字。

简速字根

为了再减少其他字的码长,还加上了一百多个简速字根。这些字根多数是字的常见偏旁,比其他字根大的多。例如:

  • “俞”是简速字根,归“A”,所以:
    • “俞”字由“AUR”缩短至“A”,但因不足三码,依“补短”规则,于是补上一枚辅根“亅”。结果取“AI”。
    • “愈”字由“AURH”缩短至“AH”,但因不足三码,依“补短”规则,于是补上一枚辅根“丶”。结果取“AHA”。
    • “輸”字由“CAUR”缩短至“CA”,但因不足三码,依“补短”规则,于是补上一枚辅根“亅”。结果取“CAI”。
  • “舍”是简速字根,归“B”,所以:
    • “舍”字由“BGO”缩短至“B”,但因不足三码,依“补短”规则,于是补上一枚辅根“口”。结果取“BO”。
    • “舍”是简速字根,归“B”——“舍”字由“JBGO”缩短至“JBO”。
  • “易”是简速字根,归“E”,所以:
    • “場”字由“YDEM”缩短至“YE”,但因不足三码,依“补短”规则,于是补上一枚辅根“丿”。结果取“YEP”。
    • “傷”字由“PVDM”缩短至“PVE”。
  • “咸”是简速字根,归“K”,所以:
    • “感”字由“AQPH”缩短至“KH”,但因不足三码,依“补短”规则,于是补上一枚辅根“丶”。结果取“KHA”。
    • “憾”字由“HAQH”缩短至“HKH”。

简速字根可以类推。

一码简码字和二码简码字

一码字的原则:除了十一个字母为数目字之外,尚有十五个字母未被使用而配上了文字,这些文字的码大部分以某字的其中一码或者音来配置,如:

  • “對”字原来取“FEBA”,可用简码“A”,减少三码。
  • “的”字原来取“PDNA”,可用简码“D”,减少三码。
  • “機”字原来取“TWWB”,可用简码“G”,减少三码。

这十五个一码字亦可以做为字根使用,如:

  • “懟”字原来取“FEBH”,也可以取“AHA”。
  • “啲”字原来取“OPDA”,也可以取“ODA”。

二码字的原则:

  • 标准字根产生:某些字以基础的打法本身就是二码字,如:
    • “金”字取“AE”,本身即为二码字。
  • 简速字根产生:呒虾米输入法为了能够增加打字的速度,增加了简速字根,如上方所述。而依据简速字根,某些字也成为了二码字,如:
    • “並”字原来取“BEFE”,但同时也是简速字根“B”,故“並”可取“B”,依“补短”规则,补上一枚辅根“一”。结果取“BE”,为二码字。
    • “咸”字原来取“AQPO”,但同时也是简速字根“K”,故“咸”可取“K”,依“补短”规则,补上一枚辅根“口”。结果取“KO”,为二码字。
  • “头码”与“尾码”产生:这是为数最多的二码字类别,即取一个字的第一个码以及最后一个码,如:
    • “覺”字原来取“SNMR”,取“覺”字的头尾码即“SR”。
    • “感”字原来取“AQPH”,取“感”字的头尾码即“AH”。
  • 简体字字型产生:此原则之下的二码字只有九个,其中也有只取头尾码的成分,以下全部展示:
    • “術”字原来取“MIAT”,“術”的简体字为“术”,故取作“AT”。
    • “靈”字原来取“UOOW”,“靈”的简体字为“灵”,故取作“EF”。
    • “遷”字原来取“CDPW”,“遷”的简体字为“迁”,故取作“GW”。
    • “開”字原来取“MKJ”,“開”的简体字为“开”,故取作“KJ”(连补根)。
    • “長”字原来取“EKN”,“長”的简体字为“长”,故取作“KN”(连补根)。
    • “麗”字原来取“LLB”,“麗”的简体字为“丽”,故取作“LA”(连补根)。
    • “廠”字原来取“LSNP”,“廠”的简体字为“厂”,故取作“LP”(连补根)。
    • “夢”字原来取“RFNC”,“夢”的简体字为“梦”,故取作“TC”。
    • “聲”字原来取“YCRR”,“聲”的简体字为“声”,故取作“YC”。
  • 形音义产生:几乎所有此类的字,皆是以其发音或英文,或者再加上其本身的部分取码组合而成,以下举四个例子:
    • “澳”字原来取“WPND”,取“澳”字的发音即“AU”。
    • “街”字原来取“MIYT”,取“街”字的意思Street,缩写为ST.,即“ST”。
    • “得”字原来取“MIDA”,取“得”字的发音以及第三码即“DD”。
    • “己”字原来取“FLL”,取“己”字的发音即“GG”。
  • “截取其中两码”产生:有些字不是按照顺序挑选,甚至有以尾码做开始的文字,以下举例:
    • “媽”字原来取“GMF”,取“媽”字的头码以及第二码即“GM”。
    • “麵”字原来取“GPTH”,取“麵”字的尾码以及头码即“HG”。
    • “哥”字原来取“TOTO”,取“哥”字的头码以及第三码即“TT”。
  • “只认得一码,另一码则硬性配对”产生:以下举例:
    • “鏡”字原来取“ALDR”,取“鏡”字的头码,但另一码则硬性配对,即“AC”。
  • “硬性配对”产生:完全找不到与字根的关联,如:
    • “宣”字原来取“NEDE”,硬性配对为“CF”。

一码和二码简码字共编入702(26+26×26)字。它们不可以推类。例如“感”字取“AH”,但“憾”和“撼”并不能拆作“PAH”和“JAH”。

二码简码字大多无规律可寻,但依据官方的二码字表的内容中,字根中带有“虫、心、皿、母、月、卑、兑、州、荒、疑、龰、𢦏”者,多属二码字。

符号的输入

符号的输入是呒虾米输入法的一个特色,不仅常用的符号可以直接输入,包括特殊符号的输入,可以不必再像其他的输入法一样还要开起小键盘或者进入内码寻找。值得注意的是,在输入特殊符号时,截长补短的规则依旧套用于此。符号的输入方式可分为以下两种:

  1. 一般符号输入:输入“,”“.”“..”“.,”“S.”“V.”“VV”“[”“[[”等就会出现“,”“。”“:”“;”“?”“!”“、”““”“‘”。
  2. 特殊符号输入:若要输入特殊符号,必须先打上一个逗号再加上符号的码,就可以直接打出特殊符号,如:
    • “㊣”符号,只要输入“,OEZ”就可以了。(“正”的呒虾米解码为“EZE”,但加上逗号符号已经有三个码了,固不必补短添加辅根。)
    • “⑽”符号,只要输入“,GJ”就可以了。(“G”为括号之意。)
    • “§”符号,只要输入“,SS”就可以了。(“§”形似“SS”。)
    • “¼”符号,只要输入“,EPF”就可以了。(“P”为撇。)
    • “Δ”符号,只要输入“,DEL”就可以了。(“Delta”的前三码。)
    • “☎”符号,只要输入“,TEL”就可以了。(“Telephone”的前三码。)

特色

  • 呒虾米输入法和仓颉输入法一样以26个英文字母为字根。
  • 呒虾米输入法和大易输入法相比,保留了上排数字键给使用者直接输入数字,操作笔记型电脑时此优点尤为明显。
  • 官方宣传认为,呒虾米输入法很简单、速度很高、非常容易学习,是“史上最强输入法”和“世界最佳中文输入法”。
  • 以26个英文字母为组字按键,官方宣传时称熟练中文打字后,通常亦能熟练英文打字。但有输入法研究者提出异议[16]
  • 以“空白键”为组字键。
  • 字根数量多是目前著名形码输入法之中最多的。
  • 不少字根都比较大块。碰到大块的字根,便不用再分拆作小字根(补短时例外)。
  • 官方宣传及爱好者称,字根分形、音、义归类,容易学习和记忆。但有输入法研究者提出异议[6]
  • 拆字时会在同一笔断开,例如“申”取“IQI”即“丨、田、丨”,在同一笔(本例子中为竖笔)上砍断(本例子中断作三块)。
  • 官方宣传及爱好者称,拆字取码规则简单易学,远胜其他输入法。但有输入法研究者提出异议[6]
  • 官方宣传称选字率低,适合盲打,能保护眼睛,减低对眼睛视力的伤害。但有输入法研究者统计过,呒虾米重码率是数种常见形码输入法之冠[17]
  • 除了可以输入大多数字形输入法都支援的基本繁体中文、简体中文外,还可直接输入符号、日文汉字平假名片假名
  • 设有大量简快码容错码
  • 支援Unicode,支援 WindowsMac OSUnix-likeAndroid 平台。
  • 试用版呒虾米(官虾)最多可输入20组加字加词。

另见

注释

参考书籍

资料来源

外部链接

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads