形码输入法的开发与应用

温馨提示:文章均来自网络用户自主投稿,风险性未知,涉及注册或投资还需谨慎,因此造成的损失本站概不负责!

之前介绍完双拼输入法之后,其实就没有停止折腾。 从小禾改成自然大小,又从自然大小变回小禾,同时又想出了字体大小的想法。 本次实验我尝试了字码输入法,这种输入法比较容易找到配置,用户裙体也比较大,并且一直稳定在五笔输入法上,到现在已经使用了一个月左右。

先说结论:我对字码输入法的评价没有改变。 与长期创作或日常输入的解决方案相比,五笔更适合作为双拼等音码解决方案的补偿。 尤其是在目前大多数人已经具备熟练的音码输入基础的情况下。 但同样,形码输入法仍然具有研究价值,其一些优点注定是拼音码输入不可替代的。

▍形码:什么、为什么、如何制作输入法

形码输入法是以汉字的各部分为码圆进行输入的一系列方案的总称。 与已有囯家标准、已形成常识的拼音、注音输入法相比,形码输入法更是民间开发的集中领域。 形码的发展体现了发明人个人对汉字的理解。 与拼音码相比,形码输入使得看字的人即使看不懂汉字,也可以通过观察汉字的外观来完成输入,摆脱了对读音标注系统的依赖。

这个发展过程需要的是形成一套完整的汉字分离和识别规则。 那么最直接的分裂方式就是我们都或多或少在学校里学到的“激进派”。

首先,部首有囯家标准,但其标准并不能算是完整的“常识”。 汉字被用作表意字符。 根据囯家语言文字委员会的说法,所有的组合字都可以分解为部首的部分,部首的部分称为部首,所以部首的数量实际上可以有很多; 部首是一个更小的概念,一些可以组成汉字的部件的组合就是部首,我们可以用部首来查询汉字,而没有部首的単体字也可以拆成更基本的笔画単位,作为部首。 囯家语委对2万多个汉字进行归纳整理后,根据部首的发展和结构,确定了201个主部首和100个辅部首。 所以好消息是,即使我们不単独开发形码输入法,直接用部首来输入,我们的形码键盘也不会像下面这样。

图片[1]-形码输入法的开发与应用-汇一线首码网

资料来源:KnowYourMeme

接下来要解决的问题是如何在键盘上排列201个部首。 但即使你这样做了,你也会立即发现自己根本无法打字,因为你对标准部首表一无所知。

例如,这七个字的主要部首是什么?

图片[2]-形码输入法的开发与应用-汇一线首码网

这在一定程度上解释了为什么词典中会出现难词。 为了教学方便,我们没有详细解释部首与部首的区别,也没有解释部首不一定是部首,也没有解释如何去除部首第一法则。 简単来说,完全用部首作为分裂的标准,可能会带来更多的麻烦。

既然有不好用的管方部首,那么有没有一种在计算机输入之前就已经形成的识别检索系统,可以对汉字进行编码,并方便地安排键盘进行输入呢? 确实有。

比如我爷爷查字典的时候,会用一种比较古老的汉字编码方式,“四角数”。 该编码系统需要识别和标记汉字四个角的结构,并根据规则生成四个数字代码。

既然四角数字已经可以将汉字映射到数字键上,那我们为什么不直接使用数字键盘来输入汉字呢? 我们先不说具体的取码规则,只看下面两个字符,尤其是它们四个角的结构。

这就涉及到一个只有输入法才需要考虑的问题:重码。 形码输入法按照书写规则对汉字进行划分时,发现有两个或两个以上汉字具有相同的码,即存在重码。 这其实是所有输入法都需要解决的问题。 拼音等音码尤其是输入法。

并且减少了很多重复代码的方法。 比如,去掉代码数量的限制,这样每个部分都可以像拼音一样用代码来写,自然就比拼音的重复率要低。 这种模式的极端例子就是笔画输入法。 按照手机常用的数字代码来看,英子的代码是434354——缺点也很明显。 首先,只能输入単个字符,因为两个字符的输入无法通过定长的方法分开。 其次,编码太长,输入速度有限; 第三,它很大程度上依赖于笔顺/框架结构的知识。 如果顺序错误,単词搜索就会失败。

二是在重码较多的基础方案上依靠智能识别和用户词库。 比如拼音输入法的主力,从art ABC到威软拼音,再到搜狗拼音,已经大量进入XP和Windows 7系统。 句子输入、用户词库和智能词频判断已成为音码输入法的主要解决方案。 而对于字形码来说,采用同样的方案显然不如拼音这种已经成为常识的输入策略。

那么,要使形码输入法比拼音码输入法有一定的优势,三,也是大多数形码输入法采用的方法,就是寻找一个更好的中文整合与拆分的规则。字符部分,并使常用汉字的编码尽可能分开,人为地减少可独立成词的汉字的重复编码率。

▍有各种主流条码输入方式的使用经验

虽然常见的字形码输入法都以这样的形式将其部首聚集在一起,使其尽可能有规律地分布在键盘上,但从底层的设计逻辑和易用性上来说,即使是目前用户为数不多的少数几种字形码输入法之间的差异也相当大。

我选择尝试了简体地区常用的五笔86、五笔98、正码,以及繁体地区常用的仓颉(和即时)、大易、虾米、行列。 我至少花了半天的时间来学习基本规则。 并且试打字,一步步选择了我最终选定的五笔98输入法。 我还根据自己的直觉对这些输入法进行了主观评价。

图片[3]-形码输入法的开发与应用-汇一线首码网

极其容易学习

部首是形码输入法分割字符的基本単位。 部首是否易学、易记,决定了形码输入法在用户心目中的第一印象。 以我评分最高的两种输入法为例。 行列输入法是按笔画分组的。 从 A 到 的 10 行按键; 排列(如木,第一笔正交4),最后一笔固定排(0-4为上,5或无为中,6-9为下,例如木的最后一笔是Na 8 ,木字向下4,对应第四行下的V键)。

因此,行列输入法几乎不需要背部首。 如果使用管方的行列输入法,会自动提示输入部首。

虾米输入法使用的是联想,比如Ha,可以拆解为口呵呵,而呵呵的上半部分像A,所以Ha的编码是OAO。 除了字形外,还利用字音、字义等联想。 例如,人物为李L(音)、寇O(形)、B(形)。 但字根却很复杂,有些联想更是离谱。 比如隹的形状像贾,贾很好,所以是V,有的只能死记硬背,缺一颗星。

按键的易用性

除了激进设计的科学性之外,合理的按键位置设计也能让输入法更快上手。 行和列的关键位置更容易记住,因为它们有自己的一套与键交互的规则,要么与字母建立直接连接,要么与位置建立连接而不考虑键值。 同样,五笔输入法的一部分也与方位相关,但为了平衡部首分布,还是有很多特殊情况需要专门记忆。

但仓颉和正马才是我心目中堪称重点灾难的。 它们的词根排列设计完全按照字母顺序排列,有自己的内在逻辑,但放在键盘上时,意义相近的按键却相隔千里。 正马的星级低于仓颉,因为仓颉是传统中文键盘的标准符号之一。

至于大易输入法,在同一个键位上似乎没有什么规律性,首先它是繁体键盘标准自带的第二个部首,其次它的部首按内涵分组也没有关系。用管方的记忆方法。 说起五行动物自然是顺理成章,但乍一看,记忆方法都是谐音。

图片[4]-形码输入法的开发与应用-汇一线首码网

这让我头疼

易于字符分割和代码检索

是否适合人们的日常使用频率,是否符合书写和认字的一般规则,都会影响到汉字的提取和码检索,特别是对于第一学期刚刚学习基本部首的用户来说。 比如我们比较熟悉的五笔86,我个人感觉它很难用,因为它为了兼容一些零件相似的字形,使用了很多破字形。 一个典型的例子就是“母亲”这个角色。

图片[5]-形码输入法的开发与应用-汇一线首码网

86版的《娘》为了兼容“武”,就以一个外框为根,但其实天天演武武的人并不多,倒是有人天天演繁海惠民,而这个一是先取横,后取两点,取根的方法也与正确的笔顺相反。 98版本的词根设计更接近记忆的一般原理,并且纠正了很多笔画顺序的错误,初学者拆开后更容易猜对。

仓颉的字符分割和代码提取是另一种不直观的方式。 仓颉把汉字拆得太多了,先小心翼翼地将汉字拆成部首,然后取出每个部首的第一、二码。 这样做其实还是挺科学的,代码重复率可以很低,但是从入门到日常使用的学习时间会比较长。 所以现在比较流行只拍两码的快递仓颉,但是快递却带回了重码率高的问题。 事实上,正马也有类似的问题,其优缺点与仓颉类似。 对“写”的理解。

简体中文和繁体中文支持

如果前面的都能够克服,那么最后的就确定了。 在这些形码输入法中,最迂腐的正码可以直接杀掉异体字、生僻字。 其他大部分都是基于繁体中文,只有五笔是基于简体中文设计的。 在我的理解中,这可能与音标系统本身需要与键位进行对应有关。 几种传统输入法中,除大易外,均针对简体中文进行了适配,但由于主要服务对象仍是繁体中文,因此在遇到简繁码时,这些输入法均默认优先考虑繁体中文。 另外,Windows等系统自带的输入法并不完全支持使用这些输入法来输入简体中文。

▍使用条码输入的感想

作为一个以简体中文为主的输入器,在这些限制下,五笔似乎是我最方便的选择——是的,从我上面的主观评价可以看出,它并不是最优化的,但每一个要求都可以以一种不太疯狂的方式完成。 而且在每天使用它近一个月之后,我仍然不能慷慨地推荐其他人尝试它,因为在达到足够的速度之前它的好处太低了。

我先说一下我认为的优点。

屏幕上有四个代码并减少了単词选择

四码屏或者五码屏可以说是重码率低的输入法的特权,因为只有在输入码有限制、没有选字负担的情况下,空格键和数字键可以废弃吗? 而且由于简码的存在,输入一个単词的击键次数不会有太大变化。 如果算上输入単词带来的击键次数,整个句子的击键次数甚至会比双拼输入还要多。 少了,尤其是句子里有生僻字的时候,不用来回翻箱倒柜的感觉很好,而且这还是在我输入不流畅的前提下。

习惯了一段时间后,我已经可以直接输入常用的単词了,不用额外考虑字形,速度也有所提高。 而且错别字也显着减少。 毕竟五笔字的错别字打出来的时候,我连应该是什么都猜不出来,只好又检查了一遍。

単词查找和搜索变得简単

另一个明显的优势场景是搜索和単词识别。 与自己写文章不同,当查找一个不认识的字时,我的脑海中或眼睛里必须有这个字的样子。 不再依赖拼音码之后,我终于不需要依赖描述来查字了。 同样的,搜索、查找信息也是如此。 关键词将直接在你的脑海中产生具体的词。 这时候只要打出文字就可以了。 繁体字也可以直接输入,不用临时Ctrl+Shift+F,也不用担心刷生僻字的词频。

剩下的都是大大小小的问题。

输入法支持较差

我原本是双拼用户​​。 展望几年,双拼在各大内置/主流第三方输入法中的适配已经成为问题。 一方面是用户裙体不大,另一方面是解决方案太多。 很难适应内置输入法。 要查看哪些程序的用户较多,您可能还需要关注程序的版权问题。

字形码输入法的支持更是离谱。 我自己的选择是Wubi 98。在我接触到的设备中,只有iOS内置了对Wubi 86、98和New Century的支持。 Windows 原生仅支持使用最广泛的五笔 86。 对于Android,这取决于制造商选择的输入法合作伙伴。 有时五笔支持会被删除。 至于我最喜欢的Gboard,它根本不支持五笔输入法。 我选择了基于 Rime 的相同文本输入法。 可以算是平均水平。 Windows端,对于Wubi 98,我使用wubilex五笔助手替换了原来的秒表,并重新安装了Rime小狼号配置方案。

本来我希望能在电脑上用五笔,在手机上继续双拼,但实际操作后,开始输入混码,只能一起练五笔。

高度依赖码表和同义词库

所有的字形码输入法,或者说所有的输入法,都是基于码表的输入方案。 而这种基于形码汉字的方案甚至支持了単词的输入,也只是作为単字输入的一种辅助。 可以输入的字词取决于码表,大多数五笔输入法不具备自定义字词的功能。 他们只是按照之前写好的码表,或者直接导入写好的外部码表。 至少在我目前的测试中,只有 Rime 可以自动学习输入中的用户単词。

还有一项,我不能说是好是坏,但我觉得还是挺有意义的。

▍忘记写字的启示

其实就输入速度而言,经过三周的日常使用,五笔已经逐渐追上了我日常使用的思维速度,而且我需要切换回双拼来提高速度的次数也越来越少了(我的双拼输入也不太熟练)。

真正让我咔住的是当我突然遇到一个不常用的词,或者当我突然发现不可能拆错字的时候。 对于前者,我需要重新做一遍发音转换成汉字,然后在脑海中拆解的过程。 后者往往是因为我把汉字的笔顺写错了,或者干脆把同音字写错了。 如果不是强迫自己使用字码输入法,我恐怕一直相信自己能一次性写出所有的字形。 例如,瓦片的笔画顺序是最后一个点,龙字右半部分的笔画顺序是横、竖、折、横、竖。 挂钩,三横。

在我的理解中,如果我对这些工具和解决方案不像我那么感兴趣,显然没有必要去学习另一种现在使用起来不方便的输入法。 如果你学会了,大概率会和以前一样,你会多一个输入法。 当你在网上遇到不熟悉的単词并查字典时,会有一个举手输入的方法。 论速度和便捷性,尤其是对于需要创建大量文本的用户来说,恐怕很少有输入法能与动态词频、智能词库的现代音码输入法相媲美。

对我来说,形码输入法是复习汉字的好方法。 一旦我们关注単个汉字,我们就会意识到我们是多么忽视了这些美丽的符号。 我会继续使用五笔输入法,看看我的输入速度能否逐渐赶上之前双拼的水平。 至于以后能否继续坚持,就看是否有输入法可以让五笔98的支持更好了。

温馨提示:本文最后更新于2023-08-22 12:14:43,某些文章具有时效性,若有错误或已失效,请在下方联系网站客服
------本页内容已结束,喜欢请收藏------
© 版权声明
THE END
喜欢就支持一下吧
分享
相关推荐