Skip navigation.

Log in | Sign up

photo of yumumao

yumumao's 水水 Blog(暂停更新,看文章请用代理)

在每一个夜里我从梦里惊醒,看到我的心,他正在向前冲。      

Posts tagged with "拼音加加"

对几种音形码重码率的统计

, , , ...

今天看到有人在拼音加加的论坛上发帖推荐自己的辅助码,其中说到“**辅助码的单字重码组为500组,小鹤双拼的单字重码组为900左右,酷极晚风的重码组为485,其它如搜狗的重码组较多,无法统计”。因为晚风和小鹤我都使用过,使用感觉和帖子里所说的结果有出入(leybyr也说过小鹤的单字重码率和晚风的应该是差不多的),我就自己统计了一下,结果还是很有意思的。以下统计都是用Excel做的。

先统计单字重码:

晚风
全码单字共 7747字
二字及以上重码 440组
三字重码 34 组
重码的次数 474次
单字重码率 6.12%

鹤形自然双拼版
全码单字共 7394字
二字及以上重码 433组
三字及以上重码 34组
四字重码 3组
重码的次数 470次
单字重码率 6.36%

自然风(1)
单字共 7816字
二字重码 1362组
重码的次数 1362次
单字重码率 17.43%

自然风(2)
单字共 8911字次
二字及以上重码 720组
三字及以上重码 44组
四字重码 15组
重码的次数 779次
单字重码率 8.74%

注:
单字重码率=(总字数-单字全码中互不相同的编码数)/总字数,如:12=a、12=b、12=c、34=d、56=e,则总字数是5,互不相同的编码为3种,重码率=(5-3)/5;
全码指四码;
“二字及以上”指同一编码下至少含有两个单字,其它类推;
如果同一编码下有N个字,则记N-1次“重码的次数”,同一汉字不重复计算;
晚风没有三字以上的重码,鹤形最多四字,晚风统计时只考虑全码,未包括一二级简码单字;
鹤形码表音码部分所用为自然双拼,但鹤双拼的结果和这个结果相差无几;
自然风编码并不是每个字都有确切的全码,所以按两种编码方式统计;
自然风(1)编码方式按照“三码有该字则四码不编码该字”进行。故没有重复编码的字,同一编码下也没有二字以上的重码。
自然风(2)有重复编码的情况,故用“字次”来代替字数。这种方法所用编码条数(指不重复的编码条数)增加,降低了重码率,但同一编码下可能有三、四字的重码。

结果显示,leybyr说得对,单字重码率晚风和鹤形编码是差不多的,晚风相比自然风是提高了很多,且最大的进步是编码更规整了,所有单字都有确定的全码。
晚风还有一个特点没能在统计中体现出来,那就是晚风的一二级简码(打一到两个音码,再用“,;/.”四个符号做笔画码上屏,也可以用全码的前三码加一个笔画码上屏),如果把固定的常用字专门用简码输入去除产生重码的全码,晚风的单字重码率完全可能降为0。但这样做就需要增加一定的记忆量了。

仅仅降低单字的重码率还是不够的,我们实际输入的时候不可能完全使用单字,而是以二三四字词为主。这些音形码的二字纯音码和单字全码存在很多重码的情况,于是我又统计了一下它们的编码重码率。

晚风
统计编码共 85074条
两项以上重码 4039组
三项以上重码 404组
四项重码 36组
有重码的编码 4039条
编码重码率 4.75%

鹤形自然双拼版
统计编码共 75039条
两项及以上重码 15150组
三项及以上重码 2756组
四项及以上重码 670组
五项及以上重码 212组
有重码的编码 15150条
编码重码率 20.19%

鹤双拼版
统计编码共 69504条
两项及以上重码 7182组
三项重码 7组
有重码的编码 7182条
编码重码率 10.33%

自然风
统计编码共 103043条
两项及以上重码 11849组
三项及以上重码 1185组
四项及以上重码 576组
五项及以上重码 399组
有重码的编码 11849条
编码重码率 11.50%

注:
编码重码率=需要键选的编码(该编码下出现一个以上的候选项目)数/总编码数
“两项及以上重码”指同一编码下至少有两个键选项目,其它类推;
“有重码的编码”指同一编码下含有一个以上的键选项目,不包括一个。
晚风编码同一编码下最多只有四个键选项目,鹤形七个,自然风十个;
晚风编码的统计包括一二级简码单字;
各个输入法所用词库不同,但基本上是7-10万的常用词库,绝大多数为二、三、四字词(包含单字),编码绝大部分控制在4码以内,晚风部分词有准第五码,即符号笔画码。鹤形自然双拼版的码表未做优化,其它码表都是经过优化的。
这个统计和词汇及词汇辅码的实现方式有很大关系,不同的统计方法对结果的影响可能会很大。

词重码可以通过编码重码反映出来。不过这个重码率受到很多方面的影响,不仅仅是编码规则的效率,所选词汇、码表的优化等等关系都很大,鹤形自然双拼版高达20%的重码率并不是真实反映,因为这里面有很多非词、低频字、三字词三码简拼等,码表优化之后,粗略估计,重码率能够下降到10%-15%之间,还有很多是纯音码,进一步优化码表就很难估计。所以我又统计了鹤双拼的码表,这个码表声码部分是鹤双拼方案,码表是经过优化的,编码重码率就降到了10%,而且三项重码的仅有7组,剩下的重码全部是两项,这样的码表即便有重码,键选效率也应该是非常高的。

相比之下,自然风键选的项目就偏多了,如果按照类似算单字重码率的方法来算,都不做优化的情况下,自然风的重码率应该会高于鹤形自然双拼版。表中的反映不明显,如果做一个曲线就看得出来,鹤形自然双拼版的键选项目数主要集中在三个以内,曲线从4开始陡降,而自然风4-7的曲线随项目数增多并没有明显降低。

酷极晚风的编码效率真是强到“不像话”,编码重码率还不到5%,很大程度上得益于词编码规则中的“笔画简码”,就是用词的末字首笔所代表的笔画码(“,;/.”四个符号)来上屏,比如“好使=hkui/”,这样二字词的编码就丰富了,重码率就大大降低了。严格来讲,统计的时候把笔画码完全按照一位编码来对待,这对其它编码是不公平的,笔画码实际上也是一种键选方式,只是这种键选一般不用看屏幕。
如果鹤形采用五码输入二字词重码也会大大降低,但是效率还是不如晚风的这种方式,因为笔画码是做“上屏键”而并不等同于增加一位编码,如果你了解拼音加加的“三重码”技术应该更容易理解这个“上屏键”的意义。不得不说,晚风的这种符号笔画码的设计非常强。

综合起来看,三种编码中最适合“盲打(不键选)”的编码当然是晚风。但日常输入的效率就不好说了,以上的三种编码都很优秀,自然风虽然重码略高,特别是单字能力不够强,但它的编码规则最简单,拆字速度是最快的,最大的缺点也是由于规则简单而带来的全码不确定性。如果仅仅做间接辅助码,它的效率也很好。

晚风和鹤形的编码规则都比较严谨且看起来有些象,都是首尾取码,他们很多部件的编码也相同,但他们的拆字理念其实有蛮大的差异,举个例:豫,晚风的编码为“yuyx”,形码拆成“予”和“象”,鹤形双拼版的编码为“yusn”,首尾形码为“”和“捺”。看得出,晚风和自然风还是更接近的,而鹤形的规则简单地说就是首尾取小字,先看取到的部件是否独体字,是就取,如果不是,看是否部首,如果都不是,则取笔划。拆多了就会发现,虽然晚风的方式更容易学习,但鹤形的方式其实更规整。再看一个字体会一下:森,晚风取部件为“木”和“林”,鹤形取部件为“木”和“木”。意会一下(*^__^*)。如果要提高单字的输入效率,晚风把记忆量放在了简码上,这样做可以减少重码。而鹤形把记忆量放在了独体字上,这样可以提高拆字速度。哪种方式适合自己,这可能就见仁见智了,从我的体会来看,如果不是为了盲打,拆字速度的提高可能会更有帮助,这也是我最终选择鹤形的原因。我要啦免费统计

还有一点需要说的就是这个编码重码的统计,参考价值是有限的,在同为音形码之间比较比较还可以,和全拼比较就不合适了。实际上用类似的统计方法,纯拼音输入法选择常用的6、7万词,重码率甚至可以低到15%-10%(不包含单字),因为相同编码下可能有很多重码,但大多数时候你只会用其中的一两个,把不常用的去掉,剩下的重码率就很低了。但这样的方法用在提高纯拼音输入法盲打正确率上并不合适,因为这样一来,次常用和不常用的词就只能用单字输入,而纯拼音单字常用7000字的重码率高达95%(如果加上罕用字,重码率就是100%,翻翻新华字典就知道,有几个读音下只有一个字的)。

要提高纯拼音输入法的“盲打(不键选)”正确率,更好的途径应该是优化词序和加强上下文联系(智能组词、整句智能性等等),而增强上下文联系就需要更大的语料库和更全的词库,这样一来,重码率就难以低下来了。事实上,音形码无重码的部分可以100%正确,有重码的部分也可能做到很高的不键选正确率,而单字的重码率更是大大低于纯拼音输入法,这使得音形码比纯拼音输入法更适合“看打”。日常使用中我们更多用的是“想打”和“听打”,并不要求重码率有多低,所以完全用音形码输入看来意义也不大,大部分音码输入的过程中,通过形码辅助来提高键选的效率这就很好了。

以我的看法,字词输入法的发展方向是添加提高键选效率的辅助方式和低重码的单字输入方法,而纯拼音输入难免会向整句智能的方向发展(或者其它智能方式,但目前通过上下文联系的整句智能是一个比较好的方式)。目前,加形辅助输入方式的字词输入法发展得更好,准确率可以明显高于纯拼音智能输入方式,而纯拼音智能方式(整句智能输入法为代表)最大的好处就是不用额外的学习,准确率也够用。整句智能输入法虽然也能用字词的方式输入,但目前这两种发展方向是分化了的。就像前面说到的,整句智能的发展牺牲了低重码率的追求,它主要通过智能来降低键选次数从而弥补高重码率带来的问题,而字词方式需要在一定程度上降低重码率来提高键选效率。简单说,他们提高输入效率的方法,一个是降低键选的次数,一个是缩短每次键选的时间。虽然字词方式也可以加强智能性,整句智能方式也可以强加字词模式,但现在还没有找到很好的方法把这两种发展方向整合到一起。

附::star: 晚风全码单字.txt

换用鹤形辅助码

, , , ...

昨天换用鹤形辅助码了,正在熟悉中。鹤形编码和自然风还是有些相似的,很多部件的编码相同,上手不难。不过拆字规则不同,是首尾取部件,这一点和晚风类似。鹤形的编码比自然风要规整得多,每一字都有全码,严格按照规则的话,争议的编码很少。相比之下,自然风就编码规则就很不严密了,比如“刘”字按照自然风编码,“lqwd”和“lqdw”都是可以的,这样的字还不少。这正因为这个问题,自然风编码被作者放弃了,开发了新的晚风编码。

现在拼音加加能够自定义辅助码了,如果仅仅作为辅助码来使用而不是单独的输入法,自然风的这种拆字的“随性”在某些时候反而成了优点。自然风很多时候只要知道大概的字形就够了,不一定要知道确切写法和笔划顺序。比如“蠹”字,就算你不记得上半部分怎么写了,只要知道它里面有个“虫”,就可以用“dui”输出了。再比如“为”字,如果你不记得是先写“丶”还是先写“”,取明显的部件“力”,用“wzl”就可以输出了。这种取明显部件的办法使得拆字速度很快,如果使用音码输入时偶尔用形码辅助,这样的拆字方式可以最大程度地避免思路被打断。但缺点也是明显的,取码的不确定性影响了速度的进一步提高。

试用了一下鹤形,觉得作为拼音加加的辅助码挺合适的,编码规则更加严密,引进独体字的方式拆字也很直观,只是更加严密的规则一定程度上使得拆字的思维速度变慢了,但是只要用了形码,听打和想打的时候都难免会影响思路,关键在拆字方式的直观性和熟练程度了。所以形码在看打的时候有优势,而听打的速记,一般都用音码。而音形码兼有音码和形码的特点,如果使用得好,可以找到一个比较好的平衡点,在日常的使用中获得高效率。

本来也想过用晚风编码,它和自然风一脉相承,很多字是类似的,只是更加规整,每个字都有四位的全码,但它的全码重码并不比鹤形的少。另外它使用了笔划简码的方式来输入单字,这个方法虽好,但用符号作笔画码会和加加的一些功能键冲突(比如,。翻页)。加上末字首划的词编码方式和单字编码规则不同,要在加加里实现需要大量的自定义编码,而我并不想完全换用音形码,只是想在纯音码下偶尔用形码辅助来减少重码以提高键选效率和单字输入效率。选来选去,还是鹤形更加合适一些,从自然码过渡也很容易。音码部分还是继续用自然码,鹤双拼虽然好,但换双拼方案太痛苦了(-__-!)……

唯一的问题就是部分单字的全码会和常用词冲突,jiie=机车/辑,所以我把前三码全部做了自定义编码,让前三码能出全码字,然后排好字序,让常用字在前,这样用jii就能输入“辑”字,反正我用三码完全是为了输入单字,现在加加的自定义辅助码也支持这种输入方式,并不一定要通过自定义编码。我希望加加下一个版本能支持五码输入二字词(声韵声韵辅),这样单字全码和二字词的冲突就解决了。我要啦免费统计

鹤形辅助码::star: hxfzm.txt
自定义编码(声码部分为自然双拼)::star: 鹤形自定义.txt
供拼音加加输入法使用。这个自定义编码小鹤的网盘里也提供了一个,但我发现那个编码没有把全码提供全,我就按照辅助码编了辅助码中每个字的全码和三码。
酷极平台下的自然双拼版小鹤::star: http://www.box.net/shared/hpnyfxtq3f

补充:

形方案是因为原来风形第四码的不清晰,使得无法把单字的效率再提升一步,而希望改变的。对于晚风的形还是觉得复杂了点,会有不少成字字根不认识,还有为了避免重码的同声母次大字,都让人不能满意,标点笔画码增加了简码,也增加了记忆量和难度。

今天才看到老鹤在留言板里发的帖子,看来我的印象是对的,鹤形和晚风一样,都是从风码的基础上发展来的,他也和我一样不习惯笔画简码。对于我来说,偶尔作为辅助码来使用,增加记忆量对于效率的提高并不明显,晚风就不如鹤形实用了。

对于全码和二字词的冲突,还是可以通过优化自定义编码(和/或置顶)来解决的,我取消了一千八百多个全码的自定义,三码的时候在前两位的字就没有必要出全码了,再把第二位的字适当置顶到二码和单字母的首位,单字的输入就方便了很多,又基本上避免了定义完全的全码和二字词的冲突。

比较好用的鹤形定义编码词库和自定义辅助码:http://files.myopera.com/yumumao/files/鹤形编码.rar

搜狗输入法和拼音加加的使用体会

, , , ...

搜狗输入法已经出正式版了,改动不是很大,主要是修改了一些BUG。

就我目前的体会,搜狗和拼音加加相比,有两个明显的优点:
  • 1,智能组词(或者说是短语输入)明显好于加加,虽然它不是一个整句输入法,但它在短句输入的准确率上,已经很不错了;
  • 2,启动和上屏速度要比拼音加加快。
按我的使用习惯,还有几个地方不如加加:
  • 1,没有辅助码;
  • 2,双拼下不能使用简拼(现在的加加在双拼和简拼字词的排序问题上也还是有不合适的地方);
  • 3,没有分词库,且词库不开放;
  • 4,单字不能手动固顶;
  • 5,自定义编码(或者说是自定义短语)有行数的限制(经测试,限制为10001条,这对于我显然是不够用的,GBK汉字的笔画,风码单字还有医学相关的编码,这些都是我常用的,加起来有近六万条)。
我现在希望拼音加加改进的地方:
  • 1,完善GBK汉字的辅助码,这在输入人名的时候尤其有用;
  • 2,改善启动和上屏速度,现在的拼音加加偶尔会出现“上屏停滞”的现象(或者说“假死”现象。听说加加在元旦前会推出全新的版本,将放弃TXT格式的词库,但不影响词库的自由导入导出,据说这样可以大大提高程序速度。只是希望,取消了TXT格式的词库之后,仍能保留分词库的管理模式,方便地随时排序和增删。);
  • 3,改进双拼字词和简拼字词混排的方式,以及它们词频互相影响的问题,比如输入“ybui”,“又不是”可能会排在“又是”的前面,我觉得输入偶数个字母的时候,应该让双拼字词在前面,输入奇数个字母的时候,可以让简拼字词优先,这样比较好。
至于有些人说搜狗的首选准确率要高于拼音加加的问题,我是这样体会的:
在使用拼音加加的时候,首选准确率很大程度上取决于对词库和分词库功能的利用,如果有比较好的首选词、次选词词库,并按合适的顺序排列,可以大大提高首选准确率。

从我近一段时间的试用来看,搜狗在努力地实现加加和紫光的功能,然后再在部分功能上进行改进和加强,并且它已经在很大程度上做到了,但并没有实际的突破。
我的大体感觉是,搜狗在定位上和拼音加加是不同的,它不需要太多的驯服,通用性好,和加加相比,更适合做一个普及型的拼音输入法,但如果有更个性化、更细节上的要求,还是加加更好些。

相关帖子:
我要啦免费统计

拼音加加下载(4.2新版内测中)

, , ,

目前的版本:安装版5.0,便携版4.9(2007年12月21日)去论坛讨论

测试有风险,请备份好自己的数据!要全新安装测试版。
安装方法:先运行4.2版目录下的“卸载”,把jjbx.ime和jjbx64.ime两个文件拷贝到便携版的目录下,再运行“安装”,如果安装提示失败,需要重新启动计算机再运行“安装”。
建议安装后,再把jjbx.ime文件拷贝到C:\WINDOWS\system32里面验证一下,如果显示替换的文件日期一模一样,表示已经成功安装,如果日期不一样,请用最新的jjbx.ime文件替换旧的文件。

2007年12月21日 加加输入法安装版5.0,便携版4.9公测版。
安装版与便携版的差别不大。便携版之所以为4.9,是为了以后在更新及修补Bug的时候,区别版本号而预留的空间。
相比4.2.0.16,主要是加强速度和稳定性,功能上主要改变有:
增加了上下箭头修改功能;
增加了辅助码“仅查询单字”选项;
增加了连续辅助码输入模式。

下载地址:
5.0测试版,安装版:
ftp://www.jjime.com/jjsetup50.rar
ftp://down.jjime.com/jjsetup50.rar

4.9测试版,便携版:
ftp://www.jjime.com/jjbxb4_9.rar
ftp://down.jjime.com/jjbxb4_9.rar

历史版本:
4.2x(2007年8月29日-2007年11月14日 共12次更新)

11-14 版本 4.2.0.16
主要改进:
语料库更新。
优化组词算法。
增加智能调频的选项(但不修改用户词库中的首选)。
增加成组符号连续输入的选项。
成组符号连续输入后,继续输入字母可清除成组符号的编码并替换。
增加backspace自动删词的选项。
解决某些软件中输入板晃动的问题。
解决word中出现输入的字不出现,继续输入字母时再出现的问题。
解决ppt中输入符号时出现的问题。
解决固顶词输入时不改变用户库频度的问题。
全拼双拼按钮点击可以进行切换。
进入辅助码后选字或词,保留在辅助码状态。
辅助码允许关闭笔画码。
增加自定义辅助码选项,允许用户使用自己定义的辅助码(\jjbxb\py\fzm目录下)。
临时文件从jjbxb子目录移走,减少u盘占用。
光标不再闪烁,插字光标进入辅助码区后,编码区的光标以一半大小的形式继续显示。
双拼增加关闭简拼的选项,增加长词选项。
双拼增加直接辅助码输入单字的选项(这一部分还有待继续完善)。
其他细微修正。

下载地址:(这两个ftp服务器只允许单线程下载。建议用迅雷下载,可下载快些,也可减少服务器压力)
ftp://www.jjime.com/jjbxb42_0_16.rar
ftp://down.jjime.com/jjbxb42_0_16.rar

10-24 版本 4.2.0.15
●词库以及语料库更新
●加回ctrl+←→拼音快速移动功能
●修正powerpoint2007下数字不能连续输入的问题
完整的便携版下载地址:
网通:
ftp://www.jjime.com/jjbxb42_0_15.rar
其他:
ftp://down.jjime.com/jjbxb42_0_15.rar
相关帖子:
http://bbs.jjol.cn/showthread.php?t=1936

9-30 版本号 4.2.0.13
●修改双拼自定义下o,uo等两个韵母使用同一个字母时可能会出现问题的bug
●修改双拼下输入i'j时翻页可能会出现输入板消失的问题。
●修改超级简拼,使之符合zhchsh-zcs的设置。
●增加backspace键删除功能。新造词如果在3秒内使用这个键删除,则不会记忆到用户词库里面去。
下载更新补丁:
http://bbs.jjol.cn/attachment.php?at...7&d=1191166781
完整的便携版下载地址:
网通:
www.jjime.com/jjbxb42.rar
其他:
down.jjime.cn/jjbxb42.rar

9-28 版本号 4.2.0.13
●增加自定义双拼功能。
●双拼继续完善,增加简拼。
●增加关于用户词库限制大小的选项。
●自动组词时关闭部分免隔音符。
●修正一个可能导致explorer.exe出错的bug。
●修正竖排显示时,部分成组符号不能显示的问题。
●修正限制词组重码页数时,成组符号不能完全显示的问题。
●修正在Vista及IE7下的兼容性问题(强调)

9-19 版本号 4.2.0.12
+双拼开始提供测试,增加一种双拼的拼词模式(仍在继续完善中),旧有拼词模式通过选项选用。
+增加“焦点保留”选项,在某些应用中失去焦点时仍然保留输入版内容。
+恢复词组重码限制选项功能。
+防止竖排高度跳动。
+修正当设置首页重码个数大于其他页重码个数时不能删除词组的问题。
+基础词库进行了更新。后续将对豪华补充词库进行大量的精简优化。

9-11 版本号4.2.0.11
+继续修正免隔音符引起的bug
+【`】键功能改成【 i i 】作为引导键,避免冲突。
+增加皮肤及输入面板透明度设置
+修正输入yue时首页可能只出现一个重码的bug等。
+修正其他的错误。

4.2.0.10版 9-7更新
+修正免隔音符引起的一些bug
+增加“不记忆智能组词”的选项
+字词频度调整可以禁用了,“渐进”式调整还没有实现
+修正67890直接输入辅助码时小键盘不能用于输入英文的问题
+“关于”对话框里面显示详细的版本号,目前最新版本是4.2.0.10
+皮肤代码优化。
下载:
http://bbs.jjol.cn/attachment.php?at...6&d=1188918810
最好下载这个完全版本升级后再测试:
http://www.jjime.com/jjbxb42.rar

4.2版 9-4更新
ayang等输入中的单元音也按声母处理
dan等单字全拼不做简拼处理,在其后继续输入一个隔音符时按简拼查询。
增加免隔音符的开关。免隔音符功能还会继续完善,已经习惯输入隔音符的朋友可以关闭此开关。
解决0键到单字后不能回翻页的问题
解决字词分页显示时,输入wjx,符号不在第一页显示的问题
解决diaoke无法找到雕刻的问题

9-3 23:00更新
+解决在开启模糊音和智能组词的情况下,输入某些拼音组合可能会导致失去响应。
+修改免隔音符的优先度,更符合以往习惯
+增加不完整拼音输入的开关
+解决wow下ctrl键shift键锁住的问题

4.2版 8-31
+成组符号不能回翻页的问题
+翻页键选项不能全部去掉的问题
+皮肤增加了自定义词组的颜色
+不使用数字键翻页,第二页也可以设置到超过3个
+解决【`】功能键数字不能键选的问题

4.2版 8-30
+“选择皮肤”菜单项中增加“竖排显示”的开关
+解决加加皮肤重码区“候选(灰)”颜色不管用
+模糊音的问题,比如设置了in=ing,输入yingai无法输入“应该”,tabuguan 出现的是“他不顾按”而不是“他不管”已经类似的问题

4.2版 2007年8月29日
+增加【`】键为输入法的功能快捷键。
+完全兼容Vista系统。
+兼容IE7。
+解决在opera下输入的兼容问题。
+超级简拼功能。输入byez、bgee,可以得到【不一而足、不过尔尔】这样的词组。
+〇添加进字库。输入ling可以得到【〇】这个字了。
+修正组词的时候,检索不到词库已有词组的Bug+修正er断字的Bug
+完善了提示区里面部分帮助文字
+成组符号连续输入功能。(esc键退出当前候选框。)
+首页与其他页码可以设置不同的重码。
+进一步完善笔画输入功能。
+增加67890笔画输入功能
+增加竖排输入框选项及竖排皮肤的制作。
+增强了稳定性。
+基础词库更新(词条30万)


4.01-4.1A(2006年8月29日-2007年8月2日 共9次更新)

加加输入法4.1A修正版本,解决杀软误杀。 (2007年8月2日)
最近杀毒软件误杀加加输入法,造成加加输入法不能正常使用,现在提供新版本,专门解决误杀问题,请按照说明及您使用的情况酌情更换新版本。
如果您的使用没有问题,可以不升级。

第一个链接提供给全新安装加加输入法的用户;
第二个链接,是已经安装加加输入法的用户,只替换相应的文件即可。

注意您使用的版本区别,建议使用便携版,呵呵。

1、便携版下载地址
http://www.jjime.com/jjbxb41a.rar
(全新安装)
http://www.jjime.com/jiajiabx_exe.rar
(下载后只要到加加输入法的安装目录替换掉这个文件就可以了。)

2、安装版:
http://www.jjime.com/jjsetup41a.rar
(全新安装)
http://www.jjime.com/jiajiasr_exe.rar
(只要替换掉这个文件即可)

加加输入法开发组
2007年8月2日

加加输入法4.1正式版发布。12月1日

2006年11月30日 4.1正式版
  ·更新优化基础词库,词组更多更准确,输入更加方便。
  ·改进以词定字功能。
·增加了双拼中可以使用 ; ' 键选择第二三重码的选项。
·改进对firefox浏览器的支持,实现光标跟随。
·默认打开GBK字符集开关。
·修正取消使用固顶重码后,单字首字仍然固顶的问题。

便携版安装方法:

请先在加加输入法中备份“个人词库及使用习惯”。
再点击uninst卸载旧版的加加便携版,然后解压新的加加便携版覆盖安装,再点击setup文件,出现提示“安装成功”。
最后选用加加输入法便携版,导入刚才保存的备份文件。
如果在卸载过程中提示有文件正在使用不能删除,请重新启动计算机再继续安装。

安装版安装方法:

把文件解压后,运行其中的setup.exe,看到“安装成功”的提示,就可以使用了。uninst.exe用于卸载,卸载完成同时也存盘了。
注意安装需要有“管理员”运行权限,在vista下可以用右键点击“setup.exe”后,选择“用管理员账户运行”。

下载地址:
http://www.jjime.com/temp/jjbxb41.rar
(便携版)
http://www.jjime.com/temp/jjsetup41.rar
(安装版)

词库的更新说明:
;加加输入法基础词库,20万词条。
;加加开发组参考大量权威语料进行错词校正。
;部分多音字进行双音设置,输入更方便、准确率更高、垃圾词更少。
;本词库仅为加加输入法专用,未经允许,其他任何组织和团体不得使用本词库。
;本词库包含独有特征码以发现侵权行为。
;许传友(齐齐哈尔●齐车集团)为本词库做出了巨大贡献,谨以致谢。
;2006年11月30日。加加开发组。

——————
其他说明:加加官方携带的词库格式为cky格式,主要是为了稳定、后续开发着想,以后的词库可能会考虑直接从词库里面删除错词的操作方式。对于txt格式的词库照样支持,官方自带的词库也可以不使用,所以原则上并不影响使用。

需要注意的是:_pydel文件也改为与官方词库一样的格式。以后这个问题开发组会进行解决,并且会比现在的方式会更好。

2006年10月28日 beta6版
1、添加标点符号的自定义功能。
2、增加GBK汉字的笔画输入(感谢徐孟罗的鼎力支持),增加GBK中部分简体汉字的辅助码。
3、增加GBK字符集选项开关,默认关闭,只选择简体字符集。
4、增加地址栏搜索总开关选项,设置更清晰。
5、增加0键翻页直接到单字功能。
6、增加翻页直接跳到辅助码模式的选项,并且增加在辅助码模式下可以直接删词。
7、增加双拼简拼开关,默认关闭双拼中的简拼。
8、恢复输入数字2006输出“二〇〇六”这个功能。
9、增强自定义词库的自定义功能,编码部分可以支持数字符号及大写字母(首个字符必须是字母或数字)。
10、修正“鹰”、“膺”等字的笔画辅助码。
11、拼音修正,添加“骑ji”“忾xi”“房pang”“忒tei”,删除“水san”
12、解决在魔兽世界中宏编辑界面的ctrl键锁定问题,以及游戏中shift键锁定问题(还需要测试验证)
13、解决在autocad2007中数字及符号输入变成两个的问题。
14、修正辅助码显示和皮肤设计对话框中不一致的问题。
--加加开发组
2006年10月28日

——
关于便携版的安装:
请先在加加输入法中备份“个人词库及使用习惯”。
再点击uninst卸载旧版的加加便携版,然后解压新的加加便携版覆盖安装,再点击setup文件,出现提示“安装成功”。 最后选用加加输入法便携版,导入刚才保存的备份文件。
如果在卸载过程中提示有文件正在使用不能删除,请重新启动计算机再继续安装。



2006年11月6日便携版更新

4.01b5以及便携版b5(2006年9月19日)
1、增加浏览器地址栏高级搜索功能。在地址栏输入中文关键字后按回车键即可搜索。输入歌曲名后再紧接输入mp后按回车就可以搜索mp3。用类似方式还可以方便的搜索歌词、图片和新闻。更多功能可以在“设置地址栏搜索”中看到并设置。
2、增加长词输入设置,可以根据个人习惯调整,默认设置改为输入5个拼音后开始显示长词。
3、增加单字和词组重码分页显示的选项,默认设置为单字和词组重码可以同页显示。
4、增加全拼中使用"v"键引导输入英文的选项。
5、增加标点符号推字上屏的选项。
6、输入法状态提示条更改为在屏幕右下角显示,并可以用鼠标自由移动并记忆位置。

关于加加的开发的一些简短说明:
  输入法的使用每个人都有不同的使用偏好和习惯,通常这些习惯并不存在好坏的区别。所以加加现在的目标是在探索更加方便的功能的同时,尽量兼顾现有的使用习惯,如果有冲突产生,则将以选项的方式提供选择,beta5版仅仅是这种尝试的开始,以后还会提供更多的选择。我们会尽量多的满足各位朋友的需求,虽如此,有些功能可能无法或是比较难以提供,也有些是暂时还没有来得及提供,又或者有些软件中的兼容性问题还没有修正,也请您谅解。
  beta5中输入法状态提示窗改成了不自动在标题栏中显示,这是由于我们发现不使用标准标题栏的软件越来越多,我们无法一一追踪这些变化,新的方式兼容性也会更好一些,请喜欢以前的骑标的朋友们理解。

  加加开发组 二〇〇六年九月十九日
九月二十一日便携版更新

十月十日解决GBK汉字的辅助码:bihua.bin(使用方法:覆盖安装目录下的同名文件)

2006年9月9日4.01b4版
1、联想长词不再显示在首选位置。
2、修正“双拼键位提示”无法显示的问题。
3、修正部分设置相冲突的问题。
4、增加了“数字后面自动跟英文标点”的选项。
5、增加了“开机启动jiajiasr进程”的选项。

2006年9月8日4.01b3
1、修正设成默认输入法后关机慢及词库不保存的问题。
2、地址栏搜索功能增加中英文的搜索引擎设置。
3、改正数字〇。
4、搜索的问题,可以自己设置了,右键点击骑标~~
5、使用4.0B的用户,保存的jj4文件,4.01B3可以正常导入,但是在导出的时候,就是使用b3的方式导出了。以前的用户的资料不会丢失。
6、解决输入法设置里面点击属性打不开的bug

2006年9月1日4.01修正版
测试版仅仅是用来给一些感兴趣的论友测试,以便于找出bug并且进行修正的,开发组这么频繁地推出新版本,也足以看出开发组确实在认真打造拼音加加。大家发现什么bug,可以尽情反馈。拼音加加的春天来了?
1、www.163.com也可以输入了,
2、解决vista下更换皮肤的问题。
3、自定义词库加入“jt=@date2()”,可以输入“二○○六年九月一日”格式的日期了,不过也可以放到单个符号表中用,好像更方便。

2006年8月30日:拼音加加4.01修正版
1、该测试版建议不要设成默认输入法。设成默认输入法后还有一些兼容性问题,目前正在解决中。
2、支持Vista,在Vista下安装说明:用鼠标右键点击“setup.exe”,选择“用管理员账号运行”。
3、增加自动检查更新版本的功能。(可选择安装与否)
4、增加输入繁体字的功能。
5、自定义词库的编码改为最大30,行数1000万。(经过测试,编码完全可以达到50,行数太大了,没有测试)
6、备份文件中增加了皮肤以及用户自己增加的其他拼音词库 (所有的文件都不会丢失了)
7、修正“招行”“人行”等一类自造词不能正确保存的错误。
8、修正用Ctrl+数字键删除词组后显示跳回首页的问题。
9、修正一些多线程程序下浮标栏显示出现错误的问题。
10、改进标点符号输入的说明帮助文件
11、修正“不显示提示信息”选项无效的问题。
12、增加了翻页键的自动识别功能。比如说设置了用“,。”键翻页,这两个键既可以翻页也可以用来输入跟在英文后的标点。比如输入网址“www.jjol.cn”或是“a=b+c”一类的表达式就可以一次性输入了。(有些问题,需要继续修正,呵呵)
13、建议:安装完后建议重启机器。

拼音加加测试版4.01 2006年8月29日
1、该测试版建议不要设成默认输入法。设成默认输入法后还有一些兼容性问题,目前正在解决中。
2、支持Vista,在Vista下安装说明:用鼠标右键点击“setup.exe”,选择“用管理员账号运行”。
3、增加自动检查更新版本的功能。
4、增加输入繁体汉字的功能。
5、自定义词库的编码改为最大30,行数1000万。
6、备份文件中增加了皮肤以及用户自己增加的其他拼音词库。
7、修正“招行”“人行”等一类自造词不能正确保存的错误。
8、修正用Ctrl+数字键删除词组后显示跳回首页的问题。
9、修正一些多线程程序下浮标栏显示出现错误的问题。
10、改进标点符号输入的说明帮助文件
11、增加“不显示提示信息”选项。

我要啦免费统计

拼音加加4.01测试版发布

, , , ...

加加4.01放出测试版了。下载地址::star: 点击这里下载

试用了一下,说说初步印象。

新版本可以和从前的4.0B平滑过渡,4.0B的设置文件,设置习惯,皮肤,词库,固顶字库,自定义编码,符号编码等等都可以用于新版本。
该测试版支持繁体输入了,和hhhhwwww修改的2.x系列版本的繁体输入效果类似,不过它的重码区显示的是繁体字。
加加的进程不会长期滞留在内存中了。这点改变我喜欢。
输入过程中,词组和单字依然不能出现在同一屏,本来以为新版本能够改善这一点的。
GBK汉字还是不能用辅助码,但hhhhwwww修改的2.x版本能够对GBK汉字使用辅助码,比如我想输入李璟的“璟”字,如下图:可以使用辅助码的版本是不是方便多了。

总的来说,我觉得这个版本对于我的使用,并没有太大的改变,它只是加入了繁体输入,还有缩短了进程在内存中的滞留时间。而这两点改变对于我都没有太大的作用。
现在我倒是越来越喜欢用hhhhwwww修改的2.x版本了,同样也有繁体输入,辅助码也比4.x的好用,只有几个小小的缺点:1,就是不能通过ctrl+数字键以及ctrl+shift+数字键来自由调整候选词的顺序;2,内存占用似乎有点大;3,用户词库的管理不够好。

要是新版的加加能够做些更加适合我的改变,比如增加GBK汉字的辅助码,那我会很高兴的。现在我就不更换了,还是等正式版的便携版出来了之后再说吧(*^__^*)。
附上新版加加的更新日志:

1、该测试版建议不要设成默认输入法。设成默认输入法后还有一些兼容性问题,目前正在解决中。
2、支持Vista,在Vista下安装说明:用鼠标右键点击“setup.exe”,选择“用管理员账号运行”。
3、增加自动检查更新版本的功能。(可选择安装与否)
4、增加输入繁体汉字的功能。
5、自定义词库的编码改为最大30,行数1000万。(经过测试,编码完全可以达到50,行数太大了,没有测试)
6、备份文件中增加了皮肤以及用户自己增加的其他拼音词库 (所有的文件都不会丢失了)
7、修正“招行”“人行”等一类自造词不能正确保存的错误。
8、修正用Ctrl+数字键删除词组后显示跳回首页的问题。
9、修正一些多线程程序下浮标栏显示出现错误的问题。
10、改进标点符号输入的说明帮助文件
11、增加“不显示提示信息”选项。(但是这个选项好像是个摆设)

我要啦免费统计

拼音加加自定义编码(医学相关词)

, , ,

在丁香园里看到一个拼音加加医学版。觉得还蛮不错的。

它是把加加的便携版添加了一些医学词库,还有自定义编码然后做成了安装程序。
它的词库和其它的设置并没有什么突出的,作为便携版,也不是特别的好用,但是那个自定义编码真是不错。可以方便地输入很多诊断、疾病的简称,还有很多中英文混合的化学名称。

我把它的自定义编码单独拿出来,大家取用吧,附上说明:

1、Medtiger@DXY.cn整理的常用医学缩略语、医学符号、单位自编码方案
------------------------
编码构成:英文缩写,拼音字头
本部分编码包括常用的医学缩略语、医学符号、单位自编码,使用其英文缩写或拼音字头直接输入。
如:输入aids可输出“艾滋病”、“获得性免疫缺乏综合征”,输入pxy可输出“P<0.05”、“P<0.01”、“P<0.001”、“P<”;输入aef可输出“α-”、“α”;输入hm可输出“mmol”、“mmol/L”、“mmHg”。
用户可根据自己的专业情况自行添加或修改。
==========================================================================
2、Medtiger@DXY.cn整理的ICD-9诊断名词自编码
编码构成:V+拼音字头
------------------------
主要是部分含有英文字母/罗马字母的诊断名词设置了自编码以方便输入。
这一部分自编码和下一部分医学词条自编码输入方案采用了v作为切换开关,主要是考虑到词条太多,直接使用拼音字头作为自编码可能会与拼音加加的其他词库产生大量的重码,采用v切换可以避免这种情况;但使用双拼的朋友则不能使用这一套编码(v与双拼输入冲突),可自行删除这些编码,或者将所有v、vv开头的自编码改成i、ii开头。

其实使用双拼并不冲突,只不过有可能和其它词汇重码而已,但这里均用v+六码,重码的可能性很小。再着说了,v虽然是zh的编码,但i也是ch的编码,要是真的冲突,改了也没用。不过这些编码的拼音字头要按照全拼的字头就是了,zh就是z,而不是双拼里的v。--yumumao

==========================================================================
3、Medtiger@DXY.cn制作的医学词条自编码输入方案
编码构成:V+拼音字头
------------------------
本编码主要是为了解决含有数字、罗马数字、希腊字母、英文字母的词条的混合输入问题,比如这样的词条:α-氨基-β,β-二甲基-γ-羟基丁酸,Brachmann-De Lange综合征……。经过自编码简化后,避免了在中英文、小键盘/成组符号之间频繁切换的麻烦。
说明:
1)、输入v+医学词条的前6位拼音字头,即可输出完整的词条。
2)、0-9的数字和Ⅰ~Ⅻ的罗马数字按照其中文拼音字头输入;英文字母按照原型输入;α、β、γ等希腊字母按照英文注音的首字输入。注意几个希腊字母的英文注音字头与中文习惯读音差异:ε(e),η(e),θ(t),ξ(x),ω(o)。
3)、逗号(,)、半角引号(')、连接号(-)、括号(()、[])、加号(+)、反斜杠(/)不输入编码。
4)、例:vaajsqj=α-氨基-3-羟基-5-甲基-4-异唑丙酸;vbrachm=Brachmann-De Lange综合征;vyzsszx=因子ⅩⅢ转酰胺基酶;vayescs=α1,24-促肾上腺皮质激素。
5)、由于词条繁多(将近3万),未及一一核对,错谬之处在所难免,请在使用中自行较正。

自定义编码的下载地址::star: medjj.rar

声明:内容取自Medtiger@DXY.cn的“拼音加加医学增强版(丁香园版)2.0”,感谢medtiger的辛勤劳动。

原帖地址:http://www.dxy.cn/bbs/post/view?bid=10&id=5575535&sty=1&tpg=2&ppg=1&age=0
(需注册才能察看)

相关贴:一个拼音加加的医学词库&#x6211&#x8981&#x5566&#x514D&#x8D39&#x7EDF&#x8BA1