• 休闲生活
  • 教育教学
  • 经济贸易
  • 政法军事
  • 人文社科
  • 农林牧渔
  • 信息科技
  • 建筑房产
  • 环境安全
  • 当前位置: 达达文档网 > 达达文库 > 农林牧渔 > 正文

    词库聚合类词典外壳App比较研究

    时间:2021-01-12 08:00:02 来源:达达文档网 本文已影响 达达文档网手机站

    摘要文章通过对当前主流的几种聚合类词典外壳软件的对比分析,探讨各软件对各类词库的读取状况、功能设计、应用,以及词库扩展性。此外,文章还结合当前“互联网+”的特征,对词典App的功能设计及发展提出一些参考性建议。

    关键词聚合类词典软件EBWinGoldenDictEudic

    一、 研究背景及视点

    随着机器翻译研究的推进,电子词典在20世纪40年代登上了历史舞台,80年代起引起了人们的关注,并随着PC的普及获得了快速发展,产生了多种实体电子词典和非实体电子词典。实体电子词典把词典内容固化于芯片或内置的存储介质之内,再辅以相应的硬件及机器外壳。非实体电子词典并不依存于具体的芯片或硬件机器,而是以各类CDROM、App、類似于程序的词库格式、网络在线查询等形式存在。关于这类问题的相关研究,可参见冯建明(2008),高永伟、李洁(2000),李东、解建和(2000),张锦文(2001),章宜华(2001),张淑玲(2005)等。

    近年来,随着智能手机、平板电脑的迅猛发展和普及,新型非实体电子词典如雨后春笋般涌现,其中具有代表性的是独立的词典App及各类词典外壳软件。

    独立的词典App数量众多。大部分口碑不错的传统词典都被制作成了移动终端上的应用,有iOS及Android版App。

    词典外壳类软件的特点是程序本身不带有任何内容,只是一个拥有多种功能的词典外壳,可以读取一种或多种格式的数字词典,并显示词典正文内容、单词或例句的发音、图像、影像等相关信息。目前主要有俄罗斯开发的ABBYY Lingvo、GoldenDict,中国开发的lingoes、StarDict、Mdict、Eudic、Bluedict,日本开发的EBWin series、DDWin、Logovista、Viewing、Logophile,以色列开发的Babylon等。这些软件中有很多都跨多平台,具有广泛的应用性。如EBWin series有windows版的EBWin,安卓和苹果版的EBPocket,Mac OS X版的EBMac;GoldenDict有电脑版和安卓版;Eudic跟EBWin一样支持各个平台。

    不同的词典外壳支持不同的词库内容。部分软件只支持读取自家的词库格式,如lingoes、StarDict、Mdict、Bluedict、ABBYY Lingvo、Logovista等。也有软件支持两种以上词库格式,这就是本文要探讨的对象——聚合类软件,目前主要有EBWin series(以下简称EB)、GoldenDict(以下简称GD)和Eudic(以下简称ED)。

    关于词典软件的研究,李锡江、包薇(2012)对大学生使用手机App词典做了调查,林皓(2016)对五大ELD词典App做了详尽的论述。本文将选取上文提到的三种聚合类词典App(EB、GD、ED),探讨其对各类词库的读取状况、功能设计,以及词库扩展性。参考词库主要选取与外语教学密切相关的日中、中日、英日、英英词典,软件将选取安卓平台的App。

    二、 聚合类词典外壳App的多词库支持与功能设计

    (一) 三大聚合类App的词库读取状况

    聚合类词典App一般都是在支持自家词库格式的基础之上,逐步增加对其他既有词库格式的读取与检索的,而且不同国家开发的软件对不同语种词库的支持也有偏重。EB偏重于支持日本辞书标准格式EPWING及老牌词典软件厂商LogoVista旗下的词典格式,后来又增加了对StarDict和Mdict的支持。GD除了支持ABBYY Lingvo出版发行的词库之外,还广泛地支持StarDict、Lingoes、Babylon、Dictd files等词库。ED有自己独特的词典规格Eudic,此外支持拥有大量词库以及受众的Mdict、StarDict和Lingoes。

    这些词库中,既有与纸质版词典无异的权威词库,如EPWING、ABBYY Lingvo和Babylon,也有民间开发的自定义词库,如Mdict、Lingoes和StarDict等。此外,有些词库软件还提供了制作工具,以便使用者自己制作词库,且制作成的词库不受平台约束,只要有相应的电脑软件或者手机App支持,就可以应用于各个终端。

    当然,受软件开发顺序、进度及原始受众的影响,三大App对于在多种词库的支持上有可能出现不完全兼容的情况,比如对某些词典的CSS文件(Cascading Style Sheets的简称,用来控制HTML元素的显示状况,比如HTML内容的颜色、字体、换行、缩进等)、JavaScript文件(一种直译式脚本语言,用来给HTML网页增加动态功能,比如给HTML词典文本添加折叠与展开功能、锚点跳转等)无法读取,导致该词库的某些特色功能无法使用。但是三大App都有反馈平台,出现问题之后一般都可以较为快速地得到解决。三大聚合类词典外壳App对各类词库的支持情况如表1所示。

    从数量上来看,三大App中EB和GD支持的词库较多,ED次之。从词库质量及权威性来看,EB和GD也要优于ED,前两者包括了大量出版机构正式发布的权威词库,辞书数据的完整性、规范性、权威性都有保障;而ED除了出版机构正式发布的词库格式Eudic之外,所支持的Mdict及Lingoes、StarDict都是民间开发的词典,在权威性、规范性上稍逊一筹。从词库语种来看,EB偏重于日语类词典,独家支持日本电子词典出版规格EPWING,后期的开发中逐步加入了对StarDict和Mdict的读取,这使其多语种性得到增强;GD的词库主要源于出版机构发布的ABBYY Lingvo和Babylon,以俄语、英语、法语、德语等西方主流语言为主;ED自身的词库有多种语言,主要以汉语、英语为主。从所支持词库的扩展性上来看,EB支持的EPWING和Logovista都是主流的词典出版格式,只要词典出版商继续发布此类词典,那么EB的可扩展性就会持续下去;GD具有跟EB类似的特征;ED除法语、德语之外,在其他语种方面存在不足,但是其兼容支持的StarDict和Mdict的易扩展性、词库多样性,让其并不逊色。

    (二) 三大聚合类App的功能设计与应用

    三大聚合类App具有词典软件共有的基础功能,诸如检索框、词库载入与管理、显示字体种类与大小的设定、关键词高亮显示、检索历史显示等。此外由于App原始支持语种的不同,软件本身也具有某些独特功能。各个App的启动与功能界面截图如图1—图6。

    就界面设计来说,EB最为简洁,除了检索框之外,其他的功能按钮都隐藏了起来,点击右上角的标签就可以进行各种功能设定;GD次之,启动时除了检索窗口之外,下方依次有词典管理、上下毗邻词典的词条跳转、发音和其他功能设定菜单;ED最为丰富,启动时App下方提供了词典、翻译、生词本、单词复习、我的(个人自定义菜单,可以下载与词典联动的App“每日英语听力”等,也可以提交反馈意见,更新词库及软件版本)选项,右上角标签包含App的其他各种设定。

    1. EB的特色功能与应用

    EB初始界面虽然简洁,但是功能并不逊色。尤其在词头的检索机制上,EB具有其他App无法比拟的优势。该App拥有前方、后方匹配检索,精确、交叉、全文检索等众多的检索方式(参见图7)。这些检索方式不但可以精确地找到目标单词,还可以模糊性地找到众多跟目标词条有关联的词汇(参见图8,contra前方匹配模式下的结果共计197条),如查询同词根、词缀的单词等,这样可以对单词进而进行比较分析与记忆,提高学习效率。其中的全文检索功能更为实用。外语的学习与研究离不开大量的例句,全文检索(参见图9,使用全文检索模式查找“精通”一词,截图显示的是《小学馆日中中日词典》中所有包含该内容的词条及词典正文中出现该词的结果,共计66条)则把词典变成了一个小型的语料库。通过全文检索,可以查询单部或多部词典中出现的与目标一致的所有例句。这对外语学习与研究大有裨益。

    众所周知,日语表记方式较多,同一个单词可以用平假名、片假名、汉字及罗马字方式表示。比如“秋”这个单词,可以写成“あき”“アキ”“秋”“aki”这四种形式(当然由于词汇种类的不同,有些单词只具有其中的部分写法)。这就对词典软件提出了较高的要求,同一个词条要保证用任何一种表记方式输入,都可以定位到该词条。EB可以直接在输入框进行这种操作,无需像其他软件那样在词典内容上加入超链接(如英语词头索引一般输入字母即可实现,日语表记的多样性导致词典软件采用某一种索引模式之后,其他表记方式的输入无法直接查询到结果,只能在词典内容上添加链接来指向目标词头。比如输入“アキ”“aki”都链接到“秋”来实现查询)来进行词头索引上的跳转(参见图10、图11)。此外,EB支持的原始词库EPWING格式本身是严格按照纸质辞书顺序排列词条、完整收录包含多媒体资料在内的权威词库,在EB安装之后借助于往下滑动的手势或下一页按钮就可以实现如纸质辞书般的阅读感受,这是目前其他App不具備的独特功能(参见图12)。

    EB支持的词库众多,所以在实际使用中为了节省运行内存,提高查询速度,需要对词库进行分组,而EB最大支持12个分组,完全可以满足不同的使用场景(参见图13)。另外EB还配备了书签,支持查询分享功能(参见图14),可以将词典内容分享到微信、微博,甚至AnkiDroid(一款优秀的间隔重复学习软件,可以用来记忆与复习单词与表达方式)上,以便利用闲散时间复习巩固所查询的内容,强化记忆。EB还可以与电子书阅读软件“読書尚友”(EB软件研制者开发的安卓系统文本阅读器)及支持分享功能的各类阅读器连动,在阅读时复制目标内容而后切换后台至EB界面,不用输入即可实现查询,这很大程度上提高了阅读与查询的效率。此外,所有本地词库都无法查询到的内容还可以进行网络查询,如某些俗语、谚语、流行语等。EB默认的网络词典有yahoo、google、wikipedia等,并允许用户自定义网络词典的增减,比如添加Oxford、Longman、Cambridge等各大英文在线词典,还可以添加有道词典、金山词霸等网站(参见图15)。当用户想查询更多的网络词典解释时,可以点击Web Dictionary下的任何一个网址,该网址的查询内容将在App内部或通过移动终端的默认浏览器进行显示,较为方便。

    由此来看,EB作为一款词典外壳已经高度具备了词典软件所需具有的绝大部分功能,并且针对日语的特殊性做了优化,其在体验上与查询纸质版辞书基本无异,但是在功能上远远超越了纸质辞书,具有较大的发展潜力。

    2. GD的特色功能与应用

    GD界面较EB而言稍微丰富些。App下方有几个常用功能选项,其他设定都隐藏在右下方最后一个菜单里,包含词典扫描与管理、页面搜索,其他包括诸如字体、显示模式、历史记录处理等词典App的基础功能。与EB相比,GD的功能较为单薄,而其最为独特之处是即点即译功能,即当用户点击词典内容中任何一个词时,GD会自动跳出该单词或者包括该单词在内的单词组合,再次点击之后将自动以该单词为关键词进行查询,十分便利。当然,GD对英文单词的解析最为彻底,基本可以完美地实现即点即译功能,但是对汉语及日语的解析存在欠缺,很多情况下跳出的备选词跟目标词并不完全一致(参见图16—图18)。

    从图中可以看出,只需手指点击目标单词“fear”,就能准确识别,再次点击Look up弹出的“fear”即可实现查询。但是日语识别时单词前方出现了“~”,中文则整句识别,这样两者都无法达到即点即译的目的。原因在于GD独家支持Hunspell morphologies格式,这使得其安装了英语的Hunspell之后,不管即点即译功能也好,检索时输入单词的各种变形也罢,都可以准确定位到该单词(参见图19)。GD读取词库时会加载所有词头并写入缓存,所以查询速度较快。此外还支持拼写渐进提示功能,当用户输入单词的前一部分时,下拉窗口就会出现相关的供选词汇,这样在提高查询速度的同时,也在一定程度上规避了拼写错误的产生(参见图20)。

    另外,GD对文本阅读器的支持度较好。移动终端的著名读书软件静读天下可以设定GD为默认查询词典,设定完成之后即可实现即点即译功能。具体操作时只需直接点击目标内容,当目标内容显示为被选定状态之后便会立刻弹出浮动查询窗口并显示该词在词典里的内容。这比EB还要便利,省去了后台切换程序的麻烦(参见图21)。

    综上来看,GD的App版本功能不够丰富,比如缺失多种检索方式,无法获得纸质辞书的阅读感受,没有书签、网络词典链接等。但是基础功能并无遗漏,而即点即译更为其增色不少。此外,其对西方语言的词形解析比较透彻,对词库的读取与查询速度也优于EB(GD的桌面版功能丰富,笔者将在其他文章中另做探讨)。

    3. ED的特色功能与应用

    三大App之中,ED的初始界面最为丰富,功能较为完备。在词头的检索上虽然不如EB多样化,也不能对所有支持格式的词典进行全文检索(ED只支持其内置词典的全文检索),但是具备了如GD那样的拼写渐进提示功能,此外还支持语音输入、摄像头拍照取词输入(参见图22)。笔者测试过这种新颖的输入方式,语音输入在发音清晰准确的情况下识别率较高,摄像头取词受软件扫描识别能力、环境光线、目标资料的清晰度及摄像头像素等因素影响,识别率并不十分理想,有待提高。

    ED较为独特的是LightPeek划词搜索功能,可以在包括系统浏览器在内的安卓任意程序中进行取词,而EB及GD都不具备。当用户在安卓上打开任意程序复制目标词汇后,ED会自动弹出悬浮窗口并对该词进行查询(参见图23、图24)。ED还具有词库内部单词即点即译功能,与GD类似,不过在使用体验上,GD的速度要远快于ED。

    在词库的支持方面,ED不光支持上文中提到的多类型词库,还自带了网络释义及百科查询功能(参见图25),并内置了基于google翻译引擎的在线翻译,较为便利(参见图26)。此外,ED的单词查询界面还集成了“听力原生例句”功能(参见图27)。该功能源于欧陆开发的另外一款英语学习软件——每日英语听力,在查询时不管输入的是英文还是中文,都会随机地显示来自不同数据源的英中双语例句,并带有真人发音,可以随时点读。如果用户终端上安装了这款软件,就可以在查询时点击例句上方的数据源标签,即可跳转到每日英语听力中相应的文章。这种连动可以让用户在查询的同时获取大量带有真人发音的双语例句,而且还可以确认例句的出处,对语言及翻译的学习有较大的促进作用。

    ED的另外一个特色功能是生词本。不同于EB和GD,注册App登陆之后,生词本及查询的历史记录可以云端同步,以便在不同的终端及时地复习、巩固所查询的内容。

    综上所述,三大App因开发者国别、原始支持语种及后续开发顺序不同而各有特色,都有着其他App无法取代的功能,比如EB的多种检索方式和所有词库的全文检索功能,GD的快速即点即译功能与单词原型解析,ED的所有程序即时取词与真人发音双语例句功能等。仅仅就英语学习来说,三大App都无可挑剔,都拥有丰富的英语词库和常用的功能。但是在其他语种的学习上,三者各有优势。对日语学习者来说EB的多样化检索功能是GD和ED所不具备的,这既与App原始的服务目标语言有关(以英语等西方语言为主要目标的GD和ED只提供了前方一致检索功能,并未为用户设计在技术上并不困难的其他检索方式。这可能是作者认为英语表记相对单纯,无需复杂的检索功能即可实现检索,故而未予开发),也与日语的表记特殊性有关,另外日中中日及日英英日的词库也是EB近乎独家的资源,其他App支持的为数不多的此类词库也是从EPWING转制而来。法语、德语、俄语等西方语言学习者则更宜使用GD,因为GD包含大量的西方语种的权威词库,并且其检索习惯与单词识别精准度、速度都优于EB和ED。对英汉及其他外汉的双语学习者来说,可能ED更为适合。这是因为ED不仅有法、德、西等语种的外汉对译词库,还有众多的其他语种的双语词库,而且还可以与功能丰富的单词学习记忆软件连动,可以较高地提升学习效率。

    三、 三大App的词库扩展性

    词库一般来说可分为两类——一是出版机构出版发行的权威词库;二是自制词库(使用App开发者提供的词库编辑工具制作的,包括使用者自制词库和网友自制共享词库)。由于自制词库难免存在错讹流传的危险,故笔者在此对其不做探讨。

    权威词库由各大词典出版机构发布,在权威性和即时更新性上有保障。如EB支持的EPWING和Logovista。EPWING旗下有各类词典,涵盖了国语(日日词典)、英日日英及日语和其他外语的双语词典、百科类词典、专科类(如理化学、法学、医学等)词典等。虽然受新型词典App的冲击,近几年推陈出新的力度不够,但是其影响力仍不可小觑。Logovista是日本主流电子词典出版商之一,其产品涵盖了Windows桌面版及移动版、安卓、苹果三大平台,词典数量繁多,更新速度较快,具体可参见其官网。GD支持的ABBYY Lingvo每年也在不斷地推出新版词库,其发布的词典主要以英语和俄语为主,如Oxford和Collins系列词库,此外还包含了众多西方语种,如法、德、西、意等语种。Babylon词典与ABBYY Lingvo类似,也是以西方语种为主,拥有纸质词典商授权出版的各主流语种词典,如Oxford出版的英、德、西等词典,也会不定期地进行更新。ED支持的词库只有法汉汉法、法英英法、法法、德汉汉德、英德德英、西汉汉西和其他几部外汉词库,虽数量不如EB和GD多,但是对于小语种来说弥足珍贵。此外,ED也会定期更新词库内容,并根据需要更改词性、例句、常用语的配色,以达到醒目、强化记忆的效果。

    总体而言,EB和GD在权威词库的可持续发展方面优于ED,但是缺乏外汉、汉外类的双语词库,ED虽在外汉汉外词库上略胜一筹,但是在多语种权威词库上明显不足。

    四、 对聚合类词典外壳App功能开发的展望

    在当下的“互联网+”时代,万物互联,大部分产业都与互联网发生着千丝万缕的联系,词典也不例外。近几年,词典软件的发展非常迅速。智能手机、平板电脑的普及让词典App变成了随身之物。这既免去了携带纸质词典的繁重,也实现了随时学习和查询。未来的聚合类词典外壳App(包括单词典App)除了整合本文论述的三大App的共通功能及独特功能以外,还可以加入以下功能,以便进一步拓展词典App的可能性,增强学习效果,促进语言的学习与研究。

    1. 词条内容的注释与即时分享功能。该功能可实现在纸质词典上做笔记的效果,并可以用不同颜色标记不同的注释内容,随时随地将其发布到个人学习软件上或者与他人共享。

    2. 查询历史及生词本、注释词条的云端同步及多平台共享功能。实现之后就可以在不同的客户端同步进行学习、巩固。

    3. App内相关内容的探讨、反馈,推送及适时更新等功能。针对使用者的探讨、反馈等,开发者负责适时更新。该功能将使App变成一个学习社区,可集思广益,不断地推动词典内容的更新与修订,把词典变成一部即时更新的互联网词典。

    4. 词库内容的正则搜索功能。上文中提到的全文搜索虽然把每部词典变成了语料库,但是一般只能检索单词或者词组,对于各种搭配结构及跨单词多关键词的检索并不理想。如果支持正则表达式检索,那无疑会把词典变成一部真正意义上的语料库。

    5. 容错、模糊搜索功能。输入一个词可以显示与之拼写相近的词。

    6. 附带功能类似于“每日英语听力”的各大语言学习App。App图文并茂,且具有真人发音功能。

    (7)附带可视化词典编辑器。可视化编辑器可以实现所见即所得的效果,在编辑源文件的同时就可以看到编译后词库的效果。

    以上六点如果都能实现,那么聚合类词典App本身将变成一套相对完整的语言学习系统,将会更高效地促进使用者的外语学习。

    五、 结语

    本文较为全面地分析了三大聚合类词典外壳App的词库支持情况、功能设计与应用,简要阐述、验证了其词库扩展性,并对其未来的发展趋势做出了推测。限于篇幅,本文未对桌面版与App版的外壳软件做比较分析,期待以后对此类问题进行深入研究。

    参考文献

    1. 冯建明.电子词典的种类及结构分析.吉林工程技术师范学院学报,2008(4).

    2. 高永伟,李洁.因特网与词典编纂.辞书研究,2000(4).

    3. 李东、解建和.充分运用计算机信息处理技术,加快双语词典编写工作.辞书研究,2000(5).

    4. 李锡江,包薇.数字化时代下读者的词典意识——基于大学英语学习者手机词典使用调查的研究.辞书研究,2012(3).

    5. 林皓.五大ELD词典App学习功能探讨.辞书研究,2016(2).

    6. 张锦文.国外在线语料库与在线词典管窥.∥中国辞书学会学术委员会编.中国辞书论集.西安: 陕西人民出版社,2001.

    7. 张淑玲.谈电子词典与英语教学.牡丹江医学院学报,2005(5).

    8. 章宜华.电子词典编纂的一般原则.∥中国辞書学会学术委员会编.中国辞书论集.西安: 陕西人民出版社,2001.

    9. 海词: http:∥dict.cn/

    10. ABBYY Lingvo: http:∥lingvo.helpmax.net/

    11. Babylon: http:∥/

    12. EBWin series: http:∥ebstudio.info/home/

    13. EPWING: https: ∥ja.wikipedia.org/wiki/EPWING

    14. Eudic: http:∥/

    17. LogoVista: http:∥/wp/?lang=en

    19. StarDict: http:∥www.stardict.org/

    (武汉大学外国语言文学学院日语系湖北430072)

    (责任编辑郎晶晶)

    相关热词搜索: 词库 外壳 词典 聚合 研究

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网