《现代汉语词典》DBF数据库

本人想组织创建如题所述数据库,建立哪些字段比较合适?请诸位给点建议。
 
回复: 《现代汉语词典》DBF数据库

建议先讲一下搞这个项目的研究目的,大家才好提出有针对性的意见。
 
回复: 《现代汉语词典》DBF数据库

请教语料库检索的:There are 7453 different types in your collocation database for "[word="major"%c]". (Your query "[word="major"%c]" returned 28633 hits in 2762 different texts, thinned with method random selection to 5000 hits)
下划线的是什么意思,急盼复?:confused:
 
回复: 《现代汉语词典》DBF数据库

thinned是减少的意思

你的检索结果是7453
你得到的结果是在7453中随机抽取出的5000条。
 
回复: 《现代汉语词典》DBF数据库

非常感谢许博士,速度超快,:)我拜读过您的著作,佩服佩服。:)
 
XML或其他主流的商业版数据库管理系统都是良好的选择

建立一个《现代汉语词典》的数据库而要设置的字段,除了与词典本体的宏观结构和微观结构进行一一对应之外,还需要整合一些附加信息(加工者的个人信息,加工者的操作信息,加工者的进度信息,评审者的个人信息与操作信息,不同的微观信息的格式排版信息等等)。严格来说,每个具有独立意义的信息单位都应该存储为一个数据字段(“域field”)才能确保后续的自动排版等等的技术实现。

建立XML的数据库的话,就不用费神去思考数据字段的问题,坏处是XML只是一种标注方式,不算严格意义上的数据库(管理系统),虽然可以同时用Schema和DTD进行字段的约束。

建立标准的基于商业化的数据库管理系统的数据库,则可以同时实现数据字段(“域”)的取值限制和数据格式限制,但是由于商业化的数据库管理系统有多种档次和品种,它们的学习和安装和运行操作的难度不一定能在每个成员的身上轻松实施实现。

一般而言,Office Access是中小型数据库的上乘选择,从用户界面和操作习惯上和学习难度上都是很不错的,当考虑商业化的数据库管理系统的数据库的建立的时候,可以考虑采用Access 2003/2007。如果是选择建立XML数据库的话,微软公司推出的免费工具“XML Notepad 2007”就可胜任。下载地址如下:
http://www.skycn.com/soft/36210.html

这款软件也内置了XML自动格式化排版的功能,只需要另存一次就实现了XML文本的格式美化,很方便,就能轻松地用“记事本”打开直接观察了(虽然这也没有很大必要)。:eek:

不过,无论是哪种数据库管理系统或XML编辑器,都很难实现对较多层次的结构的词典的信息呈现的“全部彻底展开与同时正常排版”,所以,还需要开发或选择适当的计算机辅助的词典编纂系统。例如:
http://tshwanedje.com/tshwanelex/
 
回复: 《现代汉语词典》DBF数据库

我搞IT的,我说下我的看法。

首先,把现代汉语词典中的单独的信息项抽取出来,比如词语,词义,示例,发音,同/近义词等。

然后,把这些信息项组合起来建表。专业一般用POWERBUILDER设计数据库表。

最后,写UI操作数据。

我个人觉得,最痛苦的阶段是把现代汉语词典的信息项抽取出来(尚未存在现代汉语词典的电子版),设计数据库表结构和UI找个计算机本科生很容易就搞定了,可以让那个学生当毕业论文来做。


换句话来说,你具体需要什么字段,可以根据您的需要添加,对于搞IT的人来说,这个很容易实现。对于IT人员来说,最头大的问题是输入的现代汉语词典的数据必须确保无误。软件只是您达到目的的工具。您的需求决定了软件应该如何设计。
 
Back
顶部