自定义赋码的语料库标注工具?

#1
求助~
硕士论文想运用语料库软件来研究语篇中的隐喻,语料库不大,打算采用手工赋码方式。
已确定需要赋码的种类和赋码规则,但是一个字一个字打来赋码十分耗时,不知道有没有工具可以自定义tag,然后每个词对应选择tag就(半)自动赋码?

比如这句:
He defended his argument.

我想要给defended赋码为「MRW」(metaphor-related word)。tag set里包括的其他码包括「码2」、「码3」、「码4」。希望找到一个软件让我可以在某个词的地方,点击tag set里的「码2」就自动在词汇后面生成赋码,如这个形式:
He defended_MRW his argument.

不知道有没有现成的软件,或者相似的软件供修改使用?

小白在此谢谢啦!
 
#3
同问。。。对这个问题也很感兴趣。
我现在正在用word的剪贴板/簿功能做标注,就是把tag分别复制,然后存储在剪贴板里。看到需要赋码的地方,就选择剪贴板里对应的tag复制到词的后面。不过还是挺慢的,继续等资深corpus analyst回复中。
 
#4
用Word自制语料标注工具
http://blog.sina.cn/dpool/blog/s/blog_651a9e980101h71t.html
要做基于语料库的研究,免不了要进行标注处理工作。MS-word是大家非常熟悉的文字处理工具。稍加改造便可以制作自己的语料标注工具。在熟悉的环境下进行工作,是不是会少了些忐忑的感觉。下面就来介绍一下如何制作标注工具。
一、设计自己的标注体系, 即赋码集, 比如/Ojg表示机构等等。
二、在word的菜单栏上找到“插入”再往下找到“自动图文集”
X

三、 在“自动文图文集”对话框下编辑和“添加”自己的赋码,如下

四、完成所有的赋码编辑之后,转到菜单栏“工具”下的“自定义”,并勾选“自动图文集”前的复选框,如下:

五、单击“自定义”对话框下的功能选项卡“命令”,如下图:

右边“命令”下的框内列车了自己的编辑的赋码集,用鼠标将框内的赋码一一拖到Word的菜单栏上,即可。如下图所示:

用word打开需要标注的文本, 将光标移到要标注的位置,单击菜单栏上相应的赋码即可完成标注。


注意,用手工标注是一步比较费时费力的工作。不过,据本人了解,目前基于语义的语料库研究都需要有人工标注的投入,对此要有思想准备。
补充:如果标注任务完成了,不再需要这些标注符号,或者需要更新别的符号。完全可以将这些标注符号从word工具栏上拖走。步骤是先点击“工具”,再点击“自定义”,打开工具设定对话框。如下图:

大家可能看到标注符号被拖动“+”号的表示了。
 
顶部