个人制作平行语料库的简易方法

这里说的平行语料库指用于教学的小型或者微型平行语料库,不是用于写论文的。

需要条件:
电脑,网络,Excel, EmEditor (带各种插件的), Tradoser 3.0

建议只制作动词和动词词性变化出来的名词和形容词的句库。

用搜索引擎搜出Bing在线词典,用复制的方式复制Bing词典中的例句,当然例句需要你用查词的办法查出来。一个词一般有12页的例句,把这些例句复制到EmEditor里面,用 删除重复的插件删除数字序号。把序号全删掉之后复制到Excel中,用自动筛选的方式筛选出网址并删掉。

用这种方式一天可以轻松制作5千条以上的句子,两个周到一个月的时间完全可以制作出可供使用的小型平行语料库。

下面说说Tradoser是干啥用的,这个软件其实是用于分离中英文的,就是把中英文句子中间加上分隔符,这样便于导入Excel制作成中英文分别在两栏里,当然也可以导入人机对译的翻译软件里制作成翻译句库。当然如果你Excel水平高,这些功能好像在Excel里也可以解决。

这种建库的方式最好几个人一起合作,因为这样可以在短时间里建立更大的库。
 
Back
顶部