各位大侠好!
小弟初学利用语料库研究翻译文本,现在想调查一个译本中最常用的词性搭配模式。有人说可以用Perl编程语言清除单词保留赋码,然后用AntConc来检索N-gram 然后再观察分析。
我浏览了一下这个论坛有人讨论过这个问题:
http://www.corpus4u.org/forum/showthread.php?t=5219
可惜我试验了一下还是不太管用。
我把我需要处理的文本黏贴如下:
Click_VVB ,_, click_VVB ,_, for_AV021 ever_AV022 click_VVB ,_, click_VVB ;_;
Mulan_NP0...