回复: 求教:如何使用语料库搜索句型?
呵呵,好,xusun575的文本处理能力还是很强的。那我就发一个。就拿咱们论坛下的“大学英语教材语料库”为例子吧。(附件中)
比如:我们要研究the这个词。
1.我要求你先把语料库中the这个词的pos tag去掉!(但其他词的词性标记要求保留)
2.把文本中的所有“词”都去掉,只保留词性标记。
上面2个步骤做完,应该就是本文中只有研究的这个词,和一些词性标记了
3.把带有the的所有“类联接”提取出来:形如 pos+the+pos
其实我的这个例子稍微有点不好,最好拿个“兼语类”现象明显的词做实验。就是一个词有多个词性。