C chuepeng 2011-02-18 #1 我在搜索BNCweb中的in that,想通过词性标码筛选,发现有的是PRP CJT, AVP CJT这都好理解,还有的是AVP-PRP CJT,这个里面有连词号是怎么回事呢?怎么解释呢?谢谢!
xujiajin 管理员 Staff member 2011-02-18 #2 回复: 请问AVP-PRP是何解? BNC采用的是CLAWS tagset的第5版,其中会有很多这种hyphenated tag,就是安装CLAWS的判断,某个词,可能是AVP也可能是PRP。这种codes,在BNC语料中很多。 这种称为ambiguity tags List of Ambiguity Tags AJ0-AV0 AJ0-VVN AJ0-VVD AJ0-NN1 AJ0-VVG AVP-PRP AVQ-CJS CJS-PRP CJT-DT0 CRD-PNI NN1-NP0 NN1-VVB NN1-VVG NN2-VVZ VVD-VVN CLAWS tagset的第7版,没有这个问题。
回复: 请问AVP-PRP是何解? BNC采用的是CLAWS tagset的第5版,其中会有很多这种hyphenated tag,就是安装CLAWS的判断,某个词,可能是AVP也可能是PRP。这种codes,在BNC语料中很多。 这种称为ambiguity tags List of Ambiguity Tags AJ0-AV0 AJ0-VVN AJ0-VVD AJ0-NN1 AJ0-VVG AVP-PRP AVQ-CJS CJS-PRP CJT-DT0 CRD-PNI NN1-NP0 NN1-VVB NN1-VVG NN2-VVZ VVD-VVN CLAWS tagset的第7版,没有这个问题。