建议你使用正则表达式,先对附码文件进行搜索,找出所有以ing结尾的动词(表达式\w+ing/VBG,CLAWS应该是\w+ing/(VBG|VVG|VDG)),然后使用表达式(a)找出be+-ing和介词+-ing的表达(当然,be动词有很多种形式,在这些形式和-ing之间还会有否定词和其他副词或结构,比如:not,n't等 ),最后运用正则表达式的取非符号^,剔除表达式(a)所包含的结构,得出你想要的结果。我用的是Gotagger附码器,对CLEC的小语料分析了下,效果还算差强人意。弄不到CLAWS,没办法。个人建议,仅供参考。