各位老师好,作为初学者,我纠结了很久,终于鼓起勇气将自己的问题贴出来,希望得到老师们的帮助和指点。
研究英语报章(语料来源主要是China Daily,我已经收集了China Daily2011年7、8、9三个月的文本,分为6个主题,一共972,796 tokens和26,955 types)的高频动词。之前我理解的高频动词就是China daily中按词频由大及小排列最靠前的前五十个,或者前二十个。现在我想定义为与COCA的新闻语料库中动词词表相比,出现频率异常高,或者相比较而言过度使用的动词。我现在的第一步是要将这些动词找出来。自建的微型语料库定义为MCCD。...