关于某个词出现在Torch语料库中句首的概率问题

怎么评价某个词出现在句首的频率?

Torch 语料库中有1703625个字,671篇文章,40356个以句号结尾的句子,如果按这样算的话,平均句长是42个字。我的研究对象是“有时候”一词,它在Torch语料库中出现56次,出现在句首的次数是15,作为插入语的次数是11,我应该以那哪些数字为对比或参考,来评价“有时候”一词在句子层面某个位置出现的频率高低?

我的研究目的是考察汉语词语及其英文对应词语单位在各自本族语语料库中的位置特征,当我把这些要研究的词和他们对应单位在句首和句末出现次数都统计出来时,对着这些数据,我不知道怎么分析了,因为实在找不到参考去评价它们,恳请各位老师给予帮助!
 
Last edited:
Back
顶部