请教许家金老师有关语料库中单词频率比较的问题

[FONT=宋体]许[/FONT][FONT=宋体]老师您好!两个语料库对比研究某一话语标记语在句中的位置有无差异,库大小分别为[/FONT]1066296[FONT=宋体]和[/FONT]1097325words。[FONT=宋体]例如[/FONT]but[FONT=宋体],在两个库的频率为[/FONT]10062[FONT=宋体](句首[/FONT]9565[FONT=宋体])和[/FONT]5664[FONT=宋体](句首[/FONT]5369[FONT=宋体]),我要比较[/FONT]but[FONT=宋体]在句首的频率是否有显著差异,在用您的计算器时,在[/FONT]corpus1 [FONT=宋体]和[/FONT]corpus2[FONT=宋体]中输入[/FONT]1066296[FONT=宋体]和[/FONT]1097325[FONT=宋体],还是输[/FONT]10062[FONT=宋体]和[/FONT]5664[FONT=宋体]得出的结果更加有道理呢?我看了有位网友向您提问研究标点符号的问题,您回答在[/FONT]corpus1[FONT=宋体]和[/FONT]corpus2[FONT=宋体]里输入是文本中总标点符号数而不是文本总字数,因此产生了上述疑问。渴望您赐教![/FONT]
 
Back
顶部