STTR与Token数的关系?

书上说计算长度不等的文本的词汇密度用STTR,但我用readability analyser计算了25个文本的WordSTTR,再用SPSS分析它与Token数的相关性,发现相关性高达0.875,显著性0.000,然后我又照样分析了276个文本,STTR和Token的相关性仍然有0.591,显著性0.000,这是不是说明文本的词长仍然很严重地影响STTR的值呀?:eek:
 
回复: STTR与Token数的关系?

你的分析应该是对的。
你可以再看看其他的参数是否与tokens也有一样的关系。
我们提供的参数里还有TTR,lemma TTR等,你可以比较一下哪个参数更好一些。
 
回复: STTR与Token数的关系?

你的分析应该是对的。
你可以再看看其他的参数是否与tokens也有一样的关系。
我们提供的参数里还有TTR,lemma TTR等,你可以比较一下哪个参数更好一些。
许博士,我又用Wordsmith同样以100词为basis计算了那25个文本的STTR,发现这样算出来的STTR与Token数的相关性是0.346,显著性0.090,根据我大致的观察,从十来个文本到25个,文本越多,相关性和显著性数值都逐渐降低。是不是readability analyser的计算方法有些问题呀?
我也算了TTR,lemma TTR和token数的相关性,都有0.9以上,显著性0.000。
 
回复: STTR与Token数的关系?

如果WordSmith和Readability Analyzer有不同,主要就在于对token的definition不一样。
 
Back
顶部