关于样本体积大使用卡方检验是否准确的问题

请教各位大侠
曾经有学者指出用卡方检验,样本体积越大,越容易推翻无效假设。那当我们将卡方检验用于数十万词的语料库时,得出的结果是不是都会是有显著性差异,推翻零假设?

这时卡方检验的结果还可信吗?还是有其他的检验方法?
 
回复: 关于样本体积大使用卡方检验是否准确的问题

何为总体?何为样本?先把这些问题搞清楚。
至于数十万词的语料库算不算大样本,看你研究什么问题了。
如果你要调查的模式比较罕见,上亿词次语料库里也最多找到个把,样本还是不够大。
不过么,其实没必要这么较真,追逐“不明觉厉”的时髦方法比搞清实质重要,语言学界不就这么回事。
 
回复: 关于样本体积大使用卡方检验是否准确的问题

何为总体?何为样本?先把这些问题搞清楚。
至于数十万词的语料库算不算大样本,看你研究什么问题了。
如果你要调查的模式比较罕见,上亿词次语料库里也最多找到个把,样本还是不够大。
不过么,其实没必要这么较真,追逐“不明觉厉”的时髦方法比搞清实质重要,语言学界不就这么回事。

谢谢版主指点。或者是不需要太较真。
 
Back
顶部