PDA

查看完整版本 : 请教Chi-square test的计算


majorlv511
2006-10-25, 04:33 PM
请教一下各位,我在文章中要用到chi-square test, 但是我本人不会。
情况是这样的,我需要比较同一个词在两个语料库中的使用是否存在显著差异。

两个语料库的规模分别是:
corpus1: 1,070,602 words;
corpus 2: 10.33million words

所调查词出现的frequency是:
corpus1 中为312.15,
corpus2中为157.97

不知道这两组数据够用来分析了不?

谢谢大家了!!!

xiaoz
2006-10-25, 05:46 PM
The frequencies you gave must be normalised frequencies - why should they not be integers otherwise? Please use the raw frequencies - the actual counts - and the word numbers of the two corpora in the following LL calculator (LL test is more reliable than chi-squared test):

http://ucrel.lancs.ac.uk/llwizard.html

majorlv511
2006-10-25, 10:13 PM
非常非常感谢DR.XIAO!

我在第一个帖子里提到的就是normalized frequency,所以有小数点!

不过经你一指点,既然有现成的可以计算log-likelihood value的,我就直接使用了!真是太感激了!

为了我那论文,我都快急死了!

真是柳暗花明又一村啊!:)

xudekuan
2006-10-26, 03:09 PM
谢谢!
多谢!
非常非常感谢dr.xiao

雁字回时
2007-07-21, 11:16 AM
还是p值看起来直观, 所以还是要请教chi-square怎么计算以上p值

daisysun
2007-07-30, 11:22 AM
useful calculator, thanks!