请问BNCweb版中,怎么算MI值?

#3
回复: 请问BNCweb版中,怎么算MI值?

公式很简单,参见 Manning, C. D., & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, MA: the MIT Press.
第166页

http://nlp.stanford.edu/fsnlp/promo/colloc.pdf
用上面的简单公式好像和BNC web里的对不上,比如检索charming,跨距设为L3-R3,与搭配词witty的关系是:

f(charming) : 1342
f(witty) : 413
f(chamring,witty): 8
f(total): 98313429
得到MI = 7.8527
不知怎么算的。
当有跨距时的计算方法很多文献都语焉不详,我觉得下面这篇文章的第27页的figure 7和30页的average MI论证的比较在理:
http://cogsci.uni-osnabrueck.de/~severt/PUB/Evert2007HSK_extended_manuscript.pdf
 

附件

xiaoz

永远的超级管理员
Staff member
#4
回复: 请问BNCweb版中,怎么算MI值?

The BNCweb automatically computes a range of collocation statistics including log-likelihood, z, MI and so on.
 
顶部