• 发垃圾贴的禁不掉,只能关闭论坛注册。想要注册账户的C友,请每月初发邮件到 aihaiyang at gmail dot com,我手动帮你创建。

关于MAT软件

#1
大家好!
我近期用Andrea Nini (2014)开发的多维度分析软件处理文本(multidimensional analysis tagger),发现生成的基础数据z分数,出现以下状况,感觉不是很对劲。为什么数值很多都是一样的呢?不止这几组截图,还有很多组都出现这样的情况。想请大家帮忙看看是怎么回事?

还有,Nini这个软件中报告的标注码在每个文本中出现的频率是每千词么?为什么我在这个工具说明中看到的是per 100 tokens呢?
 

附件

#2
如果特征原始频率一样,z 值也应一样。

猜测是否数据中有很多原始频率为 0 或 1 的特征。

p.s. 第三张不是 z 值吧?
 
顶部