• 发垃圾贴的禁不掉,只能关闭论坛注册。想要注册账户的C友,请每月初发邮件到 aihaiyang at gmail dot com,我手动帮你创建。

关于keyword的reference corpus的小疑惑

#1
:)想请教下,如果我要用keyword功能比较两个小型语料库,reference corpus的字数一定要比被比较的语料库的字数多吗?

比如两两年的报纸相比较,后一年的字数少,可以作为reference corpus吗

:D谢谢老师了
 
#3
回复: 两个库不必容量相同

O(∩_∩)O老师的教程做的好生动啊

全看完了,老师您也说了,最经典的跨库对比是大库为参照库,小库为对比库,可如果我把报纸每年都建一个库,然后两两对比,很难确保参照库就一定比对比库大,这样没关系吗?

谢谢老师答疑~~
 

李亮1975重庆

语料库快乐军政委
#4
回复: 两个库不必容量相同

O(∩_∩)O老师的教程做的好生动啊

全看完了,老师您也说了,最经典的跨库对比是大库为参照库,小库为对比库,可如果我把报纸每年都建一个库,然后两两对比,很难确保参照库就一定比对比库大,这样没关系吗?

谢谢老师答疑~~
没关系的,只要有几十万单词或汉字就行啊,硕士论文不用那么认真的。
 
#9
回复: 关于keyword的reference corpus的小疑惑

creating your own corpora is not a simple task as you told. It may take a long time and also you may have to work really hard too so better refer any other book
 
Last edited:
#11
两个库不必容量相同

在antconc中的keyword list功能的操作流程,可以看我的图文教程的第12页开始的内容
http://www.docin.com/p-469407203.html
老师,我也有几个关于这方面的问题想请教下~
1、添加的词表中列的频率是raw frequency还是normalized frequency?
2、keyness代表的就是差异性么?
3、我想对比的是两个库中程度副词的使用情况,但是最后显示出来的几乎是按keyness排列的原库中所有的单词,有没有可能只显示程度副词呢?
 
顶部