Collocator和Colligator软件beta版

回复: Collocator和Colligator软件beta版

非常好的工具,可以极大的提高工作效率。
 
回复: Collocator和Colligator软件beta版

谢谢各位前辈们无私奉献!!!
新工具很好用!
不过还想问一下各位前辈,
上面所说的这个文献本身是英文还是中文的呀,在这

Xu, Jiajin & Yunlong Jia. (2009). Collocator 1.0: A collocation extraction tool. Beijing: The National Research Center for Foreign Language Education, Beijing Foreign Studies University.

要是中文的Yunlong Jia的中文名怎么写呀?还望赐教!!!

恕本人愚昧,真不知道Yunlong Jia是哪位教授?
 
回复: Collocator和Colligator软件beta版

贾云龙

这个不是文章,是对这个软件的citation。
 
回复: Collocator和Colligator软件beta版

oh,原来是这样,我知道了。
再次对所有前辈们表示感谢!真学到了不少东西!!!
谢谢许博士您!!!
 
回复: Collocator和Colligator软件beta版

感谢各位前辈的贡献。collocator 1.0 的确很实用,麻烦问一下各位前辈,在collocator 1.0 前的BFSU 四个字母代表什么呀?能否顺便讲讲此软件的最大优势在哪?跟同类软件的最大区别是什么?
再次谢谢各位前辈!!!
非常感谢!!!
 
回复: Collocator和Colligator软件beta版

BFSU stands for Beijing Foreign Studies University
http://www.bfsu.edu.cn/

First and foremost, this tool is free.
Besides, it incorportes some popular algorithms of collocational strengths.
And it is user friendly, and works well for both raw texts and tagged texts.
 
回复: Collocator和Colligator软件beta版

麻烦问一下各位前辈, 用上面提到的工具BFSU collocator 1.0 是很方便,但需用的Z值和MI值和用其他的计算软件所得出的数据并不一样,我用的是CLEC文本,而且选择时好像只能选Raw,不能选Tagged,选后者就没数据和搭配词出现。
请问这是怎么回事?是我那个地方操作有误呀?还请各位帮忙指点一下!!!
好着急呀!非常感谢!!!
 
回复: Collocator和Colligator软件beta版

[FONT=宋体]希望有人回复,指点一下我!!!在此再次感谢各位,拜托了!!![/FONT]​
[FONT=宋体]我使用的是[/FONT]CLEC[FONT=宋体]语料库[/FONT]txt[FONT=宋体]文本,按此软件Collocator1.0讲的一步一步操作,但好像只能选择[/FONT]Raw[FONT=宋体],若选[/FONT]tagged [FONT=宋体]则后没显示。之后进入[/FONT]colocate[FONT=宋体],[/FONT]Case[FONT=宋体]一栏已显示[/FONT]Default[FONT=宋体]无法选择,[/FONT]Span [FONT=宋体]的值应设为多少合适,是[/FONT]10[FONT=宋体]吗?[/FONT]​
[FONT=宋体]还有不知前辈的这一软件与其他计算统计软件所得出的[/FONT]MI[FONT=宋体]与[/FONT]Z[FONT=宋体]值都一样吗?还是[/FONT]MI[FONT=宋体]大于等于[/FONT]3[FONT=宋体]与[/FONT]Z[FONT=宋体]值大于等于[/FONT]2[FONT=宋体]就视为显著搭配词吗?还是有别的标准?[/FONT]​
[FONT=宋体]怎样才能正确检索任意词在[/FONT]CLEC[FONT=宋体]语料库[/FONT]txt[FONT=宋体]文本中的显著搭配词呢?在[/FONT]BNC[FONT=宋体]中也能检索吗?[/FONT]​
[FONT=宋体]真的很着急,怎么数据老是不合适呢?而且为什么检索出的[/FONT]F[FONT=宋体]([/FONT]n[FONT=宋体],[/FONT]c[FONT=宋体])大多是[/FONT]2[FONT=宋体]呢?[/FONT]​
[FONT=宋体]真是不好意思,希望得到各位前辈的指点!非常感谢各位!!![/FONT]​
 
回复: Collocator和Colligator软件beta版

麻烦问一下各位前辈, 用上面提到的工具BFSU collocator 1.0 是很方便,但需用的Z值和MI值和用其他的计算软件所得出的数据并不一样,我用的是CLEC文本,而且选择时好像只能选Raw,不能选Tagged,选后者就没数据和搭配词出现。
请问这是怎么回事?是我那个地方操作有误呀?还请各位帮忙指点一下!!!
好着急呀!非常感谢!!!

不同工具(WordSmith、AntConc、BNCweb、Co-occurrence、Collocate、BFSU Collocator等)得出的MI值、Z值、T值、χ2值、对数似然比值常常有差别。这些差别一种情况是由公式不同引起的,即我们上面提到的以Mike Scott的WordSmith为代表的经典搭配计算法和以Stefan Evert提出的BNCweb的搭配计算方法。在相同计算公式下,如果出现数值差别,可能有如下原因:各软件对形符或单词的定义不一致,比如BFSU Collocator中,我们将数字和不同的标点符号视作单独的形符。再有,含有连字符的单词(如255-page)视作一个单词,而不是两个。有些工具中会将所有的阿拉伯数字都归并成一个#。这些都是造成最后的搭配统计值不一致的一些可能因素。
所得的不同搭配强度值,一般来说无对错之虞,只是我们需要弄清产生数值差异的主要原因。另外,我们应该在同一个课题中坚持用同一种搭配计算工具,并在报告结果时言明。
 
回复: Collocator和Colligator软件beta版

我是一名初接触语料库的学生,请教各位老师,怎么才能学会用语料库?有没有书籍或是文章之类的?或者有哪位老师愿意赐教,也是万分感激!
 
回复: Collocator和Colligator软件beta版

谢谢许博士您的指点!!!
那就是工具不同结果也不相同了。
还想麻烦各位前辈请教问题:

[FONT=宋体]我使用的是[/FONT]CLEC[FONT=宋体]语料库[/FONT]txt[FONT=宋体]文本,按此软件Collocator1.0讲的一步一步操作,但好像只能选择[/FONT]Raw[FONT=宋体],若选[/FONT]tagged [FONT=宋体]则后没显示。之后进入[/FONT]colocate[FONT=宋体],[/FONT]Case[FONT=宋体]一栏已显示系统设定[/FONT]Default[FONT=宋体]无法选择,[/FONT]Span [FONT=宋体]的值应设为多少合适,是[/FONT]10[FONT=宋体]吗?[/FONT]


[FONT=宋体]还有不知前辈的这一软件的视为显著搭配词的判定标准还是[/FONT]MI[FONT=宋体]大于等于[/FONT]3[FONT=宋体]与[/FONT]Z[FONT=宋体]值大于等于[/FONT]2[FONT=宋体]吗?[/FONT]
Antcon 3.2.1 [FONT=宋体]能否与[/FONT]BFSU collocator[FONT=宋体]共同检索分析?[/FONT]


[FONT=宋体]希望得到各位前辈的指点!非常感谢各位!!![/FONT]

楼上的这位同学可以多上现在这个论坛,里面有好多有关语料库的入门知识,可以互相学到很多,也有书籍介绍,进入多看看吧,很好!!!我也是这样学的,从这里学到了很多语料库的知识。
 
回复: Collocator和Colligator软件beta版

[FONT=宋体]向各位前辈请教问题:[/FONT]
[FONT=宋体][/FONT][FONT=宋体]Antcon 3.2.1 [FONT=宋体]能否与BFSU collocator1.0 共同检索分析搭配词?[/FONT]

[FONT=宋体]BFSU collocator1.0 [FONT=宋体]这一软件的视为显著搭配词的判定标准是否为[/FONT]MI[FONT=宋体]大于等于[/FONT]3[FONT=宋体]与[/FONT]Z[FONT=宋体]值大于等于[/FONT]2[FONT=宋体]吗?[/FONT]

CLEC[FONT=宋体]语料库
txt[FONT=宋体]文本可用BFSU collocator1.0 检索吗?Span [FONT=宋体]的值应设为多少合适呀?我所看到的都是值设为4或5,对于这一软件也是这样吗?[/FONT][/FONT][/FONT]
[/FONT]

[FONT=宋体][FONT=宋体][FONT=宋体][FONT=宋体]真诚希望得到各位前辈的指点!非常感谢各位!!!
[FONT=宋体]谢谢,拜托各位前辈啦,很着急呀![/FONT]
[/FONT]
[/FONT]
[/FONT]
[/FONT]
[/FONT]
 
回复: Collocator和Colligator软件beta版

[FONT=宋体]谢谢许[/FONT][FONT=宋体]博士您的指点!!!真是太感谢您啦!!![/FONT]

那麻烦您能否看一下,我选择CLEC[FONT=宋体]语料库txt[FONT=宋体]文本输入,然后[FONT=宋体]按此软件BFSU Collocator1.0讲的一步一步操作,但好像只能选择[/FONT]Raw[FONT=宋体],若选[/FONT]tagged [FONT=宋体]则后没显示。[FONT=宋体]之后进入[/FONT]collocate[FONT=宋体],将supply 这一词输入,[/FONT]Case[FONT=宋体]一栏已显示系统设定[/FONT]Default和Both[FONT=宋体]无法选择,选择2,3 或3,2即显示Span [FONT=宋体]的值为5后,不知操作哪有问题,为什么得到的F(n,c)值都为1呢?这一现象怎么解释?还望得到您的指点!!![FONT=宋体]非常感谢您!!![/FONT][/FONT][/FONT][/FONT][/FONT][/FONT]
 
Last edited:
回复: Collocator和Colligator软件beta版

不明白你为什么要选tagged,你的CLEC词性赋码了吗?
 
回复: Collocator和Colligator软件beta版

[FONT=宋体]谢谢许[/FONT][FONT=宋体]博士您的指点!!!真是太感谢您啦!!![/FONT]

那麻烦您能否看一下,我选择CLEC[FONT=宋体]语料库txt[FONT=宋体]文本输入,然后[FONT=宋体]按此软件BFSU Collocator1.0讲的一步一步操作,但好像只能选择[/FONT]Raw[FONT=宋体],若选[/FONT]tagged [FONT=宋体]则后没显示。[FONT=宋体]之后进入[/FONT]collocate[FONT=宋体],将supply 这一词输入,[/FONT]Case[FONT=宋体]一栏已显示系统设定[/FONT]Default和Both[FONT=宋体]无法选择,选择2,3 或3,2即显示Span [FONT=宋体]的值为5后,不知操作哪有问题,为什么得到的F(n,c)值都为1呢?这一现象怎么解释?还望得到您的指点!!![FONT=宋体]非常感谢您!!![/FONT][/FONT][/FONT][/FONT][/FONT][/FONT]

我再说一遍 Default和Both跟CASE无关,请你仔细看一下软件的界面,这是输入数据的格式。

如果你的数据是标注过的你可以选tagged格式(目前软件只支持word_pos之类的标注)
如果不是只能选raw
 
Back
顶部