查看完整版本 : [讨论]关于LCMC的问题
xieang_007
2005-10-14, 10:21 PM
LCMC既然是经过分词处理过的语料库,那么可不可以用Xaira生成wordlist呢,就像wordsmith那样;另外,中文语料库的Type/token ratio有意义吗,是不是可以反应词汇丰度呢?
xiaoz
2005-10-14, 10:42 PM
Of course you can, but a wordlist is created at user's option when the corpus is indexed.
You can also use WordSmith 4 on LCMC if you like.
xudekuan
2006-01-30, 10:05 PM
如何能够得到LCMC?它是xml格式的吗?
http://bowland-files.lancs.ac.uk/corplang/lcmc/
上面是LCMC的官方网站,你可以去看看。上面有关于它的详细介绍!
xudekuan
2006-01-31, 11:22 AM
非常感谢,但是上面好像没有关于如何得到的信息。
xujiajin
2006-02-08, 12:25 PM
You may follow the URL to download freely a copy of the corpus.
http://www.ling.lancs.ac.uk/corplang/lcmc/LCMC/license.html
xudekuan
2006-02-08, 01:46 PM
非常感谢。
另外,XAira能否处理用其他格式标注的语料?
vBulletin® v3.7.4,版权所有 ©2000-2009,Jelsoft Enterprises Ltd.