请教大家问题,一个语料库里应该包含那些文件?

我是初学者,刚刚花高价买了FLOB,但是文件很小,仅7.04MB,都是txt文本。不知道会不会受骗了,请问一个语料库都应该包含哪些部分?
也许我的问题太幼稚,但真的很着急知道,谢谢各位!!
 
我是初学者,刚刚花高价买了FLOB,但是文件很小,仅7.04MB,都是txt文本。不知道会不会受骗了,请问一个语料库都应该包含哪些部分?
也许我的问题太幼稚,但真的很着急知道,谢谢各位!!

在没有弄清楚语料库的一些基本概念之前,最好不要花高价去购买也许对你来说不是特别有用的东西。简单的说,语料库就是文本的集合,txt只不过是最常见的一种语料文本格式而已。其次,还需要一个检索软件才能对语料库进行检索分析处理,这样的软件有不少,其中有一款免费的软件Antconc非常受人欢迎。如果你不是为了特定的研究目的,花高价买下Flob只不过是想尝试语料库的检索实践,的确是太早了一点。你还不如自己选一些文本文件进行操作。
 
oscar3, 非常感谢!!
That is the first reply received in the forum, and it is a great encoragement for a beginner.
我试着用Antconc检索了,得到了一些想要的信息。但是我要做part of speech检索却做不到,这是因为语料库的文件的原因,还是因为Antconc检索软件的功能?
 
oscar3, 非常感谢!!
That is the first reply received in the forum, and it is a great encoragement for a beginner.
我试着用Antconc检索了,得到了一些想要的信息。但是我要做part of speech检索却做不到,这是因为语料库的文件的原因,还是因为Antconc检索软件的功能?

这是语料库的文件的原因,因为它没有进行part of speech标注.
 
回复: Re: 请教大家问题,一个语料库里应该包含那些文件?

Thanks a lot.

As a begginner, I gained a lot from this great Corpus4u site. Follow me and everyday spend some time in accessing it, you will gain some insight into the Corpus Linguistics gradually.
 
Back
顶部