请教:什么语料库检索软件可以检索篇头标注(元信息标注)的内容?

请问大师们,有没有什么软件能实现熟语料中篇头标注内容的检索?比如大型语料库中,有没有什么软件能将检索词在指定主题或文本来源中检索?多谢啦!
 
回复: 请教:什么语料库检索软件可以检索篇头标注(元信息标注)的内容?

If the corpus is marked up in XML, Xaira can be used.

请问大师们,有没有什么软件能实现熟语料中篇头标注内容的检索?比如大型语料库中,有没有什么软件能将检索词在指定主题或文本来源中检索?多谢啦!
 
Re: 回复: 请教:什么语料库检索软件可以检索篇头标注(元信息标注)的内容?

http://www.corpus4u.org/forum/showthread.php?t=7762

可用Sub-corpus creator检索metadata并抽取出相应的文本。

相关介绍可见:http://ishare.iask.sina.com.cn/f/20756632.html

多谢许博推荐的软件,它对于从大型语料库中提取可用于对比研究的语料,并构建一些小型语料库真是很有用的。
但是,如果是自己建立一个双语语料库,其中一些经过翻译构成平行库,且内容包含多个学科,假如建库时就用如“北外通用汉英平行语料库”的xml标注格式对元信息进行了标注,如果要对某个检索项在学科A中的使用进行检索,或者在“源于为英语”的中文译文中检索,除了将不同来源和学科的文本分在不同文件夹存储之外,有没有一个检索平台能将语料库全部导入,然后对检索条件进行勾选来设定检索条件,从而实现对不同学科、不同来源的语料进行各种条件限制下的精细检索?
要达到的目标就如北外“中英双语在线”(http://www.fleric.org.cn/ceo/)的功能一样,可以对检索进行多种条件限制,比如源语言、文本类型、领域等等。
非常感谢!
 
Re: 回复: 请教:什么语料库检索软件可以检索篇头标注(元信息标注)的内容?

If the corpus is marked up in XML, Xaira can be used.
多谢肖教授的推荐。我下载了Xaira试了下,它好像只支持*.xcorpus的文件类型。我把一个标注得很详细的xml(请见附件)后缀名改成了xcorpus,Xaira打开时显示...is not a valid xcorpus file.请问如果自建语料库,并且对元信息进行了标注,想要利用检索条件筛选语料的话,用Xaira能处理吗?如果能用Xaira进行检索,需要什么工具将语料转成xcorpus格式呢?多谢您!
 
Re: 回复: 请教:什么语料库检索软件可以检索篇头标注(元信息标注)的内容?

If the corpus is marked up in XML, Xaira can be used.
用xml标注的文档请见附件呵。多谢您!
 

附件

  • chat_window.txt
    118.4 KB · 浏览: 17
回复: Re: 回复: 请教:什么语料库检索软件可以检索篇头标注(元信息标注)的内容?

.xcorpus is the result of indexing an XML corpus. When you have installed Xaira, you will have two programs, one is "Xaira tools", which is used to index your corpus, the other is Xaira client" which you can use to query your indexed corpus. See the following links for PPTs for indexing and querying using Xaira:

http://www.lancs.ac.uk/~xiaoz/papers/crg_xaira_part1.ppt
http://www.lancs.ac.uk/~xiaoz/papers/crg_xaira_part2.ppt


多谢肖教授的推荐。我下载了Xaira试了下,它好像只支持*.xcorpus的文件类型。我把一个标注得很详细的xml(请见附件)后缀名改成了xcorpus,Xaira打开时显示...is not a valid xcorpus file.请问如果自建语料库,并且对元信息进行了标注,想要利用检索条件筛选语料的话,用Xaira能处理吗?如果能用Xaira进行检索,需要什么工具将语料转成xcorpus格式呢?多谢您!
 
Back
顶部