想学习如何XML标注语料库

oscar3

高级会员
想学习一点用XML标注语料库的基础知识,看了网上的一些“入门”和“基础”,但是,可惜没有找到针对语料标注的教程,不知是否有这方面的教材。请指教。

[本贴已被 作者 于 2006年01月12日 20时41分51秒 编辑过]
 
用XML标注语料库的教程很少,这里抛砖引玉,推荐参阅 XCES 的标准。
XCES Corpus Encoding Standard for XML
http://www.cs.vassar.edu/XCES/


关于使用CES标注的语料库可参阅:
Directory of CES-Based Corpus Projects
http://www.cs.vassar.edu/CES/CES-P.html
 
感谢达人提供的地址.我也很想能够学习一些编程的东西.不过这些年一直是外语,心里没有底阿.不知道能不能学会
 
有没有人做过windows或web界面用于填入标注的信息,然后自动生成xml文档?可否交流以下,谢谢!
 
回复:想学习如何XML标注语料库

MMAX Annotation Tool is a good tool for your purpose.
 
Prof. Hong 真是既专业又热心.
顺便请问, 在WORD 里附的码,当文件转换成TXT格式的时候,会出现差异吗?
 
呵呵,我是以前学的coding,现在要搞点语言学了。那两个推荐确实不错,还有一个ACWT用了一下,也蛮好
 
jackzch问: 在WORD 里附的码,当文件转换成TXT格式的时候,会出现差异吗?
答:要看你的码是啥样子,一般来说,最好不要在Word下做。
 
回复:想学习如何XML标注语料库

以下是引用 shotgun_p2006-6-19 11:41:58 的发言:
呵呵,我是以前学的coding,现在要搞点语言学了。那两个推荐确实不错,还有一个ACWT用了一下,也蛮好

请问你的Coding是关于什么的,跟语言学关系大吗?
 
回复: 想学习如何XML标注语料库

其实国内很多学校,尤其是交大,在做corpus方面很有经验,何不写一个 xml标记在corpus中应用的书。可以写些经验,供大家学习。至少我不会挑剔书的内容,也可以帮助国内的语料库方面的朋友,迅速提高。
 
Back
顶部