PDA

查看完整版本 : 求助:怎样对语料进行洁净处理


wumi99
2006-11-05, 11:07 PM
在对收集来的语料用powergrep进行处理的时候,常用的正字表达法都有哪些。比如回车的处理,多余空格的处理等等。能不能请高手们列出一个处理的常用正字法符号组合清单,以便我们这些新手们学习和借鉴。谢谢!

jinshan_wu
2006-11-06, 09:31 AM
推荐你读一下《语料库应用研究》(卫乃兴 李文中 濮建忠 等著, 2005,上海外语教育出版社) 这本书的第二部分有对使用powergrep进行语料处理的详细讲解。

wumi99
2006-11-06, 09:56 AM
太好了,感谢你的提示和帮助!!:)

marilei
2007-03-11, 03:13 PM
记得一个c友推荐收集语料库的扫描仪?怎么找不到了呢?谢谢提供线索!