怯怯地问个低级问题

用antconc检索某些词在多篇硕士论文结论部分的出现情况,请问是把语料按每一篇论文分成多个单独的纯文本还是把它们放在一个整的文本里检索呢?有什么区别?另外,纯文本里有些字符没到行的最后就回车到下一行了,请问这会影响检索结果吗?期待大家的指导,谢谢:)
 
回复: 怯怯地问个低级问题

看你的检索要求了,如果是希望能得到每个文本的统计信息可以把它们分开检索。不明白你的第二个问题。
 
回复: 怯怯地问个低级问题

在将word文件转换成纯文本文件时,有时提醒你要转换unicode, 请问unicode与默认的非unicode纯文本文件能一起用语料库检索软件统计其Wordlist吗?
 
回复: 怯怯地问个低级问题

看你的检索要求了,如果是希望能得到每个文本的统计信息可以把它们分开检索。不明白你的第二个问题。
因为语料从PDF格式转化WORD文档时有些多余的回车及空格,变为纯文本格式是否一定要清理掉,呵呵,表达不清,见笑了;)
还有,用文本整理器整理时,显示有全角字符,点击“全角转化为半角”也没有改变,请问是为什么呀?要手动改变吗?是否一定要把象这样的标点“”改为这种"",会影响检索结果吗?
谢谢清风出袖^_^
 
Back
顶部