用文本整体器的问题

asan82

高级会员
#1
看《语料库应用教程》中介绍了文本整理器。
尝试用了一下。
有一个小问题没解决。
网络上下载的文本约10词就有一个回车键,想去除掉,已有方法是WORD里的替换功能。
但 用 文本整理器 的 合并行 速度很快,就是合并之后两个单词变一个了。这种情况怎么处理?

nine papers on
evaluation in language

合并行后变成
nine papers onevaluation in language

求助!
 
Last edited:

armstrong

高级会员
#2
回复: 用文本整体器的问题

文本整理器主要是针对汉语的,汉字之间没有空格,因而不存在这个问题。处理英文时说将上一段的最后一词和下一段的最前一词合并了。
 
顶部