找laohong回答问题,急啊!

#1
WordSmith Splitter[FONT=宋体]的[/FONT]bug[FONT=宋体],[/FONT] [FONT=宋体]这里是解决办法:[/FONT]

1
[FONT=宋体]、用[/FONT]EditPlus[FONT=宋体]打开[/FONT]ST3[FONT=宋体]文本,敲菜单中[/FONT]Search[FONT=宋体],[/FONT] Replace[FONT=宋体],[/FONT] [FONT=宋体]然后在[/FONT]Find What[FONT=宋体]里填入[/FONT]\n\n[FONT=宋体],在[/FONT]Replace With[FONT=宋体]里填入[/FONT]\n[FONT=宋体],勾选[/FONT]Regular Expression[FONT=宋体],敲[/FONT]Replace All[FONT=宋体]得到没有空行的新文件;[/FONT]

2
[FONT=宋体]、然后敲菜单中[/FONT]Search[FONT=宋体],[/FONT] Replace[FONT=宋体],[/FONT] [FONT=宋体]然后在[/FONT]Find What[FONT=宋体]里填入[/FONT]<ST 3>[FONT=宋体],在[/FONT]Replace With[FONT=宋体]里填入[/FONT]</text>\n<ST 3>[FONT=宋体],勾选[/FONT]Regular Expression[FONT=宋体],敲[/FONT]Replace All[FONT=宋体]得到新文件;[/FONT]

3
[FONT=宋体]、删掉新文件的第一行,存下;[/FONT]

4
[FONT=宋体]、打开[/FONT]WordSmith Splitter[FONT=宋体],[/FONT] [FONT=宋体]在[/FONT]End of text separator[FONT=宋体]里删掉[/FONT]!#[FONT=宋体],填入[/FONT]</text>[FONT=宋体];并把[/FONT]Bracket first line[FONT=宋体]后的勾去掉,[/FONT]OK[FONT=宋体]即可进行分割。[/FONT]
[FONT=宋体]——————————————————————————————————————[/FONT]
[FONT=宋体]这是你在另一个帖子里对大文本进行分割提出来的解决方法。这个方法我试过了,可换了个子语料库就不出问题了。我用的是ST5,分割出来显示内容不全,而且我觉得问题也很大。我想知道是什么原因,希望您能不吝赐教![/FONT]
 

laohong

管理员
Staff member
#3
armstrong说的对,你检查一下ST3和ST5有什么区别,照猫画虎应该就能解决问题。
 

xujiajin

管理员
Staff member
#4
"1、用EditPlus打开ST3文本,敲菜单中Search, Replace,然后在Find What里填入\n\n,在Replace With里填入\n,勾选Regular Expression,敲Replace All得到没有空行的新文件;"

Did you do the above to remove all the double blank lines? \n only stands for new lines. \r stands for carriage returns.

Very often we use Find "\r\n[\r\n]" and Replace "\r\n" to rip of multiple lines.

Alternatively, you can delete all blank lines, using Find "\n[\s| ]*\r" and Replace with "nothing".
 
#5
回复: 找laohong回答问题,急啊!

终于找到大虾们了。许博,久闻大名啊,先谢谢你的指导,我试试看行不行。说实话,我是不懂,就是比葫芦画瓢的。
 
顶部