关于BNC的使用问题

slgg6985

普通会员
用BNC检索,得出的concordance lines只能存成Sara32可以操作的形式。能否存成txt或doc文本?

建议开辟一个关于常用软件使用的交流专栏,以便交流使用这些软件的心得体会和窍门。
 
回复:关于BNC的使用问题

也许试一下就知道了,可惜我没有用过Sara。
 
回复:关于BNC的使用问题

先自我纠正一下,正确的问题应该是:用Sara-32检索BNC,得出的结果只能存成Sara32指定的格式,问:能否存成其他可以用一般的文字处理软件编辑的形式?

本人已经反复试过多次,还是不得要领。

请高人指点。
 
Save the results as a txt file using Listing - not as a sqy file.
 
谢谢各位高手的点拨。但是,用Sara-32的Listing功能也只能将检索结果存成xml文件。是否还有其他方法,抑或有什么简单的方法可以将xml文件转换成纯文本文件?

Thanks a lot!
 
用Sara的Listing功能将检索结果存为xml文件,然后将该文件以记事本形式打开,在“文件”选项内选“另存为”,设定文件名,保存类型为文本文档,编码形式选择ANSI保存即可。如果前面Sara检索时原文件选用的是“plain"格式的话,那么上述办法得到的文本文件中,检索词的表现格式为<kw>word</kw>.很容易识别。
 
我昨天下到一个叫editplus的软件,似乎可以将xml文件转换为txt文件并保存。
这个软件好像功能很强大的样子,反正我刚刚用它把BNC里的语料转换为txt文件保存成功了。好高兴!^_^
应该就是在corpus4u里面看到的下载,但我忘了具体哪个帖子了@_@ 楼主可以搜搜看。因为没有注册,所以只能试用30天,但我已经很开心了,呵呵~~
 
XML files are txt files ending with the xml extension. You don't need to convert to save as txt files to be opened as such. Right click on the filename and select "Open with..." and choose Notepad, WordPad or MS Word.
 
偶还是要感谢诸位的帮助。Meanwhile,我自己也在试验一些办法。最大的问题是要把已经存成文本形式的xml文件中的tags去掉,即放在尖括号中的内容,这样才能便于一些操作。我经过实验,认为可以有两中方法:一种是用Word文字处理软件的查找和替换功能,因为所有的标注都放在尖括号中,因此只要把它们去掉,就可以得到“干净的”文本。具体做法是点“查找”,在对话框中输入<^?^?^?>,然后点替换,在对话框中不填任何东西,就是说用“空串”替换。如果有把握,可以点“全部替换”,这样就可以把所有尖括号中有三个字符的tag连同尖括号一起删掉。一个^? 代表一个任意字符,因此,可以先预先估计一下最长的tag有多少字符,然后从最多字符开始,反复若干次操作,就可以把所有的tags清除了。第二种办法是用PowerGrep软件,这个软件有这个功能,但是学习使用这个软件要花一些时间。因此,如果工作量不大,可以使用第一种办法。
再次向所有提供帮助的高手表示感谢。
 
10楼c友所用的方法实际上是把Sara软件前期轻易能解决的问题不经意间推迟到了后期,并且复杂化了。如果一开始在用Sara进行检索时,把“format”设定为“plain”,则可以省去后期去除诸多tags的麻烦。
 
Back
顶部