偶还是要感谢诸位的帮助。Meanwhile,我自己也在试验一些办法。最大的问题是要把已经存成文本形式的xml文件中的tags去掉,即放在尖括号中的内容,这样才能便于一些操作。我经过实验,认为可以有两中方法:一种是用Word文字处理软件的查找和替换功能,因为所有的标注都放在尖括号中,因此只要把它们去掉,就可以得到“干净的”文本。具体做法是点“查找”,在对话框中输入<^?^?^?>,然后点替换,在对话框中不填任何东西,就是说用“空串”替换。如果有把握,可以点“全部替换”,这样就可以把所有尖括号中有三个字符的tag连同尖括号一起删掉。一个^...