求助:用ICTCLAS分词时怎么能把标注删掉么

用ICTCLAS做的分词,把分析结果手动复制到记事本,另存为unicode之后,用wordsmith 4做wordlist,结果显示的高频词全是标注的字母,请问怎么能把标注的字母去掉吗?
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

可以用search and replace 功能去除。
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

啊 谢谢清风出袖
可是要一个一个地替代吗?用什么工具呢?
可不可以怎么设置让ICTCLAS出不带标注的结果呀?我用的是09版的...
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

用powerGREP利用其中的search and replace 功能,可以用正则表达式批量处理。
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

I think it would be possible to request wordsmith (and AntConc etc as well) to analyze the POS tag as part of the word. For example, if your data takes the annotation format of word_tag (word/tag), you can adjust settings for Language by allowing the word to contain characters such as _ or /. In this way word_tag is analyzed as one unit.

Removing POS tags from the data when making a word list would conflate different usages of the same word form (e.g. the frequencies of 会 as a verb and as a noun would be combined).
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

不需要去掉标注,但可以隐藏。如果用的是Antconc,可以设定:global settings---tag settings--hide tags--apply进行检索即可。但如何将词性标注捆绑到该词上?有高手可以指点一下么?
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

不需要去掉标注,但可以隐藏。如果用的是Antconc,可以设定:global settings---tag settings--hide tags--apply进行检索即可。但如何将词性标注捆绑到该词上?有高手可以指点一下么?

变个格式即可,如WORD_TAG。
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

谢谢 laohong! 我试了一下,将word/tag改为word_tag还是不行,改成其他的符号也不行,软件好像很聪明,能够把单词和tag区分开,是否我的操作有问题?
 
回复: 求助:用ICTCLAS分词时怎么能把标注删掉么

谢谢 laohong! 我试了一下,将word/tag改为word_tag还是不行,改成其他的符号也不行,软件好像很聪明,能够把单词和tag区分开,是否我的操作有问题?

在AntConc里设置一下就好了:
Global Settings
Tag Settings
Show Tags
 
Back
顶部