求教关于日语语料库处理问题

首先想请问一下哪些软件可以处理日语?有什么软件可以对日语进行附码?


从贵网上得知antconc可以处理日语,我下载了antconc,学会处理英语了,但不知如何处理日语。日语和汉语一样也是不分隔写的,可我进行了分词之后还是不能处理,不知是不是还要通过什么软件进行预处理?或者是还要进行一些什么程序?


焦急等待中,希望高手们能给予指点。谢谢了!
 
回复: 求教关于日语语料库处理问题

首先想请问一下哪些软件可以处理日语?有什么软件可以对日语进行附码?


从贵网上得知antconc可以处理日语,我下载了antconc,学会处理英语了,但不知如何处理日语。日语和汉语一样也是不分隔写的,可我进行了分词之后还是不能处理,不知是不是还要通过什么软件进行预处理?或者是还要进行一些什么程序?


焦急等待中,希望高手们能给予指点。谢谢了!

你应该将你检索过程中的一些重要环节截图上传,让大家弄清楚你的问题到底在什么地方。否则你再急别人也不知道如何帮你。你说的“处理”是什么意思呢?软件根本就不能识别文件,还是索引的时候无法进行等等
 
回复: 求教关于日语语料库处理问题

你应该将你检索过程中的一些重要环节截图上传,让大家弄清楚你的问题到底在什么地方。否则你再急别人也不知道如何帮你。你说的“处理”是什么意思呢?软件根本就不能识别文件,还是索引的时候无法进行等等

谢谢你的关注! 我是个完全的新手,但现在需要利用其写论文。我现在直接面临的问题就是不知道对日语怎么进行分词和词性的标注,然后做完了这个步骤后该转换成什么格式才能用antconc识别分析。呵呵,谢谢大家,我现在这个方面是个小白
 
回复: 求教关于日语语料库处理问题

谢谢你的关注! 我是个完全的新手,但现在需要利用其写论文。我现在直接面临的问题就是不知道对日语怎么进行分词和词性的标注,然后做完了这个步骤后该转换成什么格式才能用antconc识别分析。呵呵,谢谢大家,我现在这个方面是个小白

对于日文分词和日文词性标注不太清楚。但是,你有必要告诉大家你要达到什么目的,因为只有明白你的目的才能知道你要用Antconc做些什么处理。呵呵!舍不得说话啊
 
回复: 求教关于日语语料库处理问题

用antconc分析一篇日语文章的词频,各类词(名词、形容词、动词等等)在文章中各有多少个及其所占的比率等等.

直接地说,就是现在还没有用antconc识别出日语。
呵呵,真心谢谢大家,也真心希望得到大家的指点,我是个女生,对软件这东西真不是太好懂。。。。
 
Last edited:
首先想请问一下哪些软件可以处理日语?有什么软件可以对日语进行附码?


从贵网上得知antconc可以处理日语,我下载了antconc,学会处理英语了,但不知如何处理日语。日语和汉语一样也是不分隔写的,可我进行了分词之后还是不能处理,不知是不是还要通过什么软件进行预处理?或者是还要进行一些什么程序?


焦急等待中,希望高手们能给予指点。谢谢了!

You can process Japanese using AntConc. First, you need to segment your texts using a tool like Chasen (http://chasen-legacy.sourceforge.jp/) or MeCab (http://mecab.sourceforge.net/). Then, you need to set the language encoding in AntConc to one that matches your texts. Using UTF-8 is the easiest option. Just save your texts as UTF-8 and then set this option in AntConc.
 
Back
顶部