本人也深知17楼yinghuang的苦衷。但是经费只是一个方面,而建库是另一个方面。打工的事情我虽然没有怎么干过,但是也看到那些孜孜不倦的打工仔的劳动。语料库的建立是很繁重的劳动,我们应该向他们表示敬意!
但是,我希望的是大家能在建库的时候,对技术多一点投入,这是个必须考虑的事情,而且就标注技术来讲,并没有那么复杂,只是稍微知道标记语言,稍微知道语料库的标注,就可以解决的问题;另外,考虑查询软件的开发。象SWECCL,那么多的声音文件,竟然是堆在那里的,这对于多数人来讲,是无用的,即使对于个别会编程的人来讲,恐怕编写一个查询文本和声音的工具也得半年三个月的功夫。...