查看完整版本 : 发一下本人开发的软件的最新进度
flycap
2007-10-22, 10:50 PM
软件包括基础数据统计,对齐检索,句子信息分析,和词汇信息分析四部分,先上两张图
oscar3
2007-10-22, 11:03 PM
预祝早日完工!
armstrong
2007-10-23, 10:12 AM
蛮实用的,预祝早日完工!
laohong
2007-10-23, 10:16 AM
Good job! But there is a typo in your first image. 类符数 and 形符数 should change their columns, as 形符数 should be number of tokens and 类符数 should be number of types.
Three cheers for you, C-pal!
flycap
2007-10-23, 10:15 PM
今天再上两张图片,句子分析部分,希望大家积极参与,提出更好的意见,我打算把这个软件一直做下去,以后还会继续升级。这一软件马上就要申请著作权,如果导师同意,我争取给提出有价值意见的朋友发个BETA版。
十分感谢管理员提出的意见,关于类符和形符的概念,我一直比较模糊,我在网上找到大概十个关于类符和形符的解释,但很多解释在意义上互相矛盾,我注意到WECCL说明书上wordsmith 的截图中的情况是类大于形,所以就把列名写成了这样,希望管理员同志多多指点。
armstrong
2007-10-23, 10:43 PM
要能加上MI值,T值等分析就更加好了.
rfh2054
2007-10-23, 11:31 PM
希望早日看到软件投入应用
Haiyang
2007-10-24, 09:33 PM
前续1,后续2 等可以考虑使用 L1, R2 这样的一般通行做法。
mayerniu
2007-10-26, 04:37 PM
你很虚心。祝你早日成功!
flycap
2007-10-26, 10:16 PM
这是句子信息统计A部分完成后的运行截图,软件最后还有一个词汇的分类统计,过几天完工后发上来。
flycap
2007-10-27, 07:38 PM
今天补充一张,软件启动后的主界面。
Hi_Jane
2007-10-28, 10:25 AM
好细腻的主界面!很地道的感觉!好!!
yinghuang
2007-10-30, 12:01 PM
looks fine!
hancunxin
2007-10-30, 01:43 PM
恩,不错。主界面真的很漂亮,很期待它早日问世!顶一下!
flycap
2007-10-31, 06:31 PM
今天终于把最后的部分——词汇信息统计部分做完了,把贴子里的图片整理一下。
flycap
2007-10-31, 06:32 PM
最后一个部分,词汇信息版块的截图
laohong
2007-10-31, 10:29 PM
如果只是为了WECCL的语料设计的,就有点浪费时间了。建议能够扩展到能处理通用语料格式。
flycap
2007-11-02, 10:16 PM
其实这款软件的目标并不是WECCL,而是CLAWS,用来处理用CLAWS赋码的文本。但是关于CLAWS,我手中的资料还很少,一个主要的问题是对CLAWS的赋码体系和规则了解不够,所以暂时从WECCL做为起点吧。
xujiajin
2007-11-03, 04:38 PM
你在北京的吗?如果是对话可以跟我联系。我可以跟你交流一下CLAWS的情况。
flycap
2007-11-03, 05:08 PM
感谢管理员的支持,我目前在哈尔滨,正在准备我的硕士论文,数据使用这个软件的分析结果,我想把这个软件继续写下去,而且要补充一些基于NLP的元素。以我目前的能力,如果有项目支持,Wordsmith的功能我基本能够实现,我明年很可能要报考北京师范大学的博士,如果有幸录取,我们一定会有好好切磋的机会。保持联系。
lixiaoshun
2007-11-09, 05:26 PM
佩服地五体投地!
flycap
2007-12-25, 10:08 PM
本人对句子基础信息部分进行了修改,增加了针对不同长度的句子的统计功能
flycap
2007-12-31, 06:52 PM
最近对软件进行了升级,增加了从赋码语料中分离出原语料的功能. 第二张图片显示分离出的原语料.
flycap
2007-12-31, 06:54 PM
再来两张
v2005zym
2008-01-01, 04:33 PM
cool
flycap
2008-01-05, 11:34 PM
下一步的开发思路是在软件中实现多组语料的录入,数据的比较可以直接在软件中得到体现
xujiajin
2008-01-07, 06:49 PM
不要单限于一个语料库。
flycap
2008-01-08, 09:45 PM
暂时对于其它格式的语料我还不熟悉,先把这个做出来,其实不同的语料库在编程时的问题就是读取过程上的差异,其它的地方都存在类似性。我在春节后去北京,希望能有机会向管理员取取经。
vBulletin® v3.7.4,版权所有 ©2000-2009,Jelsoft Enterprises Ltd.