哈工大信息检索研究室论坛's Archiver

liudong9183 发表于 2008-6-12 11:08

feature template怎么用?

呵...接触这一方面时间不长,请大家多指教
feature template ,如Bigram是做什么用的?
在看最大墒模型中,是不是把每个字的Bigram作为其上下文,然后统计这个字
在这个上下文的情况下的次数

sickpig 发表于 2008-6-13 16:16

特征模板只是定义特征函数的样式,一般作为一些寻找特征函数的工具的输入,工具/模块根据该模板统计出特征函数(会产生非常多的特征函数,差别在于发生次数的不同);最后再提交其它模块/工具计算参数/权值。
Bigram就是binary gram(我的理解),考虑2元关系,具体看你是选择词还是字作为统计单元。如,“很开心”
字一级就是,很/开/心,就统计“很开”,“开心”
词一级就是,很/开心,就统计“很开心”,词一级一般是经过分词处理后

liudong9183 发表于 2008-6-16 13:38

sickpig..

多谢sickpig大哥的回复。。
有一些问题请教,能不能告诉我你的qq,或者MSN。

wuxinlin 发表于 2008-6-17 14:21

他的QQ是95491590

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.