哈工大信息检索研究室论坛's Archiver
哈工大信息检索研究室论坛
»
文本挖掘
» 如何使用GATE做通用的正文提取器
dl
发表于 2007-7-24 12:05
如何使用GATE做通用的正文提取器
rt,看到网上有人说可以用GATE做通用的网页正文提取,不知道这里有人做过没有?
我现在需要做一个通用的网页正文提取器,具体的要求就是尽量准确,保证没有漏掉的正文,可以多一点垃圾1没关系,各位觉得用什么方法最好?
页:
[1]
Powered by
Discuz! Archiver
6.1.0 © 2001-2007
Comsenz Inc.