哈工大信息检索研究室论坛's Archiver

dl 发表于 2007-7-24 12:05

如何使用GATE做通用的正文提取器

rt,看到网上有人说可以用GATE做通用的网页正文提取,不知道这里有人做过没有?
我现在需要做一个通用的网页正文提取器,具体的要求就是尽量准确,保证没有漏掉的正文,可以多一点垃圾1没关系,各位觉得用什么方法最好?

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.