【缺陷】
openhub社区抽取问题
正常
由
张方添加于 2015-08-27 11:50
对openhub社区的抽取结果进行分析,发现有部分项目的属性没有完全抽取,出现这种问题的原因主要是:1.该项目的这些属性信息缺失,从而不能抽取到,这属于正常情况;2.项目的创建时间不同,时间跨度比较大,有一些项目的页面布局和其他项目不一致,对其进行抽取时某些页面元素定位失败,导致抽不到内容。接下来会统计出项目信息不能完整抽取的项目个数,对不能抽取的数据项逐个进行分析,设法改进现有的抽取模板,或者针对这些抽取不完整的项目再重新写一个新的抽取模板进行二次抽取