Trustie-OSSEAN - 确实激发创新

首页
项目
数据
教育
大赛
态势
博客
论坛

登录注册

动态591
Issue279
讨论区39
资源库22
版本库507
Pull Requests 11
里程碑1
日历
甘特图

【缺陷】 UrlExtractor存在不能返过去更新已抽取htnl_list的问题！高

由甘谊昂添加于 2014-12-26 23:03

原因：（1）ListHtmlCrawler使用 pageMd5=DigestUtils.md5Hex(page.getHtml().get())方式设置pageMd5 （2）UrlExtractor使用 Html html = new Html(s); pageMd5 = DigestUtils.md5Hex(html.get()); 两边pageMd5可能不同！

回复（1）▪ 赞

甘谊昂 11年前

状态从新增变更为 已解决

% 完成 从 0 变更为 100

两个表的pageMd5已经统一。

赞回复︿

登录后可添加回复

当前状态已解决
选定优先级高
指派给甘谊昂
里程碑 --
开始日期 2014-12-26
结束日期
预计工时(H) 0.00 小时
完成度 100%
关联Commit 无

社区
网站首页
服务协议
帮助中心
问吧交流
合作伙伴

支持与服务
API文档
帮助中心
Git常用命令
DevOps使用文档
日志更新

合作伙伴
北京大学
北京航空航天大学
南京大学
湘潭大学
ISCAS
UCloud优刻得
中创软件
浪潮集团
中国开源软件推进联盟
上海交通大学

Trustie(确实)
QQ群：1071514693

头像设置