241?1445561792

【缺陷】 抓取页面html的bbs_csdn和question_lupaword的爬取模板已完成,准备部署爬取 正常


张方添加于 2014-09-17 18:01
回复(4)
  • 241?1445561792
    张方 10年前

    每完成一个爬取模板需要重写4个java源文件,部署时需要将这4个源文件放到爬虫框架的相应包中,运行即可。但是还不是一键部署

  • 241?1445561792
    张方 10年前

    这两个网站的爬取模板还是基于之前的爬取框架,最新的自动增量爬取框架正在测试中,如果经测试性能稳定,以后的爬取模板都会基于该框架完成,然后部署爬取。

  • 5?1460204756
    尹刚 10年前

    另外,爬虫的部署能否一键搞定?

  • 5?1460204756
    尹刚 10年前

    很好!是基于最新的爬虫框架吗?

0?1470885445
登录后可添加回复
  • 当前状态 新增
  • 选定优先级 正常
  • 指派给 --
  • 里程碑 --
  • 开始日期 2014-09-17
  • 结束日期
  • 预计工时(H) 0.00 小时
  • 完成度 0%
  • 关联Commit

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议
还能输入50个字符 提交

加入QQ群

关注微信APP


×