241?1445561792

【任务】 互联网领域招聘平台拉勾网数据抽取 正常


张方添加于 2015-04-29 09:55
拉勾网,是一家专为拥有3至10年工作经验的资深互联网从业者,提供工作机会的垂直招聘网站。拉勾网专注于在为求职者提供更人性化、专业化服务的同时,降低企业端寻觅良才的时间和成本。拉勾网致力于帮助互联网人士做出更好的职业选择,让求职者每一次职业选择变的更加明智。 在拉勾网,每一次投递都会收到企业的明确回应,最快回应时间仅为1分钟。拉勾网的”24小时极速入职”,彻底颠覆了“投简历石沉大海”的国民痛点。由于精准的职位匹配,求职者平均每8次投递就会收到一次优质面试机会。
回复(6)
  • 241?1445561792
    张方 9年前

    附件 lagoueror.PNG 已添加

  • 241?1445561792
    张方 9年前

    爬取量40441,抽取量30911,抽取失败的页面比例23.5%,是由于招聘信息发布时间较早,目前已经被删除,不是抽取模板不规范的原因

  • 241?1445561792
    张方 9年前

    状态正在解决 变更为 已解决

  • 241?1445561792
    张方 9年前

    拉勾网抽取模板已部署。

  • 241?1445561792
    张方 9年前

    > zhangfang 写到: > 其他字段都比较容易处理,招聘信息的发布时间post_time处理起来有点麻烦,其有三种形式,形如:2015-04-23发布、9:43发布、3天前发布,都要统一处理成 yyyy-MM-dd HH:mm:ss的标准形式。正在解决 已经解决,测试通过,下午部署。

  • 241?1445561792
    张方 9年前

    状态新增 变更为 正在解决

    % 完成0 变更为 80

    其他字段都比较容易处理,招聘信息的发布时间post_time处理起来有点麻烦,其有三种形式,形如:2015-04-23发布、9:43发布、3天前发布,都要统一处理成 yyyy-MM-dd HH:mm:ss的标准形式。正在解决

0?1470885445
登录后可添加回复
  • 当前状态 已解决
  • 选定优先级 正常
  • 指派给 张方
  • 里程碑 --
  • 开始日期 2015-04-29
  • 结束日期
  • 预计工时(H) 0.00 小时
  • 完成度 80%
  • 关联Commit

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议
还能输入50个字符 提交

加入QQ群

关注微信APP


×