37?1442652656

【缺陷】 关于爬取数据的质量问题 正常


16FanQ添加于 2014-08-14 09:48
爬取的数据质量还有待提高,会有各种不应该出现在相关字段的内容,比如博客的摘要里还有摘要两个字,这在后期处理会很麻烦,要在爬取后写入数据库前处理完毕
回复(1)
  • 37?1442652656
    16FanQ 10年前

    以后的爬取都要按规范文档来进行

0?1470885445
登录后可添加回复
  • 当前状态 新增
  • 选定优先级 正常
  • 指派给 甘谊昂
  • 里程碑 --
  • 开始日期 2014-08-14
  • 结束日期
  • 预计工时(H) 0.00 小时
  • 完成度 0%
  • 关联Commit

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议
还能输入50个字符 提交

加入QQ群

关注微信APP


×