1:毕业设计任务书上前两个点均已完成并优化;
2:目前已经使用本机部署solrcloud导入380万项目,花费25分钟,仅适用文本相关度进行搜索返回对应的效果还不错,由于有很多引入的新项目,许多项目影响力还未计算,所以暂时没有加入影响力因素;
3:现构建排序工具并展示,前端框架已经初步搭成,尚需界面优化。
下一步:
1:熟知ossean的从爬虫之后开始的每一部分的代码;
2:据之前搜索帖子自身关注度的基础上,改善现有的项目影响力计算,并加入该因素;
3:前端显示界面作为展示项目搜索和帖子搜索,预计项目总条数有380万,帖子条数有300万;
4:排序分析,5月中旬完成论文。