毕业设计（基于复用网络的开源软件推荐技术研究） - 确实激发创新

Trustie_r

登录注册

陈梦雯/ 毕业设计（基于复用网络的开源软件推荐技术研究）

项目简介

基于复用网络的开源软件推荐技术研究

陈梦雯 TO 毕业设计（基于复用网络的开源软件推荐技术研究） | 项目问题

【周报】毕业论文第三章（组合软件推荐研究除实验结果分析部分）正常

指派给陈梦雯

发布时间： 2016-10-12 10:47

更新时间：2016-10-12 20:46

一、背景

找到软件后，快速便捷的复用，哪些搭配，哪些冲突

二、相关工作

数据挖掘领域，频繁项集发现三种算法算法，aprior、FP-growth、使用垂直格式挖掘

三、同现网络构造

由复用网络转化为同现网络，同现网络其实是2频繁项集，两顶点如果有边，则说明两顶点同现过。

四、同现网络分析

还没写，不知道用什么对这个网络进行分析，不知道分析的目标是什么，预期结果是什么。

五、同现关系量化模型

在网络图中依据路径计算项集的支持度和置信度

六、组合软件推荐方法

在网络图中用广度优先或深度优先，根据迭代或递归次数找n元环发现n项集，用项集的支持度和置信度去判断是否频繁

七、实验结果分析

还没写，不知道怎么筛选项目，也不知道怎么判断好坏

目前筛选是watch!=0 and star!=0 and fork!=0 and pom_number >10 的项目，如果最小支持度设为0.2，出现的频繁项集比较少，只能依次减小支持度。

还有没有其他好的方法筛选项目，缩小原始数据集？

( 531.52 KB) 陈梦雯, 2016-10-12 10:39

回复︿（2）▪ 赞（1）

陈梦雯 8年前

尹刚 8年前

缩小项目集可以从去掉不活跃，动态少的项目。

其他还有什么困难吗？

赞回复︿

已经去掉了不活跃的项目，并且要复用了10个以上的项目，效果还是一般

困难：1、同现网络不知道用什么方法来分析，不知道预期目标能分析出什么

2、组合推荐怎么来评估推荐的好坏？人为推荐的话大多数时候我的知识还不够判断是不是应该一起复用。

赞回复︿

登录后可添加回复

陈梦雯 TO 毕业设计（基于复用网络的开源软件推荐技术研究） | 项目问题

【功能】 0929基于复用关系的相似软件推荐（大论文第二章）除实验结果分析部分正常

指派给陈梦雯

发布时间： 2016-09-29 20:24

更新时间：2016-10-07 20:58

主要内容

1、开源软件复用生态系统（小论文）

构造 - 数据爬取、处理、建模为网络

分析 - 社交网络分析方法、复用网络分析结果

2、相似开源软件推荐

以依赖包为软件项目的特征

模拟TF-IDF模型构建项目空间向量 Project = {dependency1, dependency2,...,dependencyk}

利用余弦模型计算相似度

实验测试集

选取了watch !=0 and fork !=0 and star !=0 and 复用依赖包数量 >10 的软件项目，共 6652个

目前，实验结果分析还没有写。

没有想好怎么去对实验结果进行评测分析

( 480.7 KB) 陈梦雯, 2016-09-29 17:39

回复︿（2）▪ 赞

陈梦雯 8年前

张洋 8年前

实验测试集，那些deleted=1的项目有去掉吧？

赞回复︿

最初的数据集已经去掉了deleted=1，fork=1这些了

赞回复︿

登录后可添加回复

陈梦雯 TO 毕业设计（基于复用网络的开源软件推荐技术研究） | 项目

毕业设计（基于复用网络的开源软件推荐技术研究）

创建时间：2016-09-27 10:05

Trustie(确实)
QQ群：1071514693

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议

加入QQ群

关注微信APP

提
问

×