由Nigel 更新于 2017-04-15 10:03
1. 论文阅读
a) Summarizing software artifacts: a case study of bug reports(ICSE 2010)
b) Modelling the ‘Hurried’ Bug Report Reading Process to Summarize Bug Reports(ESE 2015)
两篇文章介绍了如何自动化抽取bug report的summary,帮助更好理解bug report。主要思想是提取bug report描述和讨论中关键短语。根据人为定义的特征(包括评论时间,第x条评论,作者评论等)使用机器学习分类方法,提取关键短语进行整合。
借鉴之处:利用他们的方法得到代码文件summary
不同之处:已有的方法缺少对自然语言处理方法的使用,同时仅仅局限在bug report中,我们可以通过适当的改进让方法可以使用我们的summary提取。
c) ChangeScribe: A Tool for Automatically Generating Commit Messages(ICSE 2015)
这篇文章介绍了自动提取commit message的方法,即如何分析版本之间的代码变更,生成可理解的注释。
借鉴之处:我们的summary文本信息中包括代码级信息,因此可以借鉴这种方法,看直接通过代码信息能不能生成有用的文本描述。
d) Deep API Learning(FSE 2016)
这篇文章是曾雅蓉在师门报告会上介绍的文章
借鉴之处:里面介绍了根据注释信息提取summary的思路,虽然文中使用的方法比较简单,而且仅仅是针对java项目的,但是我们可以借鉴并应用到其他项目中,观察使用效果。
2. 研究点(生成开源代码文件summary)
可以利用的文本信息包括:
a) issue/pr描述信息和评论信息(处理方法如1.a/1.b);
b) commit message信息(处理方法考虑同issue和pr的处理方法);
c) 代码内部的注释信息(处理方法如1.d);
d) 代码(处理方法如1.c)
3. 下一步工作
a) 帮助杨程师兄完成论文的扩展工作
b) 复现论文1.a/1.b中的方法,初步完成对issue和pr文本信息的处理。
1. 论文阅读
a) Summarizing software artifacts: a case study of bug reports(ICSE 2010)
b) Modelling the ‘Hurried’ Bug Report Reading Process to Summarize Bug Reports(ESE 2015)
两篇文章介绍了如何自动化抽取bug report的summary,帮助更好理解bug report。主要思想是提取bug report描述和讨论中关键短语。根据人为定义的特征(包括评论时间,第x条评论,作者评论等)使用机器学习分类方法,提取关键短语进行整合。
借鉴之处:利用他们的方法得到代码文件summary
不同之处:已有的方法缺少对自然语言处理方法的使用,同时仅仅局限在bug report中,我们可以通过适当的改进让方法可以使用我们的summary提取。
c) ChangeScribe: A Tool for Automatically Generating Commit Messages(ICSE 2015)
这篇文章介绍了自动提取commit message的方法,即如何分析版本之间的代码变更,生成可理解的注释。
借鉴之处:我们的summary文本信息中包括代码级信息,因此可以借鉴这种方法,看直接通过代码信息能不能生成有用的文本描述。
d) Deep API Learning(FSE 2016)
这篇文章是曾雅蓉在师门报告会上介绍的文章
借鉴之处:里面介绍了根据注释信息提取summary的思路,虽然文中使用的方法比较简单,而且仅仅是针对java项目的,但是我们可以借鉴并应用到其他项目中,观察使用效果。
2. 研究点(生成开源代码文件summary)
可以利用的文本信息包括:
a) issue/pr描述信息和评论信息(处理方法如1.a/1.b);
b) commit message信息(处理方法考虑同issue和pr的处理方法);
c) 代码内部的注释信息(处理方法如1.d);
d) 代码(处理方法如1.c)
3. 下一步工作
a) 帮助杨程师兄完成论文的扩展工作
b) 复现论文1.a/1.b中的方法,初步完成对issue和pr文本信息的处理。