AIGC下的软件工程新范式论坛
2023年12月1日(星期五),08:30 – 18:00
上海国际会议中心,3C+D会议室
论坛简介
大模型的问世给智能化软件工程技术带来了一波的研究热潮,各种智能化软件工程技术不断涌现。本论坛致力于探索智能化软件工程的前沿技术和应用,将讨论和分享关于利用基于大模型的智能化软件工程技术进行软件开发和工程管理的最新研究成果、方法论、实践案例,以及未来的发展趋势,以推动软件工程的智能化进程,实现软件的自动化设计、开发和维护,提高软件的质量和生产效率。
论坛日程
时间 | 主题 | 嘉宾 |
---|---|---|
08:30 – 08:40 | 论坛介绍 | 刘逵 |
08:40 – 09:10 | DebugPilot:人机协同的代码调试过程生成技术 | 林云 |
09:10 – 09:40 | AI时代下的软件多缺陷隔离定位技术 | 谢晓园 |
09:40 – 10:10 | 数据驱动的芯片软件测试 | 陈俊洁 |
茶歇 10:10 – 10:40 | ||
10:40 – 11:10 | 大语言模型下的软件漏洞管理 | 胡星 |
11:10 – 11:40 | 智能化在测试和程序分析领域的挑战与机遇 | 王少华 |
11:40 – 12:10 | 大模型助力移动应用质量保障:技术、现状与趋势 | 王俊杰 |
中午休息 12:10 – 14:00 | ||
14:00 – 14:30 | 基于大模型的软件开发自动化 | 李戈 |
14:30 – 15:00 | 基于交互式需求澄清的大模型代码生成框架 | 石琳 |
15:00 – 15:30 | 规则到大模型:程序自动分析与生成 | 刘烃 |
15:30 – 16:00 | 关于大语言模型时代的的代码数据泄漏问题的实证研究 | 曹嘉伦 |
茶歇 16:00 – 16:30 | ||
16:30 – 17:00 | LLM在软件供应链相关应用上的探索 | 展鹇 |
17:00 – 17:30 | 代码模型的解释方法 | 王豫 |
17:30 – 18:00 | 关注质量属性的软件开发知识挖掘与管理 | 毕婷婷 |
论坛嘉宾

1.论坛嘉宾:林云(上海交通大学)
报告题目:DebugPilot:人机协同的代码调试过程生成技术
摘要: 随着大语言模型时代的到来,软件开发人员在编写代码的难度越来越小,然而,由于模型生成代码的随机性,测试和验证的代码的需求变得空前强烈。在可见的未来,越来越多的软件开发人员需要开始调试AI所生成的代码。在传统的代码调试问题往往会被建模成缺陷定位问题,各种技术旨在精确推荐出相关的代码行。然而,缺陷出错位置的验证往往包含大量的程序理解的工作量,这使得实践中对缺陷定位工具控制误报率要求极高,稍加出错就会使得人们失去对工具的信任。就这一问题,我们提出了DebugPilot技术,相比于缺陷定位技术,DebugPilot是一种代码调试过程推荐技术。DebugPilot可以合成对一段代码的调试过程,并以人机协同的方式来引导软件开发人员达到出错位置。具体而言,我们把代码调试问题转化成在一条程序执行轨迹上寻找出错第一个出错步骤的问题,由此调试过程生成问题也就转化成了在轨迹上(通过数据控制流产生的)找到最佳游走方案的问题。DebugPilot将轨迹最终出错位置视为起点,将轨迹首先出错步骤视为终点,生成一条从起点到(预估)终点的路径作为调试方案。一方面,该方案可以引导用户一步步寻找错误根因;另一方面,用户也可以在方案上做出反馈,来要求DebugPilot重新生成调试方案。通过人机协同的方式,DebugPilot来辅助程序员完成开发任务。我们的模拟实验和用户实验表明,DebugPilot能够有效地生成可靠的调试方案,并且工具设计能够引导用户快速定位问题,加速程序理解。
简介: 上海交通大学计算机系副教授,系主任助理,博士生导师,原新加坡国立大学助理教授(研究岗),入选2021年国家海外高层次青年人才计划。主要研究领域为软件工程,侧重代码、网页和AI模型的自动分析技术。目前的研究工作包括代码自动调试与测试、模型训练的可视化解释、恶意网页检测、基于大语言模型的代码编辑与生成、以及日志分析等。在ICSE、FSE、USENIX Security、ISSTA、ASE、 NeurIPS、AAAI、IJCAI、KDD、TSE、TDSC等领域相关的国际顶级会议和期刊发表论文40余篇,国内外专利受理2项。担任PRDC2023国际会议程序委员会联合主席,以及FSE、USENIX Security、ISSTA、ICML、NeurIPS、AAAI等重要国际会议的程序委员会委员、IEEE TSE/ACM TOSEM/IEEE TDSC等顶级期刊的审稿人。主持国家基金委优青项目(海外)。获得过ICSE2018最佳论文奖。更多信息请参见:http://linyun.info/

2.论坛嘉宾:谢晓园(武汉大学)
报告题目:AI时代下的软件多缺陷隔离定位技术
摘要: 软件缺陷定位 (fault localization) 是软件开发过程中至关重要、但却需耗费巨大资源的任务。特别是在开发的中后期,集成测试所导致的软件失效往往需要遍历整个代码才可以确定出错原因。因此一直以来,研究人员都在试图寻找一种高效的“自动化缺陷定位技术”,目的在于尽可能减少人工操作,自动确定软件缺陷 (bug或fault) 的位置或原因。现阶段AI技术的兴起,极大程度上赋能了上述任务,特别是在一些复杂场景下,经典方法难以胜任,而AI-based的技术则可以更精准更高效地进行定位。本报告将聚焦于经典缺陷定位问题中的 “多缺陷定位” (fault isolation) 难题展开,介绍 “先隔离,再定位” 的思路,并汇报我们在近期取得的一系列成果。具体来说,包括了基于基因编程的多缺陷隔离、基于内存索引的多缺陷隔离等技术,这些方法可以大幅减轻程序员工作负担,提高调试的工作效率。
简介: 武汉大学教授、博导,珞珈青年学者,特色化示范性软件学院副院长,国家基金委外国优秀青年学者研究基金获得者。主要研究方向为蜕变测试、软件缺陷定位、智能软件工程等。主持国家自然科学基金面上项目、参与国家自然科学基金重点项目和国家重点研发项目等。在软件工程顶级或知名期刊会议上录用论文50余篇。获NASAC青年软件创新奖、ACM SigEvo HUMIES银奖、ACM SigSoft Distinguished Paper Award、湖北省科技进步一等奖、QSIC最佳论文奖等奖项。担任FCS青年AE、JSS客座编辑、IEEE/ACM 蜕变测试研讨会PC Chair,以及包括CCF A类会议ASE、ICSE在的多个国际会议PC members,及CCF A类期刊TSE、TOSEM的审稿人。

3.论坛嘉宾:陈俊洁(天津大学)
报告题目:数据驱动的芯片软件测试
摘要: 为了保证芯片功能的正确性,在芯片软件(CDI)上进行充分测试是必不可少的,其中CDI是用硬件描述语言对所设计的芯片进行的软件实现。由于巨大的输入空间和输入中变量间复杂的约束,仍然存在许多难以覆盖的功能点,叫做最后一英里功能覆盖。本研究针对这一重要挑战,提出首个攻克最后一英里功能覆盖的技术LMT。LMT首先基于机器学习中特征选择的思想识别测试输入中与最后一公里功能点强相关的变量,以减小搜索空间,进而结合GAN网络生成满足复杂约束的合法测试输入。本研究将LMT部署于华为芯片软件测试中,将最后一英里功能覆盖率提升49.27%~75.09%。
简介: 天津大学智能与计算学部特聘研究员,博士生导师,软件工程团队负责人,国家优青项目获得者。研究方向主要为基础软件测试、可信人工智能、数据驱动的软件工程等。荣获中国科协青年托举人才、CCF优博、电子学会自然科学一等奖等奖项,连续两年(2021、2022)入围斯坦福大学发布的全球前2%顶尖科学家榜单。近年发表CCF A类论文60余篇,获六项最佳论文奖(包括五项CCF-A类会议ACM SIGSOFT杰出论文奖,以及一项CCF-B类会议ISSRE的唯一最佳论文奖)。成果在华为、百度等多家知名企业落地。担任CCF-A类会议ASE 2021评审过程主席,Dagstuhl研讨会联合主席,以及软件工程领域全部CCF-A类会议的程序委员会成员等。

4.论坛嘉宾:胡星(浙江大学)
报告题目:大语言模型下的软件漏洞管理
摘要: 大语言模型(LLM)等技术的兴起对软件工程领域带来了新的机遇和挑战,而漏洞管理一直是业界关注的重大问题。如何利用LLM更好地构建漏洞管理能力,特别是提前感知、检测和定位漏洞,是当前学术界和工业界关注的前沿热点。本次报告主要介绍当前基于LLM的漏洞管理技术,包括构建漏洞相关的大语言模型,以及基于此的漏洞提前感知、检测和定位技术。
简介: 博士,浙江大学软件学院副教授、特聘研究员,博士生导师,CCF软件工程专委会委员。主要研究方向为智能化软件工程,程序理解、软件仓库挖掘。在TOSEM、ICSE、ASE、FSE和EMSE等高水平会议和期刊上发表论文30余篇。主持国家自然科学基金专项培育项目,参与国家重点研发计划等多个科研项目。获得 ICPC 2018 ACM SIGSOFT Distinguished Paper Award。担任Internetware2023程序委员会主席,担任国际级顶级期刊(TSE、TOSEM、EMSE)审稿人,受邀担任国际会议ASE,MSR Data and Tool Showcase Track, ICSE Demo、SANER的程序委员会成员。

5.论坛嘉宾:王少华(华为软件工程应用技术实验室)
报告题目:智能化在测试和程序分析领域的挑战与机遇
摘要: 随着大模型能力不断的提升,学术和工业界都在跟踪和讨论智能化在测试和程序分析领域的使用。本次报告会讨论华为在测试和程序分析领域的一些工作,进而主要讨论在智能化的浪潮下,遇到的一些挑战和机遇。
简介: 华为软件教练/可信院软件工程应用技术实验室技术专家,当前主要领导团队构建下一代面向开发者的模糊测试平台,维护和升级公司级的模糊测试平台。入职前为新泽西理工大学Tenure-track 助理教授,软件工程方向博士生导师,美国自然基金 (NSF)软工方向项目评审专家,软工和AI领域顶刊顶会 (如AAAI,TSE, TOSEM,FSE) 审稿人, 加拿大女皇大学 (Queen’s University) 计算机科学博士。研究大方向是结合软件工程,程序分析,和人工智能技术帮助程序员开发高质量,高性能,安全和可靠的软件系统,代表研究课题如Bug和漏洞挖掘,根问题定位,程序自动修复,AI辅助程序分析等。他的学术成果发表在国际知名期刊和会议,如软件工程三大顶会:ICSE, FSE,ASE。

6.论坛嘉宾:王俊杰(中国科学院软件研究所)
报告题目:大模型助力移动应用质量保障:技术、现状与趋势
摘要: 大语言模型已经在各种领域的下游任务中展现出了令人惊叹的效果,这次报告将介绍我们研究团队近期利用大模型进行移动应用质量保障技术方面的一些工作,包括测试输入自动生成(ICSE2023)、GUI测试(ICSE2024)、面向输入文本的模糊测试技术(ICSE2024)、基于堆栈信息的缺陷自动复现(ICSE2024)等。此外,也会基于我们团队的综述《Software Testing with Large Language Model: Survey, Landscape, and Vision》,介绍基于大模型的软件测试方面的发展现状和趋势。
简介: 中国科学院软件研究所研究员,博士生导师,中国科学院特聘研究岗位,主要从事智能化软件工程、软件质量等方面的研究。近年来主要关注移动应用测试、智能软件测试、众包测试等。在国际著名学术期刊/会议发表50余篇高水平学术论文,四次荣获ACM/IEEE杰出论文奖。主持和参与了多项国家自然科学基金项目、科技部重点研发计划、CCF-华为胡杨林基金等。担任CCF A类期刊TSE的副主编(Associate Editor),FSE、ICST、ICSE demo等的PC member,以及TSE、TOSEM、EMSE、AUSE等期刊的审稿人。

7.论坛嘉宾:李戈(北京大学)
报告题目:基于大模型的软件开发自动化
摘要: 最近以GPT-4为代表的大模型技术的推出对软件开发技术产生了深刻影响。大模型的程序生成能力到底如何?在程序分析与生成方面存在哪些问题?未来的软件开发图景将会发生哪些变化?北京大学程序理解与生成研究团队,是基于深度学习的程序理解与生成领域的早期开拓和持续贡献团队。讲者以自身研究经历为背景,对基于大模型的程序理解与生成方法的研究历程和发展状态进行简要阐述,并着重对当前基于大模型的软件开发自动化中存在的问题进行探讨。
简介: CCF软件工程专委会秘书长,北京大学计算机学院长聘教授/博导,教育部长江学者。研究方向:程序生成、程序理解、深度学习,是国际上“基于深度学习的程序处理”方面的先驱性研究者,多项成果被国际学者认为是“首创性成果”并被广泛引用。多年来,所带领的研究团队在多项研究任务中一直保持着国际领先结果,是该领域国际知名的研究团队。曾获CCF科技发明一等奖。

8.论坛嘉宾:石琳(北京航空航天大学)
报告题目:基于交互式需求澄清的大模型代码生成框架
摘要: 大语言模型(比如ChatGPT)在软件开发的多个任务中展现出了令人惊叹的效果,加速推动了软件研发向新范式演化的进程。本次报告介绍基于大模型代码生成的研究进展,并分享我们围绕代码大语言模型,在代码生成能力优化方面的最新探索——一个能帮程序员写出好Prompt的交互式代码生成框架,以及大语言模型落地软件开发智能化的关键挑战和未来发展方向。
简介: 中国科学院大学博士,南京大学学士,美国南加州大学访问学者,现任北京航空航天大学软件学院教授。主要研究智能软件工程,包括代码生成、智能需求工程、开源社区挖掘、开源软件安全等。曾在人工智能、软件工程领域的高水平国际会议IJCAI,ICSE,FSE,ASE等发表论文50余篇,获得ACM SIGSOFT 杰出论文奖(ASE21),连续两年获得需求工程顶级会议最佳论文奖(RE20,RE21)。主持参与多项国家自然科学科学基金项目、国防科技创新项目、国家重点研发项目等。同时担任多个国际知名会议期刊包括ICSE、ASE、FSE、Automated Software Engineering期刊、Requirements Engineering期刊、软件学报等审稿人。

9.论坛嘉宾:刘烃(西安交通大学)
报告题目:规则到大模型:程序自动分析与生成
摘要: 人工智能技术使得机器对代码和人类需求的理解能力得到显著提升,为代码生成、测试、安全分析等提供了新的思路。本报告通过介绍团队近年来在自然语言驱动的程序生成和分析相关成果,包括SQL自动生成、Layout自动生成、隐私保护分析等,讨论人工智能技术与软件工程的结合。
简介: 博士,教授,国家级青年人才,西安交通大学网络空间安全学院副院长。主要研究方向包括智能软件工程和信息物理融合系统综合安全。2003年和2010年分别获西安交通大学学士和博士学位;2016-2017年美国康奈尔大学访问教授。获得2017年国家科技进步二等奖、2022年教育部自然科学一等奖等科技奖励6项。在ICSE、NeurlPS、TIFS等软工、人工智能、网络安全领域A类会议期刊上发表论文60余篇,获得2019 INFOCOM、2016 ISSRE等会议最佳论文奖5项。

10.论坛嘉宾:曹嘉伦(香港科技大学)
报告题目:关于大语言模型时代的代码数据泄漏问题的实证研究
摘要: 随着大语言模型在代码领域的广泛应用,研究者们常常试图分清一个方法在大语言模型上的出色表现究竟是由于大语言模型学习过该代码(数据泄漏),还是因为方法切实可行。为了进一步理解代码泄漏对代码任务方法评估的影响,我们尝试了现在常用来解决代码泄漏的多种方法(如使用训练截止日期之后的数据,或对代码进行重构)等,对比模型在代码改变前后的表现变化,从而探索现有的解决数据泄露问题方法的效果差异。
简介: 香港科技大学博士。主要研究领域是软件工程测试,包括深度学习系统测试,可信人工智能等方向。2019年开始就读于香港科技大学,师从张成志(Shing-Chi Cheung)教授。相关工作发表于领域重要期刊与会议如TOSEM,ESEC/FSE,ASE,ICSE,USENIX Security。入选2021年Chinasoft全国优秀博士,荣获华为博士奖学金等。

11.论坛嘉宾:展鹇(华为软件工程应用技术实验室)
报告题目:LLM在软件供应链相关应用上的探索
摘要: 随着ChatGPT问世,大语言模型在各种任务中的优秀表现,基于大语言模型完成的各种研究也逐渐趋于白热化。华为公司也在大语言模型的探索及其相关的运用上做了很多探索。本次报告将结合华为在软件供应链上的业务(如:开源软件选型,相似漏洞扫描,漏洞提前感知,成分分析,合规分析),分享我们在大模型应用上的经验、教训以及利弊得失,探讨大模型对软件供应链不同业务模块的适配度。
简介: 展鹇博士在华为2012实验室/软件工程应用技术实验室从事二进制成分分析技术以及软件供应链安全的研究。她毕业于香港理工大学计算机系,曾获得香港政府奖学金。研究方向包括恶意软件检测、克隆检测、软件成分分析、软件供应链安全等,成果发表在USENIX Security、ACM CCS、ICSE、ASE、ISSTA、TSE等顶级会议和期刊,并获得ICSE 2021 ACM SIGSOFT优秀论文奖。

12.论坛嘉宾:王豫(南京大学)
报告题目:代码模型的解释方法
摘要: 神经网络被广泛应用于编程语言任务,如方法名称预测、程序修复和程序合成等,取得显著成效。但这些神经网络模型通常以黑盒形式运行,使其内部机制难以理解,影响预测的可信度。本报告介绍WheaCha,一种解释代码模型预测结果的方法,分为关键代码片段(Wheat)与其余代码(Chaff)。我们提出的HuoYan方法能从粗粒度到细粒度有效查找关键代码片段。实验表明,HuoYan能准确高效地识别Wheat,优于现有解释方法。用户调查也显示WheaCha解释有助于识别模型缺陷。
简历: 王豫博士是南京大学毓秀博士后,研究领域涵盖软件测试和智能化软件工程。已在PLDI、OOPSLA、TSE、ISSTA、JCST、软件学报等国际期刊会议发表多篇论文。开发的工具在NASAC原型竞赛中获二等奖,已在阿里、华为等公司应用。

13.论坛嘉宾:毕婷婷(CSIRO data61 & University of Western Australia)
报告题目:关注质量属性的软件开发知识挖掘与管理
摘要: 软件开发是知识密集型过程,涉及软件工程开发知识的管理。该知识遍及开发生命周期,但常分散于各类文档中,特别是质量属性如安全性对系统影响巨大。随AI技术成为战略技术,确保AI系统质量属性成挑战。我们采用多层、多方面、多阶段且相互连接的模式确保AI系统质量。
简历: 毕婷婷博士是Data61研究员,西澳大学计算机与软件学院讲师。在John Grundy教授指导下于莫纳什大学获得博士学位,研究领域为软件架构知识工程、实证软件工程、可信AI。目前关注AI知识驱动工程和质量属性研究。
论坛主席

1.论坛主席:刘逵(华为)
简介:
华为2012实验室智能化软件工程技术专家。2019年毕业于卢森堡大学,获得软件工程专业博士学位,2020年入职南京航空航天大学,2021年12月入职华为,主要从事软件编码、软件测试、程序分析、代码检视等智能化软件工程工作,在软件工程领域发表高水平研究论文40余篇,其中CCF A类期刊/会议论文20余篇,曾任南京航空航天大学计算机科学与技术学院副教授,主持过国家自然科学基金面上项目一项,江苏省自然科学基金青年项目一项,参与国家重点研发计划项目两项,担任IEEE TSE、ACM TOSEM、EMSE、《软件学报》、ICSME、SANER等国际期刊/会议审稿人。

2.论坛主席:刘辉(北京理工大学)
简介:
CCF杰出会员,北京理工大学教授/博导,智能软件与软件工程研究所副所长。长期从事软件开发环境方面的研究工作,在ICSE、ESEC/FSE、ASE、ISSTA、IEEE TSE、ACM TOSEM等发表录用三十余篇学术论文,部分成果被Eclipse等主流IDE采纳集成。获得ICSE 2022杰出论文奖、RE 2021最佳论文奖、IET Premium Award(2016) 、北京市技术发明二等奖。

3.论坛主席:夏鑫(华为)
简介:
夏鑫目前担任华为软件工程应用技术实验室主任。他的研究方向是智能化软件工程、软件仓库挖掘和经验软件工程。夏鑫至今发表了300多篇论文,其中包括130多篇CCF A类期刊和会议长文, 谷歌学术引用1.3万多次,H-index 64。夏鑫获得了2022年ACM SIGSOFT Early Career Researcher Award(亚太地区第一位),部分论文获得国际会议最佳/杰出论文奖项,包括6篇ACM SIGSOFT 杰出论文奖(连续四年获得软工顶会ASE 2018-2021的杰出论文奖)。此外他担任MSR、SANER、PROMISE等会议的Steering Committee,多个国际会议的PC (ICSE,ESEC/FSE, ASE等),多个期刊的编委(TOSEM、EMSE、ASEJ、JSEP等),以及参与组织了多个国际会议(ICSE 2023和2024, ASE 2016、2020和2021等)。