学术论坛

优秀青年学者论坛

2022年11月27日(8:30-12:30)



论坛简介

CCF中国软件大会优秀青年学者论坛旨在为国内从事软件工程、系统软件、形式化方法及其相关领域研究的青年科学家提供一个分享和交流其最新高水平成果的平台,汇集该领域的一线青年科学家共同探讨国内外相关领域的发展趋势和潮流,促进不同领域的交叉融合,以进一步促进中国青年软件人才成长,激励中国青年软件人才“面向世界科技前沿、面向国家重大需求、面向国民经济主战场”,立足自主创新与实践,从而为推动中国软件发展做出重要贡献。同时,非常欢迎理论计算机科学、程序语言、嵌入式系统、网络与信息安全、人工智能等相关领域的学者前来参加,共话发展!

📢 【腾讯会议号】  562466129
📢 【直播链接】【点击观看视频直播】
📢 【B站直播】【点击观看B站直播】

论坛日程

时间 报告题目 嘉宾
08:30-08:40 论坛开幕、嘉宾介绍
08:40-09:05 面向人工智能的数据准备技术:机遇与挑战 范举
09:05-09:30 下一代APT攻击检测系统 李锭
09:30-09:55 机器学习引导的硬件模型检验技术 张弘策
09:55-10:20 程序语义信息感知的云计算系统 王晨曦
10:20-10:45 Learning to Construct Better Mutation Faults 陈俊洁
10:45-11:10 逻辑和概率结合的程序分析 张昕
11:10-11:35 数据驱动的复杂智能软件系统质量保障 冯洋
11:35-12:00 智能化漏洞管理 鲍凌峰
12:00-12:25 On the Properties of Kullback-Leibler Divergence Between Multivariate Gaussian Distributions 张羽丰
12:25-12:30 嘉宾合影

论坛嘉宾




1.论坛嘉宾:范举(中国人民大学)

报告题目:面向人工智能的数据准备技术:机遇与挑战

摘要: 数据是构建人工智能系统的核心要素——如果没有正确的数据,人工智能系统不仅会面临错误风险,而且会因偏置等问题给社会带来危险。因此,数据准备技术,即如何系统地解决数据质量、数据偏差、数据标注等难题,正在成为人工智能的关键基础能力之一。尽管其中的一些问题(如数据集成、数据清洗等)是数据管理领域长期以来的研究热点,人工智能的独特场景带来了一系列全新的挑战。围绕这些挑战,近年来数据管理与机器学习领域进行了深入的研究。本报告聚焦面向人工智能的数据准备技术进行分享。首先是介绍面向人工智能的数据准备基本问题与关键挑战;其次是梳理现有的研究工作,并介绍一些关键性的进展,包括面向机器学习的数据发现/合成、成本高效的数据集成/清洗、人机混合的数据标注等;最后是对一些尚待解决的问题与研究挑战进行探讨。

简介: 范举,中国人民大学数据工程与知识工程教育部重点实验室教授,博士生导师,国家自然科学基金优秀青年基金获得者。目前的研究方向包括:基于人工智能的数据库技术(AI4DB)、人在回路的数据准备、大数据管理与分析等。近年来,作为负责人先后主持国家自然科学基金优秀青年基金项目、重点项目课题、面上项目、青年项目,以及多项产学研合作项目。相关研究成果在SIGMOD、VLDB、ICDE、TKDE等CCF-A类期刊和会议上发表论文40余篇。获得2017年度ACM中国新星奖、中国人民大学教学标兵等奖励。





2.论坛嘉宾:李锭(北京大学)

报告题目:下一代APT攻击检测系统

摘要: APT攻击是由专业或政府机构针对特定目标实施的高隐蔽性复杂攻击,是当前互联网安全的重大威胁。美国针对西北工业大学的攻击,说明了我国互联网也面临着来自境外专业势力的APT攻击威胁。由于APT攻击的复杂性和专业性,当前针对APT攻击的防御方法面临着准确率不足,自动化程度低和成本过高的问题。本次报告,将从系统构建和算法设计两个方面讨论当前APT攻击防御方法面临的主要问题和我们的相关研究。

简介: 北京大学研究员,博士生导师,国家级青年人才称号获得者。2016年博士毕业于美国南加州大学。长期从事系统运行日志监控技术及其在系统安全领域的应用。其开发的技术被NEC公司应用到其商业化的安全产品中,共申请美国专利12项(已授权3项,已公开9项),并因此获得了NEC公司2017年度的商业贡献奖和2018年度的优秀发明奖。李锭在相关学术会议上共发表论文34篇(安全和软工顶会论文17篇,顶会一作或通讯10篇),根据谷歌学术搜索的数据,截至2021年5月31日,申请人的论文一共获得超过1800次引用,近5年的引用数超过1400次。发表在知名学术期刊 《The Journal of Systems and Software》的评论文章“A bibliometric assessment of software engineering scholars and institutions”对2010到2017年世界范围内从事软件工程相关研究的学者进行了对比和排名,李锭被评为在全球第2最有影响力的年轻学者。





3.论坛嘉宾:张弘策(香港科技大学(广州))

报告题目:机器学习引导的硬件模型检验技术

摘要: 现代大规模集成电路的设计与验证离不开软件工具的辅助,硬件模型检验技术广泛应用于数字电路的形式化属性检查,这其中如何提升模型检验算法的性能是一个核心问题。由于在实践中优异的性能,属性引导的可达性算法(PDR算法)被众多硬件模型检验工具采用。PDR算法中的可归纳子句泛化方法大多采用最小可归纳子句的方式实现,其本质上是在寻找局部最优的泛化方式,因此存在局部过泛化等问题,影响算法的整体收敛速度。本次报告将会介绍我们利用机器学习引导可归纳子句泛化从而加速PDR算法收敛的研究尝试,包括可归纳子句泛化问题的机器学习编码,经典算法与机器学习方法的结合方式,以及在算法实现方面的考量。

简介: 张弘策,香港科技大学(广州)功能枢纽微电子学域助理教授。博士毕业于美国普林斯顿大学电子与计算机工程系,主要从事硬件领域内的形式化方法的研究,相关研究工作获得2020 ACM 电子设计自动化期刊TODAES最佳文章奖。参与开发了模型检测工具Pono,指令集建模与验证工具ILAng,均在工业界得到了应用。担任了DAC等国际顶级会议审稿人。





4.论坛嘉宾:王晨曦(中国科学院计算技术研究所)

报告题目:程序语义信息感知的云计算系统

摘要: 随着云应用的多样化和数据中心硬件的异质化,云计算逐渐展现出两个层次的问题:(1)上层应用难以直接受益于底层新型硬件的高性能、低功耗等特性。而造成该问题的原因在于,现有的通用云计算系统软件栈难以理解上层应用的计算、访存语义信息,也缺少对底层新型硬件的优化。也就是说,在底层硬件和上层应用之间出现了一个语义鸿沟(Semantics gap),造成了性能、延迟、功耗等一系列问题。(2)不同类型的应用的设计目标不同,当他们共享一台服务器时,会产生严重的资源竞争和算法干扰,造成性能、延迟波动。报告人将根据自身在资源解耦合平台的系统开发经验,和大家一起探讨以上两个问题的解决方案,并分享自己对未来云计算系统发展的一些看法。

简介: 王晨曦,中国科学院计算技术研究所副研究员。研究方向为面向数据中心构建跨编程语言、运行时、操作系统的云计算系统软件。其研究成果发表在了OSDI、PLDI、NSDI等领域顶级会议,以及TOCS、TDSC等领域顶级期刊,并获得了OSDI 2022 最佳论文奖、ACM Chinasys 新星奖等。此外,王晨曦还担任了ASPLOS、VEE、ISMM等国际学术会议的评委、外部评委。





5.论坛嘉宾:陈俊洁(天津大学)

报告题目:Learning to Construct Better Mutation Faults

摘要: Mutation faults are the core of mutation testing. There are many traditional techniques that construct syntactic mutation faults based on a limited set of manually-defined mutation operators. To improve them, the state-of-the-art deep-learning (DL) based technique (i.e., DeepMutation) has been proposed to construct mutation faults by learning from real faults via classic sequence-to-sequence neural machine translation (NMT). However, its performance is not satisfactory as it cannot ensure syntactic correctness of constructed mutation faults and suffers from the effectiveness issue. In this work, we propose a novel DL-based mutation technique (i.e., LEAM) to overcome their limitations. LEAM adapts the syntax-guided encoder-decoder architecture by extending a set of grammar rules specific to our mutation task, to guarantee syntactic correctness of constructed mutation faults. It predicts the statements to be mutated under the context of the targeted method to reduce search space, and then predicts grammar rules for mutation fault construction based on both semantic and structural features in AST. We conducted an extensive study to evaluate LEAM based on Defects4J. The results demonstrate that the mutation faults constructed by LEAM can not only better represent real faults, but also substantially boost two important downstream applications of mutation faults, i.e., test case prioritization and fault localization.

简介: 陈俊洁,天津大学特聘研究员、博士生导师,软件工程团队负责人。博士毕业于北京大学,并荣获2019年CCF优博。研究方向为软件分析与测试、数据驱动的软件工程、人工智能安全等。近年共发表学术论文60篇,其中CCF A类论文40篇,获得六项最佳论文奖(包括ASE 2019、ISSTA 2019 、FSE 2020、FSE 2021、ASE 2022的ACM SIGSOFT Distinguished Paper Award,以及ISSRE 2021的Best Research Paper Award);成果在华为、百度等多家知名企业落地;担任CCF-A类会议ASE 2021评审过程主席,软件学报专刊特邀编辑,Dagstuhl研讨会联合主席,以及软件工程领域全部CCF-A类会议的程序委员会成员。





6.论坛嘉宾:张昕(北京大学)

报告题目:逻辑和概率结合的程序分析

摘要: 传统程序分析均基于逻辑,有着能精确表达设计者意图、提供形式化保证、可解释等优点。但其无法处理分析中的各种不确定性,并无法刻画分析结果的准确度。我们提出向传统分析中加入概率,通过概率来刻画分析规则、结果的准确度,在保留传统分析的优点同时,获得处理不确定性、学习及自适应的能力。本演讲将探讨逻辑和概率结合程序分析的思想、框架和典型应用。

简介: 北京大学研究员兼助理教授,博士生导师,国家级青年项目入选者。上海交通大学学士,美国佐治亚理工学院博士,2017- 2020年于美国麻省理工学院任博士后,2020年加入北京大学。研究领域为程序设计语言和软件工程,重点为编程系统和机器学习的交叉方向。一方面,利用机器学习技术来提高程序分析等编程系统的可用性,另一方面,开发了新的程序分析和语言以提高机器学习系统的质量。工作发表在 PLDI、POPL、FSE、NeurIPS 等顶级会议上,获 PLDI'14 和 FSE'15 杰出论文奖。曾任 PLDI等国际会议程序委员会委员。





7.论坛嘉宾:冯洋(南京大学)

报告题目:数据驱动的复杂智能软件系统质量保障

摘要: 随着物联网、5G、及人工智能技术的发展与普及,包含智能组件的软件系统逐渐被广泛应用于包括车辅助驾驶、人脸识别支付、语音识别、自然语言翻译等领域。由于该类系统可能会对安全、交通、能源等产生重大影响,世界各国均投入了大量的资源进行研发。然而,与传统软件系统不同,应用于实际任务的智能软件系统通常是信息-物理融合系统,需要通过对外界物理环境,用户输入与反馈,系统内部交互等多源信息进行融合,以完成各类复杂的预定义任务。这些特性为智能软件系统的测试带来了新的机遇与挑战,也使得智能软件系统质量保障技术的研究成为了软件工程领域关注的一个热点问题。本报告主要从智能软件系统的质量保障问题角度,总结了当前智能软件系统测试技术研发的难点与挑战,并汇报了我们提出的针对对话系统,自动驾驶系统,翻译系统等智能软件系统的数据驱动质量保障技术与方法。

简介: 冯洋,南京大学计算机科学与技术助理研究员。研究方向为软件质量保障,具体研究课题包括复杂智能软件系统的质量保障技术,基于程序设计语言的软件质量保障等。近年来在软件工程领域的ICSE、FSE、ASE、ISSTA、TSE、TOSEM等CCF-A类期刊与会议发表学术论文20余篇,并于2022年ASE大会获ACM 优秀论文奖。申请发明专利多项,部分专利成果已经在百度、阿里、华为等知名软件公司转化;担任多个期刊审稿人及国际会议程序委员会成员。





8.论坛嘉宾:鲍凌峰(浙江大学)

报告题目:智能化漏洞管理

摘要: 随着软件产业的飞速发展,软件漏洞的规模急剧增长,带来了严重的安全风险。当前漏洞的管理主要遵循协同漏洞披露流程,在整个流程中都需要对漏洞及其相关信息进行有效的追踪和管理。本报告主要介绍在智能化漏洞管理中的几个个研究工作:在漏洞还未被确认前,漏洞信息可能会在一些公开渠道(例如缺陷报告、修复补丁)泄露。这些提前泄露的漏洞信息可能会造成严重的安全问题。针对缺陷报告和修复补丁,我们分别提出了基于深度学习的技术提前感知这些漏洞信息,并提供一定的可解释性。这些技术可以有效地从极端不平衡的数据中识别和漏洞相关的信息。此外,我们也发现很多在公开渠道的漏洞信息(例如NVD/CVE)并不是可靠,例如漏洞所影响的软件版本信息。我们提出了一种针对漏洞的SZZ算法,可基于漏洞修复补丁识别引入漏洞的代码变更,进一步地,可以精准推断出漏洞影响的软件版本信息。

简介: 鲍凌峰,浙江大学计算机科学与技术学院副教授。研究方向为软件工程,包括人因软件工程、软件仓库挖掘、经验软件工程等。已在软件工程高水平会议和期刊ICSE、FSE、ASE、TSE、TOSEM等发表论文近40篇。受邀担任ASE、ICSME、SCAM、QRS等国际学术会议程序委员,以及TSE、TOSEM、EMSE等国际期刊的审稿人。





9.论坛嘉宾:张羽丰(湖南大学)

报告题目:On the Properties of Kullback-Leibler Divergence Between Multivariate Gaussian Distributions

摘要: Kullback-Leibler (KL) divergence is one of the most important divergence measures between probability distributions. In this paper, we prove several properties of KL divergence between multivariate Gaussian distributions using mathematical optimization techniques. First, for any two n-dimensional Gaussian distributions N_1 and N_2, we give the supremum of KL(N_1 ||N_2) when KL(N_2 ||N_1 )≤ε (ε>0). For small ε, we show that the supremum is ε+2ε^1.5+O(ε^2). This quantifies the approximate symmetry of small KL divergence between Gaussians. We also find the infimum of KL(N_1 ||N_2) when KL(N_2 ||N_1 )≥M (M>0). We give the conditions when the supremum and infimum can be attained. Second, for any three n-dimensional Gaussians N_1, N_2, and N_3, we find an upper bound of KL(N_1 ||N_3) if KL(N_1 ||N_2 )≤ε_1 and KL(N_2 ||N_3 )≤ε_2 for 〖ε_1,ε〗_2>0. For small 〖ε_1,ε〗_2, we show the the upper bound is 〖〖3ε〗_1+3 ε〗_2+2√(ε_1 ε_2 )+O(ε_1 )+O(ε_2). This reveals that KL divergence between Gaussians follows a relaxed triangle inequality. Importantly, all the bounds in the theorems presented in this paper are independent of the dimension n. Finally, We discuss the applications of our theorems in explaining counterintuitive phenomenon of flow-based model, deriving deep anomaly detection algorithm, and extending one-step robustness guarantee to multiple steps in safe reinforcement learning. Kullback-Leibler (KL) divergence is one of the most important divergence measures between probability distributions. In this paper, we prove several properties of KL divergence between multivariate Gaussian distributions using mathematical optimization techniques. First, for any two n-dimensional Gaussian distributions N_1 and N_2, we give the supremum of KL(N_1 ||N_2) when KL(N_2 ||N_1 )≤ε (ε>0). For small ε, we show that the supremum is ε+2ε^1.5+O(ε^2). This quantifies the approximate symmetry of small KL divergence between Gaussians. We also find the infimum of KL(N_1 ||N_2) when KL(N_2 ||N_1 )≥M (M>0). We give the conditions when the supremum and infimum can be attained. Second, for any three n-dimensional Gaussians N_1, N_2, and N_3, we find an upper bound of KL(N_1 ||N_3) if KL(N_1 ||N_2 )≤ε_1 and KL(N_2 ||N_3 )≤ε_2 for 〖ε_1,ε〗_2>0. For small 〖ε_1,ε〗_2, we show the the upper bound is 〖〖3ε〗_1+3 ε〗_2+2√(ε_1 ε_2 )+O(ε_1 )+O(ε_2). This reveals that KL divergence between Gaussians follows a relaxed triangle inequality. Importantly, all the bounds in the theorems presented in this paper are independent of the dimension n. Finally, We discuss the applications of our theorems in explaining counterintuitive phenomenon of flow-based model, deriving deep anomaly detection algorithm, and extending one-step robustness guarantee to multiple steps in safe reinforcement learning.

简介: 现任湖南大学信息科学与工程学院副教授,硕士生导师,中国计算机学会形式化方法专委会委员。博士毕业于国防科技大学计算机学院,毕业后任江南计算机技术研究所助理研究员,2020年加入湖南大学信息科学与工程学院。研究方向为高可信软件、程序分析与测试、人工智能。主持国家自然科学青年基金,参与多项973、863、核高基、科技部重点研发、国防预研等项目。在ICSE、ASE、FSE、ISSTA、ISSRE、IEEE-TSC等顶级国际会议及期刊上发表论文十余篇。



论坛主席





1.论坛主席:詹博华(中国科学院软件研究所)

简介: 詹博华,博士,中科院软件所计算机科学国家重点实验室副研究员。主要研究主要工作包括证明自动化方法和交互式定理证明器的设计与实现,嵌入式系统的建模与验证方法,以及在程序验证、操作系统、分布式系统、量子程序验证的应用。在CAV, IJCAR/CADE, TACAS, ITP, J. Automated Reasoning 等形式化方法领域的主要会议和期刊发表文章30余篇。






2.论坛主席:左志强(南京大学)

简介: 左志强,南京大学计算机科学与技术系长聘副教授,新加坡国立大学博士,加州大学欧文分校博士后。主要研究领域为系统软件、编译器优化及设计等。其研究成果发表在一系列顶级学术会议和期刊上,如PLDI、OOPSLA、OSDI、ACM TOCS、ICSE等,相关研究技术和系统已经在多个企业实现转化与应用。担任多个会议程序委员(如PLDI 2022 PC、FSE 2022 PC、ASPLOS 2020/2022 ERC等)以及期刊审稿人(如TSE、JCST等)。






3.论坛主席:王璐(西安电子科技大学)

简介: 王璐,博士,西安电子科技大学计算机科学与技术学院副教授,西电“华山人才”系列,CCF高级会员,CCF软件工程专委会秘书、系统软件专委会执行委员,CCF首批传播大使。主要研究方向为微服务与智能化运维AIOps、软件演化与自适应,在ICSE、FSE、SANER、ICSME等国内外期刊与会议上发表论文30余篇并担任会议PC及期刊审稿人,入选陕西省科协青年人才托举计划、获陕西省科学技术进步奖二等奖等科技奖励四项,2021年陕西省优秀博士学位论文等。