学术论坛

开源软件论坛

2022年11月25日(8:30-12:30)



论坛简介

本次论坛聚焦软件工程前沿理论突破和相关技术在行业中的实践应用。在这数字化和软件定义一切的时代,软件已经成为了重要的基础设施。软件工程的前沿理论和技术实践需要不断的突破,以提升软件工程能力和软件开发的效率,从而适应频繁变化的应用需求和动态多变的应用场景。当前华为公司拥有近千亿行代码量的海量软件资产,支撑了ICT产品、终端、云、车等诸多领域的软件产品。复杂多变的软件形态和海量的软件开发数据对华为软件工程能力提出了重大的挑战。本次论坛拟邀请华为软件工程技术专家和学术界软件工程领域的杰出学者,从软件供应链、开源软件、智能化软件工程、软件测试等多个研究方向探讨软件工程的前沿研究和业界实践。

📢 【腾讯会议号】  241178212
📢 【直播链接】【点击观看视频直播】
📢 【B站直播】【点击观看B站直播】

论坛支持单位

北京大数据先进技术研究院

红山开源平台

论坛日程

时间 报告题目 嘉宾
8:30-8:35 开场 周明辉
8:35-8:50 开源软件容器化构建的延迟分析与预测 张洋
8:50-9:05 开源软件版本发布说明的挑战、实践与未来 武健宇
9:05-9:20 GitHub项目中的Good First Issues 的自动化推荐 肖文鑫
9:20-9:35 语言边境线的“防控”:跨越程序语言生态的安全漏洞传播治理 王莹
9:35-9:50 软件中代码注释质量的评估标准与自动度量 王潮
9:50-10:05 深度学习软件供应链初探 高恺
10:05-10:20 开源软件生态中的公司主导 张宇霞
10:20-10:35 是什么激励着软件实践者为内源项目做出贡献? 万志远
10:35-10:50 基于加密货币的开源项目激励机制研究 谭鑫
10:50-11:05 红山开源平台发展理念与实践探索 李光杰
11:05-11:20 开源devops项目实践分享-建木 章津楠
11:20-12:30 Panel:开源软件可持续发展 胡欣蔚 谭中意 王涛 章津楠 张宇霞 邹欣

论坛嘉宾




1.论坛嘉宾:张洋(国防科技大学)

报告题目:开源软件容器化构建的延迟分析与预测

摘要: Docker构建在软件容器化工作流中扮演着十分重要的角色,它旨在根据配置文件中的指令,将源代码打包并封装为Docker镜像,进而发布到镜像托管社区。本研究立足于大规模开源软件的Docker构建历史数据,围绕Docker构建延迟的分析和预测问题展开了深入探索。研究首先对开源软件的Docker构建延迟现状进行定量分析,并利用问卷调查了解实际开发者的痛点和看法,进一步从Docker配置、上下文信息中提取多维度特征指标,采用8种机器学习算法构造了Docker构建延迟预测模型,并通过多种实验验证了模型的性能。研究揭示了目前Docker构建延迟过长问题的普遍性,并提供了初步的解决方案。

简介: 张洋,国防科技大学计算机学院PDL重点实验室助理研究员,主要从事开源软件、软件版本库挖掘、DevOps等方面的研究与应用实践工作,获评湖南省优秀博士论文奖(2021)和IEEE TCSE杰出论文奖(SANER 2022),参与国家自然科学基金、国家重点研发计划项目多项,发表学术论文20余篇,作为核心骨干参与研发了Trustie、GitLink等平台。





2.论坛嘉宾:武健宇(北京大学)

报告题目:开源软件版本发布说明的挑战、实践与未来

摘要: 软件版本发布说明描述了新旧软件版本间的主要变化,并为用户在升级软件时提供参考依据。然而,由于版本发布说明的生产和管理并没有统一的标准,开发者在生产和使用其过程中遇到了各式各样的问题,例如,许多用户无法高效或有效地从版本说明中提取信息;同时,版本发布说明在不同的项目、版本类型间差异依然缺乏经验性的理解。本报告分析了GitHub平台上1,731个关于版本发布纪要的问题(issues)以及来自233个流行项目的612篇版本发布说明,以理解当前版本发布说明在生产和使用过程中的挑战,并围绕内容、结构、风格三个方面刻画当前实践。最后,本报告也将初步探讨版本发布说明自动化未来的方向。

简介: 武健宇,北京大学计算机学院四年级博士研究生,研究方向为开源软件,主要研究兴趣集中于版本发布说明的实践探究,曾获ACM杰出论文奖、北京大学“五四”奖学金。他的相关研究成果发表在ICSE、ICPC和软件学报等国内外知名会议和期刊上。





3.论坛嘉宾:肖文鑫(北京大学)

报告题目:GitHub项目中的Good First Issues的自动化推荐

摘要: 吸引和留住新开发者是实现开源软件项目的可持续性的重要途径。然而,开发者可能难以在新项目的大量任务中找到适合他们的开发任务。GitHub官方推荐的Good First Issues (GFIs)标签机制旨在帮助新人快速定位可能适合新人的任务,但该标签目前仍未得到广泛应用,甚至还存在大量对不合适的issue错误标记的现象。我们提出了一种自动向新手推荐Good First Issues的模型RecGFI。该模型从多个维度对issue的内容和背景进行建模,并使用XGBoost分类器来计算GFI概率。评估表明,RecGFI的AUC可以达到0.853,优于其他基线方法。我们通过对模型的可解释分析进一步揭示了关于GFI特征的洞察。最后,我们在多个Github项目应用RecGFI并根据预测结果报告了潜在的GFIs,有16个issue被项目维护者确认为真正的GFI。

简介: 肖文鑫,北京大学计算机学院博士三年级博士研究生。研究方向是开源软件开发和开源数据挖掘,主要关注开源项目的可持续性研究。报告内容发表于ICSE 2022。





4.论坛嘉宾:王莹(东北大学)

报告题目:语言边境线的“防控”:跨越程序语言生态的安全漏洞传播治理

摘要: 现象一:“风从南洋来,吹过北疆边”——现代复杂软件生态中,程序的安全漏洞或缺陷能随着跨语言调用的关系,从间接依赖的外部语言第三方软件库无声无息地传播进软件供应链中。然而,软件项目的构建工具及软件成分分析工具,通常只能检测与警告同语言构建软件的安全漏洞,无法给出跨语言调用的安全警告,这使得软件客户端可能“身处风险,而不自知”。现象二:随着安全漏洞的逐步披露,在多数情况下开发者能快速响应并发布相应的漏洞补丁。然而,由于软件依赖链路的复杂版本约束、以及活跃度等因素,导致漏洞补丁在软件供应链中“传播阻塞”,无法被下游软件项目及时“引入”。 针对上述两个值得深思而又被忽视的现象,本次报告试图站在开源软件生态的视角,进行深入剖析并给出相应的技术治理方案:1. 提出一种新的混合语言软件成分分析技术Insight,可有效划分软件成分边界,以确定外部程序语言组件源代码的“身份”,进而实现准确的安全性等问题的检测。2. 提出一种开源软件供应链中安全漏洞补丁传播阻塞的“疏通”技术Plumber,以“管道工”的形式准确定位传播阻塞的“症结”所在,推断出“应该让哪些关键的软件库,做哪些少量修改”,以使用最小的代价,自动化加速安全漏洞补丁在软件生态中的有效传播。

简介: 王莹,博士,现为东北大学软件学院副教授、 院长学术助理, CCF 女工委委员。 2019 年 1 月于东北大学获得软件工程专业博士学位, 2019 年 2 月以引进副教授人才方式留校任教。荣获微软研究院铸星计划访问学者(2020)、中国计算机学会优秀博士论文提名奖(2020)、辽宁省优秀博士论文奖(2021)、 ACM SIGSOFT 杰出论文奖(ICSE 2021)。主要研究方 向为开源软件生态治理技术、软件供应链分析等。在多种程序语言软件生态(包括Java/C#/Python/Go/JavaScript/Android/Rust等)治理方面发表系列学术成果,形成系列工具平台“英雄联盟”LOL自动化监控开源软件生态的依赖缺陷。多项技术落地于华为、微软等企业平台。担任SANER 2023 Tool Track联合主席,“计算之美”2021博士生论坛主席等,热衷参与学术活动以鼓励计算机领域女性“研究媛”和“程序媛”坚持科研梦想。





5.论坛嘉宾:王潮(北京大学)

报告题目:软件中代码注释质量的评估标准与自动度量

摘要: 代码注释在软件开发的过程中扮演中重要角色,帮助开发者快速理解代码逻辑和开发进度。然而代码注释存在着多种多样的质量问题,阻碍开发者快速有效地完成相关开发任务。与此同时,公认的代码注释评价标准仍然是缺失的,使得开发者无法有效且全面地对代码注释质量进行度量。为了解决这一问题,我们收集相关文献和开源社区的编码指南,提出了包含七条准则的代码注释质量评估框架。面向这一框架,我们提出了一些列指标来对代码注释质量进行度量。基于从海量开源项目代码提交记录中提取的包含近十万条代码注释的数据集,我们搭建了自动化方法来对代码注释质量进行度量,并对影响代码注释质量的因素进行了分析。

简介: 王潮,北京大学计算机学院五年级博士生研究生。研究方向为开源软件开发、软件仓库挖掘和数据驱动的软件开发,主要研究兴趣集中于代码注释等软件制品的相关机制与质量分析。相关研究成果以第一作者发布在TOSEM等国际期刊上。担任JSEM等国际期刊的审稿人。





6.论坛嘉宾:高恺(北京大学)

报告题目:深度学习软件供应链初探

摘要: 通过各种各样的代码复用方式,软件之间形成了供应(即依赖)关系。随着软件的不断增多,这种供应关系日趋复杂,呈现层级的结构,逐渐形成了软件供应链。在深度学习领域,开发者广泛使用以TensorFlow和PyTorch为代表的深度学习框架开发各种深度学习软件,形成了以深度学习框架为核心,大量下游项目为外围的深度学习软件供应链。本报告基于开源大数据,以TensorFlow和PyTorch为例构建它们的软件供应链,然后从结果、应用领域、演化因素和开发挑战等方面展开分析,提供一组关于深度学习软件供应链的洞察。

简介: 高恺,北京大学软件与微电子学院四年级博士研究生。他于2019年分别在北京大学信息科学技术学院和国家发展研究院获得计算机科学学士学位(主修)和经济学学士学位(双学位)。他的研究方向为软件工程,尤其是利用各种数据分析方法从大规模软件仓库数据中挖掘出有利于开源软件供应链管理和维护的实践。他的相关研究成果发表在TSE、ICSE和ICPC等国际期刊和会议上,并申请专利一项。他还受邀担任ICSE 2023 Artifact Evaluation的审稿人。





7.论坛嘉宾:张宇霞(北京理工大学)

报告题目:开源软件生态中的公司主导

摘要: 商业公司的参与在开源软件开发中发挥着日益重要的作用。不同于志愿者,公司对开源项目的参与总是利益驱动的。为了追求利益最大化,公司可能会主导开源项目的发展方向。单个公司的主导可能会“挤走”其他贡献者,改变开源软件自由开放的本质,最终威胁到开源生态的可持续发展。现有关于公司参与开源项目的工作多关注积极面,如参与战略、贡献与协作模式等。人们对公司参与可能给开源软件开发带来的负面效应知之甚少。本次报告针对开源生态中的公司主导现象,介绍我们以OpenStack为案例的实证研究结果:1. 公司主导在开源生态中的普遍性;2. 公司主导的模式都有哪些;3.公司主导是否会影响开源项目的持续性。我们发现对于像OpenStack这样成熟的大型开源生态系统,公司对项目的主导是普遍存在的(73%)。此外,我们凝练出五种主导模式,并发现公司主导与开源项目的生存几率存在显著的负相关关系。研究结果可以为构建持续和谐的公司与开源生态之间的关系提供参考。

简介: 张宇霞,博士,北京理工大学特别副研究员,硕士生导师,CCF软件工程专委会委员,CCF开源发展委员会委员。研究方向为开源软件生态系统,软件仓库数据挖掘,实证研究等,在TOSEM、TSE、ICSE、FSE和EmSE等高水平会议和期刊上发表论文10余篇,主持国家自然科学基金青年项目,参与国家自然科学基金重点项目、重点研发计划等多个纵向项目。 担任国际顶级期刊TSE,EMSE,和JSEM的审稿人,国际顶级会议(ICSE24、FSE23、和MSR22)的程序委员。





8.论坛嘉宾:万志远(浙江大学)

报告题目:是什么激励着软件实践者为内源项目做出贡献?

摘要: 内源(Inner Source)是指软件研发企业及组织在其内部采用开源实践,支持并增强软件开发过程。本研究旨在理解软件实践者为内源项目贡献的动机,从而吸引实践者持续参与到内源项目中,进而保证内源项目的可持续发展。研究中采用了定性与定量结合的方法,在定性阶段对20名实践者进行访谈,在定量阶段对来自13个国家的124名实践者进行调查问卷。研究揭示了实践者为内源项目贡献的动机,并与开源项目参与动机进行比较。此外,还揭示了实践者的动机如何影响其在内源项目中的贡献水平及持续贡献意愿。

简介: 万志远,浙江大学计算机科学与技术学院副教授、博士生导师,软件工程系副主任。主要研究方向为软件工程,采用经验软件工程与数据科学交叉领域的理论与方法,从软件工程大数据中挖掘具有价值的洞见,理解人的想法、行为和期待,以及新兴技术带来的挑战,进而研发相关工具集,旨在提升软件质量,提高实践者研发效率。近年来,在TSE、ICSE、 ASE、UbiComp等顶级会议和期刊上发表论文20余篇。受邀担任ICSE、ESEC/FSE、ASE等国际会议程序委员会委员,TSE、EMSE、IEEE Software等国际期刊审稿人,并参与组织了MSR 2022等国际会议。





9.论坛嘉宾:谭鑫(北京航空航天大学)

报告题目:基于加密货币的开源项目激励机制研究

摘要: 激励开发人员长期贡献是确保开源项目可持续性的关键。然而,现有的激励机制(如GitHub sponsor)并不令人满意。区块链社区遵循“Open source money will build the open source ecosystem”,这为开源项目的激励机制提供了新的思路。为了理解这一机制,我们调查了Gitcoin Grants,这是一个通过被称为二次融资的专有民主系统为开源项目提供加密资金的平台。我们调研了其应用现状和影响因素,并通过与传统货币捐赠的比较,我们试图揭示其本质差异和推广潜力。该项研究将为开源项目的新型激励机制提供理论依据。

简介: 谭鑫,博士,助理教授,硕士生导师。2021年于北京大学获得理学博士学位,现为北京航空航天大学计算机学院助理教授。研究兴趣主要集中在软件存储库挖掘、实证软件工程,以及开源软件开发,对群体协作和社区成长有深入研究。已在国内外期刊、会议上发表10多篇论文,其中以第一作者在CCF A类国际 会议ICSE, FSE以及CSCW上发表多篇论文。主持国家自然科学青年基金项目,并作为骨干参与重点研发计划等多项国家级项目,受邀担任FSE、ICSE、MSR等国际知名会议PC、 session chair,以及TSE、Journal of Software: Evolution and Process等顶级期刊审稿人。





10.论坛嘉宾:李光杰(北京大数据先进技术研究院)

报告题目:红山开源平台发展理念与实践探索

摘要: 主要介绍红山开源平台发展理念、目标定位、工作模式、对外交流及以及合作方式等。

简介: 李光杰,北京大数据先进技术研究院副研究员,中国计算机学会软件工程专委会委员,长期从事软件质量、代码重构、开源软件等方面的理论研究和实践探索工作,主持及参与多项国家级重点项目,在软件工程领域发表学术论文10余篇,出版专著10余部,获国家发明专利及软件著作权多项,目前负责红山开源平台技术总体工作。





11.论坛嘉宾:章津楠(建木)

报告题目:开源devops项目实践分享 - 建木

摘要: 主要介绍建木项目发起背景、发展情况、合作生态、用户案例和商业化规划。结合自身在开源项目工作过程中的一些思考,对当下开源治理、devops文化等融合的一些思考和自己的见解。

简介: 章津楠,建木发起人/九州云联合创始人,有10年以上开源项目和云计算从业经验。坚持深耕云计算领域知识,致力于为企业数字化转型过程中提供整体解决方案和产品服务赋能。多次在云计算大会、CCF、OpenInfra、金融双态运维和金融科技等会议上对云计 算、开源领域的实践分享。2021年基于企业devops实践经验发起并开源了建木项目,并于2021年9月进入国家重点研发计划成果“木兰开源社区”平台孵化,2022年9月完成建木项目正式捐赠。在开源学术领域,配合CCF 开源发展委员会(ODC)合作推动开源高校夏令营推动开源高校普及和产学研合作。通过开源合作的方式推动CCF旗下的GitLink和建木联合研发,实现GitLink平台devops功能上线。参与多项开源领域的标准编写,获得全国信息技术标准化委员会颁发的“2022年度云计算标准工作先进个人”。



Panel嘉宾





1.Panel嘉宾:胡欣蔚(华为)

简介: 胡欣蔚 2011年加入华为,现为 ICT 操作系统首席专家,庞加莱实验室主任;2020 年起任 openEuler社区技术委员会主席;曾在 SuSE Linux 等公司担任研发负责人,具有长期的操作系统、高可用软件、底层软件等领域工作经验和技术积累;对处理器、体系架构、OS、容器等具有广阔的技术视野。






2.Panel嘉宾:谭中意(TOC)

简介: 谭中意 资深开源专家,20年开源工作经验,开放原子基金会TOC(技术监督委员会)副主席,Apache brpc ppmc member,在百度、腾讯等有深入的平台化和开源治理及运营经验,也是多个开源基金会项目Mozilla、GNOME、Apache、InnerSourceCommons、Openchain的贡献者,对云原生和AI比较熟悉。






3.Panel嘉宾:王涛(国防科技大学)

简介: 王涛,国防科技大学副研究员,计算机学院PDL实验室分布计算研究室副主任,CCF开源发展委员会副秘书长,木兰开源社区技术委员会委员。长期从事群智软件工程、开源生态研究以及开源平台的建设与实践,在TSE、CHI、MSR等期刊和会议上发表论文多篇,是群体化创新实践科教平台Trustie以及CCF开源创新服务平台GitLink研发负责人,为木兰开源社区、红山开源社区等提供平台和技术支撑。






4.Panel嘉宾:杨丽蕴(中国电子技术标准化研究院软件应用与服务研究中心云计算研究室)

简介: 杨丽蕴 中国电子技术标准化研究院软件应用与服务研究中心云计算研究室主任,中国开源云联盟常务副秘书长,工信部海峡两岸云计算分论坛大陆召集人,全国信标委云计算标准工作组秘书处负责人。长期从事信息技术领域标准化工作,主导和参与20余项云计算、中间件以及编程语言等领域国家标准和云计算开源技术团体标准。长期从事开源社区建设运营、标准化及技术研究等工 作,是木兰开源社区和木兰开源许可证族的核心发起人和主导人之一,牵头推进开源社区建设运营及相关标准化和技术研究工作。






5.Panel嘉宾:章津楠(建木)

简介: 章津楠,建木发起人/九州云联合创始人,有10年以上开源项目和云计算从业经验。坚持深耕云计算领域知识,致力于为企业数字化转型过程中提供整体解决方案和产品服务赋能。多次在云计算大会、CCF、OpenInfra、金融双态运维和金融科技等会议上对云计算、开源领域的实践分享。 2021年基于企业devops实践经验发起并开源了建木项目,并于2021年9月进入国家重点研发计划成果“木兰开源社区”平台孵化,2022年9月完成建木项目正式捐赠。在开源学术领域,配合CCF 开源发展委员会(ODC)合作推动开源高校夏令营推动开源高校普及和产学研合作。通过开源合作的方式推动CCF旗下的GitLink和建木联合研发,实现GitLink平台devops功能上线。参与多项开源领域的标准编写,获得全国信息技术标准化委员会颁发的“2022年度云计算标准工作先进个人”。






6.Panel嘉宾:张宇霞(北京理工大学)

简介: 张宇霞,博士,北京理工大学特别副研究员,硕士生导师,CCF软件工程专委会委员,CCF开源发展委员会委员。研究方向为开源软件生态系统,软件仓库数据挖掘,实证研究等,在TOSEM、TSE、ICSE、FSE和EmSE等高水平会议和期刊上发表论文10余篇,主持国家自然科学基金青年项目,参与国家自然科学基金重 点项目、重点研发计划等多个纵向项目。担任国际顶级期刊TSE,EMSE,和JSEM的审稿人,国际顶级会议(ICSE24、FSE23、和MSR22)的程序委员。






7.Panel嘉宾:邹欣(CSDN)

简介: 邹欣:现任 CSDN 副总裁。 他曾在微软 Azure, Bing,Office 和 Windows 团队担任首席研发经理。 并在微软亚洲研究院(北京)工作了 10 年。 在软件创新、开发和软件工程教学改进方面有丰富的经验。 他的《编程之美》、《构建之法》等技术书籍是 IT 界的畅销书。



论坛主席






1.论坛主席:周明辉(北京大学)

简介: 周明辉 北京大学计算机学院教授,北大博雅特聘教授,国家杰出青年基金获得者,CCF开源发展委员会副主任。主要研究方向是软件工程、数据挖掘、智能推荐和开源开发。在国际顶级期刊和会议等发表80多篇论文,多次 获国际会议优秀论文和ACM SIGSOFT杰出论文奖。入选2012年教育部新世纪优秀人才计划;获2015年中创软件人才奖。两次获国家技术发明二等奖。多次担任国际顶级会议ICSE、FSE和ASE的PC,是ASE 2024 PC Co-Chair等。是著名国际期刊EMSE、JSS、IST及JSME等的编委。主持制定了首个中英双语开源许可证“木兰宽松许可证”并获得OSI认证,被~10万个开源项目采纳。






2.论坛主席:朱家鑫(中国科学院软件研究所)

简介: 朱家鑫,中国科学院软件研究所副研究员、CCF开源发展委员会执行委员。朱家鑫博士主要研究方向为软件工程,长期从事软件资产管理、开源治理、开发运维一体化的研究工作。朱家鑫博士作为项目负责人、核心骨干承担、参与多项开源软件生态、智能化软件开发相关的国家重点研发计划项目、国家自然科学基金项目、中科 院软件所优秀青年项目等,参与了“木兰”开源社区建设,RISC-V开源生态建设,相关研究成果在ICSE、FSE、ISSTA、TOSEM等领域顶级会议、期刊发表,获得多项专利,荣获2021年中国电子学会科技进步一等奖,2021年中国电力科技创新一等奖。






3.论坛主席:张宇霞(北京理工大学)

简介: 张宇霞,博士,北京理工大学特别副研究员,硕士生导师,CCF软件工程专委会委员,CCF开源发展委员会委员。研究方向为开源软件生态系统,软件仓库数据挖掘,实证研究等,在TOSEM、TSE、ICSE、FSE和EmSE等高水平会议和期刊上发表论文10余篇,主持国家自然科学基金青年项目,参与国家自然科学基金重点项目、重点研发计划等多个纵向项目。 担任国际顶级期刊TSE,EMSE,和JSEM的审稿人,国际顶级会议(ICSE24、FSE23、和MSR22)的程序委员。






4.论坛主席:谭鑫(北京航空航天大学)

简介: 谭鑫,博士,助理教授,硕士生导师。2021年于北京大学获得理学博士学位,现为北京航空航天大学计算机学院助理教授。研究兴趣主要集中在软件存储库挖掘、实证软件工程,以及开源软件开发,对群体协作和社区成长有深入研究。已在国内外期刊、会议上发表10多篇论文,其中以第一作者在CCF A类国际 会议ICSE, FSE以及CSCW上发表多篇论文。主持国家自然科学青年基金项目,并作为骨干参与重点研发计划等多项国家级项目,受邀担任FSE、ICSE、MSR等国际知名会议PC、 session chair,以及TSE、Journal of Software: Evolution and Process等顶级期刊审稿人。