工业论坛

云原生与智能化运维论坛

2023年12月2日(星期六),14:00 – 18:00

上海国际会议中心,3C+D会议室



论坛简介

包含容器化、微服务、开发运维一体化、服务网格等技术在内的云原生已经成为新的技术浪潮,深刻地改变着软件开发、维护和运行的方式,同时也带来了新的机遇和挑战。当前,我们已经进入万物智能互联与软件定义一切的新时代,云计算与云原生软件技术和开发实践也逐渐在智能制造、智能汽车、智慧农业等领域应用,由此带来了很多新的机遇和挑战。围绕这些问题,我们邀请了多位来自学术界和工业界的专家进行专题报告和交流讨论,分享相关方面的最新研究成果和学术观点,共同展望未来的技术发展趋势。

论坛日程

时间 主题 嘉宾
14:00-14:05 论坛开幕式 彭鑫
14:05-14:30 基于云原生的卫星平台研究 王尚广
14:30-14:55 云原生微服务管理关键技术及应用 叶可江
14:55-15:20 面向可编程网络的在网运维 陈鹏飞
15:20-15:45 商飞工业智能化的过去、当下和未来 陈智超
15:45-16:05 茶歇
16:05-16:30 智能故障管理:基础技术与应用 (Intelligent Incident Management: Fundamentals and Applications) 康昱
16:30-16:55 从故障演练到产品能力评估的探索 毛文安
16:55-17:55 Panel讨论:万物互联时代的云原生软件与智能化运维 彭鑫(主持)、王尚广、叶可江、陈鹏飞、陈智超、毛文安
17:55-18:00 论坛总结 彭鑫

论坛主席





1.论坛主席:彭鑫(复旦大学)

简介: 复旦大学计算机科学技术学院副院长、教授。中国计算机学会(CCF)杰出会员、软件工程专委会副主任、开源发展委员会常务委员,上海市计算机学会青工委主任,《Journal of Software: Evolution and Process》联合主编(Co-Editor),《ACM Transactions on Software Engineering and Methodology》、《Empirical Software Engineering》、《Automated Software Engineering》、《软件学报》等期刊编委。2016年获得NASAC青年软件创新奖。主要研究方向包括软件智能化开发、云原生与智能化运维、泛在计算软件系统、智能网联汽车等。研究工作多次获得IEEE Transactions on Software Engineering年度最佳论文奖、ICSM最佳论文奖、ACM SIGSOFT杰出论文奖、IEEE TCSE杰出论文奖等奖项。担任2022年与2023年CCF中国软件大会(ChinaSoft)组织委员会主席与程序委员会共同主席,以及ICSE、FSE、ASE、ISSTA等会议程序委员会委员。





2.论坛主席:谢涛(北京大学)

简介: 北京大学讲席教授,北京大学计算机学院软件科学与工程系主任,高可信软件技术教育部重点实验室副主任,国家高等学校学科创新引智(“111”计划)基地负责人。曾任美国伊利诺伊大学香槟分校(UIUC)计算机系正教授。当选欧洲科学院外籍院士、国际计算机学会(ACM)会士、电气电子工程师学会(IEEE)会士、美国科学促进会(AAAS)会士、中国计算机学会(CCF)会士。曾获科学探索奖,海外杰出青年科学基金,美国国家自然科学基金青年职业奖,ACM软件工程领域(SIGSOFT)三大奖项中的两项(有影响力教育工作者奖、杰出服务奖),IEEE软件工程领域(TCSE)杰出服务奖,软件仓库挖掘奠基性贡献奖,软件工程顶级国际会议ASE 2021最有影响力论文奖等。担任CCF系统软件专委会主任(2024-2027),2020年中国计算机大会程序委员会主席,软件工程顶级国际会议ICSE 2021程序委员会共同主席,《软件测试、验证与可靠性(STVR)》Wiley期刊联合主编等。主要研究领域包括软件工程,系统软件,软件安全,可信人工智能。





3.论坛主席:张冬梅(微软)

简介: Dr. Dongmei Zhang is a Distinguished Scientist at Microsoft and she has worked in Microsoft Research Asia (MSRA) for 19 years. Now Dr. Zhang is the Chief Scientist of Microsoft Software Technology Center (STC) Asia. She is also the VP of STCA Search and Distribution, leading product development for Bing and overseeing the Data, Knowledge, and Intelligence (DKI) research group. Dr. Zhang founded the Software Analytics Group in MSRA in 2009. Since then she has led the group to work on the research and innovation of software analytics technologies. In 2014, Dr. Zhang and her group started to focus their software analytics research on cloud computing, which led to the new research direction Cloud Intelligence a.k.a. AIOps. In addition to research, Dr. Zhang also leads her team to collaborate with many product teams across Microsoft, which has created significant business impact. Dr. Zhang and her team have expanded the research and impact into the business intelligence area, and helped Microsoft products establish technology leadership in the direction of Smart Data Discovery. Dr. Zhang holds a Ph.D. degree in Robotics from the Robotics Institute, Carnegie Mellon University.





4.论坛主席:李青山(西安电子科技大学)

简介: 西安电子科技大学计算机科学与技术学院/国家示范性软件学院党委书记、软件工程一级学科负责人、智能软件与系统新技术研究所所长,西安市智能软件工程重点实验室主任,教育部省级重点学科“软件工程”学术带头人;CCF杰出会员、软件工程专委会、大数据专委会、青年工作委员、开源发展委员会委员。 主要从事面向智能体的软件工程、软件体系结构、自适应软件演化、智能软件工程、大数据智能化分析技术等方向研究工作。


论坛嘉宾





1.论坛嘉宾:王尚广(北京邮电大学)

报告题目: 基于云原生的卫星平台研究

摘要: 报告首先介绍卫星平台对在轨计算的需求与挑战,然后汇报我们基于KubeEdge云原生技术体系在星地协同环境下的研究探索,最后分享在我们在卫星异常监测、在轨计算受限、星地传输测量等方面的研究进展!

简介: 北京邮电大学教授,计算机学院副院长(主持工作),网络与交换技术全国重点实验室副主任,国家优秀青年科学基金获得者。研究方向包括:服务计算、边缘计算、卫星计算及操作系统等。先后主持包括国家重点研发计划、国家自然科学基金重点项目在内的各类项目50余项、发表高水平学术论文150余篇,获得计算机学会技术发明一等奖、中国人工智能学会自然科学二等奖等。目前担任IEEE Technical Community on Services Computing主席、IEEE Transactions on Services Computing编委等。





2.论坛嘉宾:叶可江(中国科学院深圳先进技术研究院)

报告题目: 云原生微服务管理关键技术及应用

摘要: 微服务是云原生系统主流的应用形态之一。相比于传统的单体应用,微服务应用存在粒度更细、依赖关系复杂、动态多变等特征,对其进行高效的管理和运维面临很大的挑战。本报告首先介绍云原生微服务的相关背景,然后介绍团队在微服务管理方面取得的一些研究进展,并结合在研的几个科研项目,介绍团队将云原生微服务应用到工业领域的一些探索工作。

简介: 博士,研究员,博士生导师,中国科学院深圳先进技术研究院云计算研究中心主任。浙江大学计算机专业博士,澳大利亚悉尼大学联培博士(国家公派),美国卡内基梅陇大学博士后,国家重点研发计划“工业软件”重点专项青年科学家项目负责人、国家自然科学基金委“未来工业互联网”重大研究计划培育项目负责人,入选中国科学院特聘研究员岗位、中国科学院青促会人才专项、广东省“特支计划”科技创新青年拔尖人才、深圳市海外高层次人才“孔雀计划”B类、南山区“领航人才”B类。主要研究方向为数字系统及软件(云计算、大数据及工业互联网),在包括ASPLOS、EuroSys、SC、SOCC等高水平会议和TOCS、TC、TPDS、ToN等高水平期刊发表论文100余篇,出版专著1部《DartCloud:云基础设施服务平台》(科学出版社),授权发明专利50余件,获批软件著作版权10余件。中国计算机学会杰出会员、杰出讲者、体系结构/系统软件/服务计算专委会委员。曾获得中国电子学会科技进步一等奖、中国科学院广州分院“优秀青年科技工作者”及云计算顶会ACM SoCC 2021最佳论文奖(国内首次)。





3.论坛嘉宾:陈鹏飞(中山大学)

报告题目: 面向可编程网络的在网运维

摘要: 可编程网络在当前大规模数据中心被普遍采用。相较于传统的网络设备,可编程网络采用了SDN软件定义的思想,将数据面与控制面分开,提供了强大的可编程能力,能够实现更加灵活的网络管理和流量调度。传统的面向网络的运维方案将网络数据发送到集中的主机服务器进行分析,不仅占据大量的网络带宽,干扰业务运行,而且故障检测以及定位周期较长,定位误差较大。本次报告面向可编程网络,提出了一种在数据面就地进行运维的方案即“在网运维”,将运维过程下沉到数据面。充分利用网络设备的可编程能力以及冗余算力资源及时准确发现和定位网络性能问题,并给出优化方法。

简介: 中山大学计算机学院“百人计划”副教授,博士生导师,广东省杰出青年基金获得者。2016年6月于西安交通大学计算机科学与技术系获博士学位。2016年6月-2018年1月在IBM中国研究院云计算部门担任研究员,获得2020年陕西省计算机学会首届优秀博士论文,IEEE ISSRE 2022大会唯一最佳论文。主要方向为:云计算、智能运维( AIOps)、软件可靠性、软件定义网络等。近年来在国际会议如FSE、ICSE、ASE、WWW、IEEE INFOCOM、IEEE DSN、IEEE ISSRE等和期刊如IEEE TNNLS、IEEE TDSC、IEEE TSC、IEEE TCC等发表70余篇论文,同时担任多个国际期刊和会议的审稿人。共承担了10余项项目包括国家重点研发计划课题、大数据中心项目、国家自然基金面上、青年项目、广东省、广州市科技项目。此外,还与阿里巴巴、华为、腾讯、微信、深信服等企业开展了校企合作项目,并且将部分研究成果在企业落地。





4.论坛嘉宾:陈智超(中国商飞5G工业创新中心)

报告题目: 商飞工业智能化的过去、当下和未来

摘要: 中国商飞积极抢抓信息技术革命战略机遇,深入推动5G、人工智能等新一代信息通信技术与大飞机研制融合创新,建成了全球第一个5G工业园区、全国第一个5G全连接工厂、全国第一个工业元宇宙园区,获批了全国唯一的5G无线工业专用网络频率使用许可,构建了自学习、可进化的新型工业互联网平台商飞大脑。

简介: 现任中国商飞5G工业创新中心总工程师、商飞智能技术有限公司总工程师。担任国家5G工业专有频率专项工作组数字化工厂组组长,国家科技部“青年科学家”,上海市第一届35U35科技青年。主要负责推动5G+工业互联网在大飞机高端制造业中的创新应用,牵头开发了5G工业创新场景百余项,建成了黑灯数控、智能复材、柔性装配等十余个数字化车间和产线,构建了大飞机非对称竞争优势。作为项目或技术负责人承担国家级重大项目6项。





5.论坛嘉宾:康昱(微软)

报告题目: 智能故障管理:基础技术与应用 (Intelligent Incident Management: Fundamentals and Applications)

摘要: 本次演讲将围绕智能故障管理(intelligent incident management)的主题展开,主要包括基础技术与应用两个方面。在基础技术方面,我们将以日志分析技术为代表,介绍在基础AIOps技术能力方面的探索。在应用方面,我们将介绍向通用检测和诊断方向的探索。具体来说,在检测方面,我们针对海量的高维数据,提出了基于元启发式搜索(meta-heuristic search)的方法进行通用高效故障检测。我们还将探讨如何解决大量微服务场景下故障误报率高以及复杂深度学习方法无法解释的问题,提出了基于Trace分析的性能异常检测方法以提高准确率和可解释性。在诊断方面,我们提出了一个通用的框架,可以从上下文数据中自动提取对比模式。此外,针对多服务依赖的故障诊断问题,我们提出了基于故障关联构建全局视图的诊断方法。最后,我们将简要介绍一些我们近期的其他研究工作。

简介: 康昱是微软DKI(数据、知识、智能)团队的首席研究员,同时担任复旦大学计算机科学学院的行业硕导和香港中文大学的名誉副研究员。他致力于研究智能云服务的数据驱动技术,将人工智能、大数据和云计算相结合,对云计算运行过程中产生的大数据进行人工智能技术应用。康昱在软件工程(SE)领域的顶级会议上发表过多篇论文,曾担任多个产业和研究项目的负责人,包括国家自然科学基金(NSFC)项目。自2018年加入微软以来,康昱专注于提高云服务质量(如可靠性和性能)的研究项目。这些研究技术已成功融入基础云平台服务,为包括Azure、M365、Teams等在内的所有微软在线服务提供支持。更多信息,可以访问康昱的个人主页:https://www.microsoft.com/en-us/research/people/kay/





6.论坛嘉宾:毛文安(阿里云)

报告题目: 从故障演练到产品能力评估的探索

摘要: 当前各大业务系统整体架构从早期的单体应用向微服务化迈进,这样的演进带来了以下三个突出问题:1. 架构的大规模变更过程导致稳定性故障频发;2. 架构的复杂化导致传统的保障方式无法满足稳定性保障需求;3. 需要验证服务治理、监控警报、运维等基础设施在故障出现时能有效工作;因此,通过模拟真实环境下可能发生的各种故障情况,检验和验证组织或系统的应对能力的故障演练应运而生。同时,为了验证运维管理系统在业务真实或演练场景下问题发现能力,及如何挑选或评价各类眼花缭乱的商业化运维产品的能力,有必要基于现有故障演练系统的基础上,进一步拓展并设计一套自动化评估评测系统。本次分享主要从故障演练系统出发,到运维产品力评测的技术挖掘,寻求一种通过技术手段评测运维、监控、可观测平台的能力。通过制定一套评测指标、功能准确性、告警及时性等评估体系,得到运维产品的技术水位情况,构建起运维客户与运维厂商的沟通纽带和桥梁。

简介: 龙蜥社区系统运维 SIG 和 eBPF 技术 SIG 的负责人,具有多年 Linux 操作系统开发、维护及性能调优经验,深耕 Linux 内核社区,专注 eBPF 技术的研究和探索,主要负责领域为阿里云操作系统稳定性和 Linux 网络、IO 等新特性的研究,作为架构师主导完成操作系统一站式运维管理平台 SysOM 的设计实现,为解决疑难的应用和系统抖动、性能劣化等问题打开一片天地。