10月17日 | 短期课程 (会议楼三层19会议室)
讲师 | 邱怡轩 张源源(详情见 短期课程

10月18日上午 | 开幕式 & Keynote (会议楼三层19会议室)
09:15 - 10:15LLaDA:大语言模型新范式
文继荣 & 李崇轩 | 中国人民大学高瓴人工智能学院
演讲内容摘要
本次报告聚焦一个问题:自回归是否是通向当前乃至更高水平的生成式智能的唯一范式?本次报告首先从统一概率建模的视角总结当前基础生成模型的发展,并从这个视角出发指出大语言模型的性质(如可扩展性、指令追随、情景学习、对话、无损压缩)主要来自于生成式准则,而非自回归建模独有。基于这些洞察,介绍扩散大语言模型LLaDA系列工作,包括基础理论、扩展定律、大规模训练、偏好对齐和多模态理解等。LLaDA通过非自回归的方式,展示了令人惊讶的可扩展性和多轮对话能力。这些结果不仅挑战了自回归模型的统治地位,更加深了我们对生成式人工智能的理解。
演讲嘉宾简介
文继荣

文继荣,中国人民大学高瓴人工智能学院执行院长,国家高层次人才特聘专家。“大模型与智慧治理”北京市重点实验室主任,担任新一代智能搜索与推荐教育部工程研究中心主任。2018年入选首批“北京市卓越青年科学家”,2019年担任北京智源人工智能研究院首席科学家。目前担任中央统战部党外知识分子建言献策专家组专家、北京市第十四届政协常委、第八届教育部科技委委员、中国计算机学会常务理事等。

李崇轩

李崇轩,中国人民大学高瓴人工智能学院副教授,博士生导师,主要研究生成模型,研制扩散大语言模型 LLaDA,视觉扩散模型相关成果获ICLR 2022 杰出论文奖,部署于DALL·E 2、Stable Diffusion、Vidu等行业领先模型,获吴文俊优秀青年奖、吴文俊人工智能自然科学一等奖;主持国家自然科学基金青年科学基金B类(原优青)、重大培育项目等;担任IEEE TPAMI 编委,智源学者。

10:15 - 11:15写给成功率100%之后的具身智能
许华哲 | 清华大学交叉信息研究院
XuHuaZhe
演讲内容摘要
泛化性、成功率、敏捷性,是目前具身智能的不可能三角。在大家普遍追求泛化性的今天,是否可能同时获得高成功率和敏捷性? 本报告探讨如何提高成功率,以及当我们获得了高成功率之后该思考什么。
演讲嘉宾简介
许华哲博士现为清华大学交叉信息研究院助理教授,博导,清华大学具身智能实验室负责人,创业公司星海图智能联合创始人。博士后就读于斯坦福大学,博士毕业于加州大学伯克利分校。其研究领域是具身人工智能(Embodied AI)的理论、算法与应用。许华哲曾获顶级智能机器人会议CoRL'23最佳系统论文奖,2024年WAIC“云帆奖”,在IJRR, RSS,NeurIPS等发表顶级期刊/会议论文七十余篇,代表性工作曾被MIT Tech Review,Stanford HAI等媒体报道。曾在IJCAI2023、IJCAI2024、ICRA2024、ICLR2025、CoRL2025担任领域主席/副主编。
10月18日下午 | 多模态理解与生成 (六号楼1会场)
主席 | 胡天阳

胡天阳现为香港中文大学(深圳)数据科学学院的助理教授。他的主要研究方向为人工智能与统计的交叉领域,包括统计机器学习、可信 AI、特征表示学习、深度生成模型等,旨在通过揭示 AI 模型的深层机制,为设计更有效的新算法提供理论指导。

13:00 - 13:30 多模态生成与理解:数据与建模方法的演化
WeijianLuo
演讲内容摘要
过去十年,多模态生成经历了从 VAE/GAN ,自回归模型(AR Models),到扩散模型(Diffusion Models)的演化与放大(Scaling);近两年多模态生成技术又与大语言模型深度耦合,形成多模态理解与多模态生成相结合的智能系统。在多模态智能迅速演进的进程中,高质量的数据和可扩展的建模方法成为了模型进步的两个重要方面。本报告以文-图多模态场景为例子,首先将从数据和建模方法的角度出发,系统梳理多模态生成模型的历史演进。我们将涵盖自回归模型,扩散模型和单步/少步生成模型等主流模型架构,并比较各个模型方案的利弊。同时我们将简要梳理介绍对生成模型友好的现有开源数据集;其次,我们将重点讨论一个研究热点问题,即多模态生成与多模态理解的关系,囊括了多模态生成理解一体化的一些近期工作以及报告者自身的一些思考,如生成理解之间的抑制与促进关系,生成理解模型的放大策略等。最后,我们将对多模态生成模型的未来演化方向做一个展望,并尝试归纳出一些重要的研究问题和应用场景。
演讲嘉宾简介

罗维俭博士是小红书(RedNote/Xiaohongshu)公司人文智能实验室(hi-lab)的多模态大模型研究员。他在北京大学(PKU)数学科学学院获得统计学博士学位和应用统计学硕士学位,本科阶段则毕业于中国科学技术大学(USTC)数学系,获数学学士学位。

维俭目前在人文智能实验室进行大型生成式理解模型等研究,其团队专注于开发高效可扩展的生成式理解模型,这类模型能够进行推理、理解人类意图,并实时生成视觉 - 音频响应。维俭在人工智能学术会议与期刊如ICML,NeurIPS,ICLR,CVPR,TMLR等发表论文十余篇。他曾邀担任前沿人工智能期刊如Nature Communications(Nat. Com),Journal of Machine Learning Research(JMLR),IEEE Transactions on Image Processing(TIP),Pattern Recognition(PR)等杂志审稿人。同时,他也参与人工智能会议审稿,包括 NeurIPS、ICML、ICLR、CVPR、ICCV、AISTATS、UAI 等。

13:30 - 14:00Faster Convergence and Acceleration for Diffusion-Based Generative Models
GenLi
演讲内容摘要
Diffusion models, which generate new data instances by learning to reverse a Markov diffusion process from noise, have become a cornerstone in contemporary generative modeling. While their practical power has now been widely recognized, the theoretical underpinnings remain underdeveloped. Particularly, despite the recent surge of interest in accelerating sampling speed, convergence theory for these acceleration techniques remains limited. In this talk, I will first introduce an acceleration sampling scheme for stochastic samplers that provably improves the iteration complexity under minimal assumptions. The second part focuses on diffusion-based language models, whose ability to generate tokens in parallel significantly accelerates sampling relative to traditional autoregressive methods. Adopting an information-theoretic lens, we establish a sharp convergence theory for diffusion language models, thereby providing the first rigorous justification of both their efficiency and fundamental limits.
演讲嘉宾简介
Gen Li is currently an assistant professor in the Department of Statistics and Data Science at the Chinese University of Hong Kong. His research interests include diffusion based generative model, and reinforcement learning.
14:00 - 14:30 迈向通用多模态智能
Benyou Wang
演讲内容摘要
本报告系统性地呈现了我们在通用多模态大模型构建中的全链路探索。在感知基础层面,我们构建了高质量的通用图文对齐数据集ALLaVA-4V、长尾视觉知识数据集以及专业医学图像数据集(HuatuoGPT-Vision),并开发了支持长上下文的多模态模型(如LongLLaVA),能够有效处理多图与长视频(基于MileBench评测)。同时,我们积极拓展全模态感知维度,融合语音(EchoX与SoundWave)、动作理解(MotionLLM)、中医诊疗知识(时珍GPT)以及脑电信号(WaveMind),构建了更为立体的信息理解体系。在认知与推理层面,我们重点攻坚复杂推理能力,在视频理解(Video-R1)、医疗多模态推理与语音推理等任务上取得显著进展。在交互与生成前沿,我们开发了基于大模型的图像生成与编辑框架Janus-4o、医疗视频生成系统MedGen、微观世界模拟器MicroVerse,并探索VR/AR交互应用,全面提升自然交互体验。最终,我们前瞻布局物理世界孪生与智能体自进化,通过环境交互模拟,推动Agent在持续反馈中实现自主演进,为迈向具备环境适应与进化能力的通用智能奠定坚实基础。
演讲嘉宾简介
王本友,香港中文大学(深圳)数据科学学院助理教授、博士生导师、校长青年教授;深圳河套学院双聘导师。研究方向为大语言模型(医疗)应用、多模态大模型、AI4Math和Human-agent interaction,曾获得了SIGIR 2017 Best Paper Award Honorable Mention, NAACL 2019 Best Explainable NLP Paper,NLPCC 2022 Best Paper, Best Paper in ICLR 2025 Financial AI workshop,担任了 NLPCC 2023 的宣传主席和 EMNLP 2023 的网站主席。他曾获得了华为火花奖、腾讯犀牛鸟项目、华为AI百校计划和CCF滴滴盖亚学者项目的资助,开发的华佗GPT系列大模型被部署到了深圳数十家公立医院和数百家社康医院,和华为诺亚的联合团队获得第二届AI奥林匹克数学竞赛AIMO 2的金牌,相关工作受到了Nature、CCTV、金融时报(Financial Times)、环球时报、红星新闻、南方都市报、深圳卫视、深圳市卫健委、深圳市龙岗区政府的关注和报道。
14:30 - 15:00 基于昇腾的多模态理解大模型算法探索
LanqingHong
演讲内容摘要
本报告将系统介绍在昇腾平台上开展的多模态理解大模型训练与算法探索。内容涵盖昇腾亲和的视觉编码器设计、离散化语音编码器设计,以及面向大规模训练的数据格式规范与高效数据处理流程。在模型训练方面,报告将重点探讨基于数千卡集群的高效多模态对齐方法,涉及模态对齐的范式选择与具体实现。通过这些系统性的研究与实践,我们总结了多模态大模型在昇腾平台上的关键Know-how,为实现高效、稳定、可扩展的多模态理解模型训练提供参考。
演讲嘉宾简介
洪蓝青博士现任华为诺亚方舟实验室多模态大模型技术专家,博士毕业于新加坡国立大学。其研究方向聚焦于多模态大模型与生成式人工智能,主要探索现有大模型的优势与不足,挖掘能力边界,并提出高效的新一代模型与算法。她在人工智能领域的顶级国际会议上发表论文30余篇,Google Scholar引用次数超过3500次,曾担任NeurIPS、ICLR、CVPR等会议审稿人,并担任IJCAI 2025的领域主席(Area Chair)以及3DV 2025的产业主席(Industrial Chair)
10月18日下午 | Agent形态演变 (六号楼2会场)
主席 | 张佳钇

张佳钇,香港科技大学(广州)二年级博士生,MetaGPT 研究员。其论文发表在 ICLR、ICML、NeurIPS、ACL、EMNLP 等会议上,开源项目在 GitHub 累计获得 5 万 Star,代表性工作包括 AFlow、Foundation Agents、OpenManus 等。个人主页:https://didiforgithub.github.io/

13:00 - 13:30基础智能体的进展与挑战
ZhaoyangYu
演讲内容摘要
现有智能体系统缺乏统一的理论框架和自我进化能力。本论文提出了一个受大脑启发的基础智能体架构,包含认知、记忆、感知、行动等核心模块,并探讨了智能体的自我优化机制和多代理协作模式。论文还分析了智能体系统面临的安全挑战,为构建智能且安全的智能体系统提供了系统性的理论指导。
演讲嘉宾简介
于兆洋,中国人民大学高瓴人工智能学院24届本科生,目前担任MetaGPT研究员。他的研究方向包括智能体形式,智能体自优化,智能体环境等。其开源项目OpenManus在Github上获得49K star,论文发表在ICLR,EMNLP等顶级会议上。个人主页:https://zhaoyangyu.com/
13:30 - 14:00智能体强化策略优化
GuanTingDong
演讲内容摘要
现有的轨迹级强化学习方法在训练智能体时忽略了工具调用后产生的高熵token分布,无法充分探索步骤级工具使用行为。ARPO通过熵驱动的自适应采样机制,在高熵工具使用步骤中动态分支采样,结合优势归因估计更好地学习工具交互行为。实验显示ARPO在13个基准测试中超越传统方法,且仅需一半工具调用预算。
演讲嘉宾简介
董冠霆,目前就读于中国人民大学高瓴人工智能学院,博士一年级,导师为窦志成教授和文继荣教授。他的研究方向主要包括大语言模型推理,深度搜索智能体,智能体强化学习等。以第一作者身份在 ICLR、ACL、AAAI 等顶级会议发表论文10余篇,并在快手大模型应用组、阿里通义千问组等大模型团队进行实习。代表性工作包括 AUTOIF、ARPO、RFT、Search-o1、WebThinker、Qwen2 和 Qwen2.5 等。个人主页:https://dongguanting.github.io/
14:00 - 14:30AReaL:智能体时代的强化学习系统
JiaxuanGao
演讲内容摘要
强化学习与大模型的发展演进,以及需要面对的算法挑战。AReaL通过Agent优先的接口设计,以及全异步强化学习算法,让用户改动极少的代码就可以实现3-5x的智能体强化学习训练加速。
演讲嘉宾简介
高嘉煊,清华大学交叉信息研究院博士生,AReaL团队核心成员,主要研究方向为大语言模型强化学习及智能体强化学习。他在ICLR, NeurIPS, ICML, AAMAS等会议发表多篇论文。代表性开源工作包括AReaL以及ASearcher 。
14:30 - 15:00Agent 的两朵乌云:实时与环境交互,从经验中学习
BoJieLi
演讲内容摘要
当前的自主 AI Agent 在实际应用中面临两大核心挑战:与环境的实时交互以及从经验中学习。本文探讨这两大难题并提出相应解决方案。针对传统 Agent 在语音和图形界面(GUI)交互中的高延迟问题,我们提出了“交互式 ReAct”框架,它通过融合快慢思考模式,允许 Agent 边听边想、边想边说,从而克服传统“观察-思考-行动”循环的局限性;并通过强化学习(RL)训练 VLA 模型提升 GUI 操作的精确性和实时交互能力。为弥补 Agent 从经验中学习机制的缺失,我们探索了四种方法:利用知识库快速应用新经验;借助长上下文的内置注意力机制形成记忆;通过 RL 后训练提升任务熟练度;以及利用代码生成能力自动创建工具以加速重复性任务。本文旨在为构建能高效、自主地完成现实世界复杂任务的下一代 AI Agent 提供一套综合性解决方案。
演讲嘉宾简介
李博杰,Pine AI 联合创始人、首席科学家。曾任华为首届“天才少年”。2019 年在中国科学技术大学与微软亚洲研究院取得联合培养博士学位,并获 ACM 中国优秀博士学位论文奖和 “微软学者” 奖学金。
10月18日下午 | 大模型基础理论 (六号楼1会场)
主席 | 滕佳烨

滕佳烨,上海财经大学统计与数据科学学院助理教授,主要研究方向为理论机器学习,包括泛化理论、共形预测等。博士毕业于清华大学交叉信息研究院,并曾赴普林斯顿大学访问。曾获清华大学优秀毕业生、清华大学优秀博士论文等荣誉;获得上海市 2024 “科技创新行动计划”启明星培育(扬帆专项)资助,以及 2025 CCF 理论计算机科学博士学位论文激励计划(提名),并为人工智能研讨班 FAI-Seminar 的筹办人。主页:www.tengjiaye.com。

15:30-16:00What Makes Looped Transformers Perform Better Than Non-Recursive Ones (Provably)
JiayeTeng
演讲内容摘要
While looped transformers (termed as Looped-Attn) often outperform standard transformers (termed as Single-Attn) on complex reasoning tasks, the theoretical basis for this advantage remains underexplored. In this paper, we explain this phenomenon through the lens of loss landscape geometry, inspired by empirical observations of their distinct dynamics at both sample and Hessian levels. To formalize this, we extend the River-Valley landscape model by distinguishing between U-shaped valleys (flat) and V-shaped valleys (steep). Based on empirical observations, we conjecture that the recursive architecture of Looped-Attn induces a landscape-level inductive bias towards River-V-Valley. Theoretical derivations based on this inductive bias guarantee a better loss convergence along the river due to valley hopping, and further encourage learning about complex patterns compared to the River-U-Valley induced by Single-Attn. Building on this insight, we propose SHIFT (Staged HIerarchical Framework for Progressive Training), a staged training framework that accelerates the training process of Looped-Attn while achieving comparable performances.
演讲嘉宾简介
滕佳烨,上海财经大学统计与数据科学学院助理教授,主要研究方向为理论机器学习,包括泛化理论、共形预测等。博士毕业于清华大学交叉信息研究院,并曾赴普林斯顿大学访问。曾获清华大学优秀毕业生、清华大学优秀博士论文等荣誉;获得上海市 2024 “科技创新行动计划”启明星培育(扬帆专项)资助,以及 2025 CCF 理论计算机科学博士学位论文激励计划(提名),并为人工智能研讨班 FAI-Seminar 的筹办人。主页:www.tengjiaye.com。
16:00-16:30随机梯度下降算法在高维回归问题中正则效应与泛化性能分析
CongFang
演讲内容摘要
随机梯度下降算法是求解机器学习问题中的常见算法。在高维学习问题中,随机梯度下降算法的迭代次数往往低于模型参数量,算法对于模型的产生隐式正则效应是模型具有良好泛化的主要原因。本次讲座,我们将研究随机梯度下降算法在不同学习情境下求解简单模型的泛化性能,并进行定量比较。我们将分别讨论算法在不同学习尺度(即样本数与问题维度不同依赖关系)与协变量偏移条件下的学习效率,尝试理解算法对于学习问题的适应性与涌现发生的条件。理论将启发设计内存节约大模型训练算法,在GPT2等标准测试平台取得更优性能。
演讲嘉宾简介
方聪,北京大学智能学院担任助理教授(博导)、研究员、博雅青年学者。方聪于2019年在北京大学获得博士学位,先后在普林斯顿大学和宾夕法尼亚大学进行博士后研究。方聪的主要研究方向是机器学习基础理论与算法,已发表包括PNAS、AoS、IEEE T.IT、JMLR、COLT、NeurIPS、PIEEE 等30余篇顶级期刊与会议论文,担任机器学习顶级会议NeurIPS、ICML领域主席(Area Chair),团队获得2023年度吴文俊人工智能自然科学奖一等奖。
16:30-17:00大模型对齐中的弱到强泛化机理研究
ZiqiaoWang
演讲内容摘要
在当前大模型对齐研究中,一个备受关注的现象是弱到强泛化(Weak-to-Strong Generalization, W2SG),即通过弱教师模型生成伪标签,指导强学生模型进行训练,从而实现学生在目标任务中反超教师的现象。尽管这一现象已被实证观察到,但其理论机理仍未被充分揭示。本报告围绕W2SG的理论分析展开,重点在于用Bregman散度下的广义偏差-方差分解刻画学生与教师之间的风险差异,首次在不依赖假设空间凸性这一强假设的前提下,推导出基于"预测不匹配"的W2SG不等式。我们进一步理论证明对于容量足够大的学生模型,W2SG现象更有可能出现。与此同时,我们发现适度的正则化或早停对于避免学生模型过度拟合教师标签是必要的。此外,在W2SG损失函数选择方面,我们理论上比较了标准交叉熵与反向交叉熵在W2SG场景下的表现,指出后者在面对教师预测不确定性时更加稳健。最后,我们通过实证分析验证了上述理论发现,包括学生模型容量对W2SG的影响,以及来自多个教师模型的平均监督对提升学生性能的作用。
演讲嘉宾简介
汪子乔,同济大学计算机科学与技术学院助理教授。研究方向为机器学习基础理论、统计学习原理以及信息论。近几年主要成果发表在人工智能、机器学习及数据挖掘等相关领域国际顶级会议,涵盖NeurIPS、ICML、ICLR、UAI、AAAI、KDD、WWW等,博士论文被提名2025年加拿大人工智能协会最佳博士论文奖,以及提名2025年渥太华大学总督学术奖章和Pierre Laberge论文奖。曾担任IEEE North American School of Information Theory (NASIT) 2024联合程序主席。
17:00-17:30Efficient and Fast Training with new Zero-th order Hybrid Optimizer
ZiyeMa
演讲内容摘要
Optimizing large-scale nonconvex problems, common in machine learning, demands balancing rapid convergence with computational efficiency. First-order (FO) stochastic methods like SVRG provide fast convergence and good generalization but incur high costs due to full-batch gradients in large models. Conversely, zeroth-order (ZO) algorithms reduce this burden using estimated gradients, yet their slow convergence in high-dimensional settings limits practicality. We introduce VAMO (VAriance-reduced Mixed-gradient Optimizer), a stochastic variance-reduced method combining FO mini-batch gradients with lightweight ZO finite-difference probes under an SVRG-style framework. VAMO's hybrid design uses a two-point ZO estimator to achieve a dimension-agnostic convergence rate of O(1/T + 1/b), where T is the number of iterations and b is the batch-size, surpassing the dimension-dependent slowdown of purely ZO methods and significantly improving over SGD's O(1/√T) rate. Additionally, we propose a multi-point ZO variant that mitigates the O(1/b) error by adjusting number of estimation points to balance convergence and cost, making it ideal for a whole range of computationally constrained scenarios. Experiments including traditional neural network training and LLM finetuning show VAMO outperforms established FO and ZO methods, offering a faster, more flexible option for improved efficiency.
演讲嘉宾简介
The speaker Ziye Ma is currently a presidential assistant professor in the computer science department at the City University of Hong Kong. Prior to this, he completed his PhD in the EECS department at UC Berkeley under the guidance of Somayeh Sojoudi and Javad Lavaei. His research is mostly focused on machine learning theory and AI foundation, with a particular emphasis on non-convex optimization. His works have received several oral designations in top ML conferences, and he has received the early career scheme from research grant council (RGC) of Hong Kong.
10月18日下午 | Agent的产业应用 (六号楼2会场)
主席 | 冯俊晨

冯俊晨,芝加哥大学博士,现任火花思维大数据技术总监,负责火花思维的 AI 提效战略。在 AI 辅助编程、RAG 智能问答与 Agent 自动化方向拥有丰富实践经验,并多次受邀为微软、火山引擎、腾讯云、百度智能云等头部 AI 云厂商进行教育领域闭门分享。

15:30-16:00Data Agent在业务数据分析中性能调优实践
JianboZhao
演讲内容摘要
从 ChatBI 到 Data Agent,分析工具正从交互式报表向自主智能分析演进。Data Agent 利用 LLM 实现深度的知识整合、自主分析推理和动态决策,相比传统分析工具在效率与深度上具备明显优势。本议题将介绍 Data Agent 的工程架构与调优方法论,并结合零售等场景的归因分析实践,展示如何实现性能优化。最后,将展望 Data Agent 未来的技术发展。
演讲嘉宾简介
赵健博,现任字节资深技术专家,深耕数据领域多年,积累了丰富的企业级实践经验。当前专注于以大语言模型为代表的AI技术在数据分析与决策场景中的创新应用,致力于构建覆盖全场景、具备自主决策与自适应能力的Data Agent,推动数据驱动从自动化迈向智能化
16:00-16:30 Agentic AI 如何赋能企业提效以及成功案例分享
ZhaoranFan
演讲内容摘要
拥有多个行业头部品牌大模型应用落地经验专家,为你分享在当下模型能力以及市场背景下,AI再企业内最好的应用形态以及各头部企业的成功落地案例
演讲嘉宾简介
范兆然,曾任句子互动产品总监,主导规划在线教育、零售、电商等多个行业的AI营销转型项目(如海底捞、量子之歌、快鱼、欧莱雅等)。设计并构建“Agentic 数字员工平台”,实现AI在企业销售、客服、社群运营等场景下的高效赋能。具备多种AI+技术融合的探索与落地经验,探索并实践了AI与CDP、RPA、内容中台等多种技术的融合模式,推动AI从能力到系统性平台的落地转化
16:30-17:00 AI在教育行业的落地和实践
NaZhang
演讲内容摘要
探索AI如何赋能教育,从智能教学到个性化学习,分享行业落地案例与实践经验,助力教育创新升级。
演讲嘉宾简介
张镎,微软(中国)高级解决方案专家,专注于教育行业的AI应用实践与数字化转型,拥有20余年IT行业经验。加入微软前,曾任AWS高级产品经理与技术客户经理。
17:00-17:30Data Agent行业观察: 从可用到可信的智能分析
演讲内容摘要
Data Agent 正在重塑企业数据分析方式,但真正落地需跨越三大门槛:可靠性、安全性和持续学习能力。在高决策密度场景中,准确与可解释缺一不可;在敏感数据环境中,安全必须内生于架构;面对业务演化,Agent 必须越用越聪明。本分享聚焦行业内Data Agent 的核心挑战与关键路径,探讨如何让智能分析从“能答”走向“可信”。
演讲嘉宾简介
JinZhang
张锦,现任滴滴网约车智能量化中台负责人兼数据科学方向负责人,主导网约车AI数据分析Agent的战略规划与落地,致力于将前沿数据+AI技术转化为业务高价值产品。过往任职于中美头部互联网公司,曾带领团队多次获得集团级奖项,期待与各位交流AI Agent的创新与应用。
RuiCheng
程瑞,现任滴滴出行资深数据分析师,专注于 AI Agent 在数据分析场景的落地实践。主要负责构建面向业务分析师的智能分析助手,聚焦周报生成、经营分析、归因分析与异动洞察等核心场景,推动从“辅助工具可用”向“分析结果可信”的演进。曾创立企业级 AI 服务公司,专注推动 AI Agent 在垂直场景中的产品化与规模化落地。
10月19日上午 | Keynote (六号楼2会场)
08:30 - 09:15Monte Carlo's view of AI revolution
刘军 | 美国科学院院士 清华大学统计与数据科学系教授
刘军教授
演讲内容摘要
Monte Carlo methods first appeared in early days (1945-55) of electronic computing. The technique was named after the famed gambling resort because its procedures incorporate the element of chance. Initially, statistical physicists introduced a Markov Chain-based dynamic Monte Carlo method for the simulation of simple fluids. This method was later named as “Markov chain Monte Carlo (MCMC)” and extended to cover more and more complex physical systems. At almost the same time, a sequential (recursive) construction was proposed to simulate long chain polymers, which can be seen as the ancestor of the popular “particle filters” (aka sequential Monte Carlo). Nowadays, Monte Carlo has been widely used as a powerful computational tool for optimization and integration in diverse fields, especially for various AI tasks. We will first review of Monte Carlo’s history, and then discuss a few recent directions and developments, e.g. Monte Carlo tree search, reparameterization, diffusion sampling, resampling and optimal transport, and particle flow via variational approximation.
演讲嘉宾简介

刘军,美国科学院院士,2025年8月全职加盟清华大学统计与数据科学系,担任清华大学兴华卓越讲席教授。刘军在2015年主导创建清华大学统计学研究中心并担任名誉主任。2024年,他作为筹建发展委员会主任,帮助清华大学建立了统计与数据科学系。

刘军教授曾任哈佛大学统计系终身教授;曾兼任哈佛大学生物统计系教授;曾任斯坦福大学统计系助理教授、副教授、终身教授。刘军教授1985年本科毕业于北京大学数学系,1991年博士毕业于芝加哥大学。刘军教授于2002年获得北美五大统计协会联合颁发的“会长奖”(COPSS Presidents' Award),是国际统计学界最具声望的荣誉。刘军教授还曾获得美国国家科学基金会的CAREER Award,国际数理统计学会Medallion Lecturer,伯努利学会Bernoulli Lecturer,美国数理统计学会和美国统计学会会士(Fellow),晨兴应用数学金奖(三年一度),泛华统计协会杰出成就奖,ISI高被引用数学家,泛华统计协会许宝騄奖(三年一度)等荣誉。截至2025年5月,他在各类国际顶尖学术杂志(如Science,Nature,Cell,JASA,JMLR等)及书刊上发表论文300余篇和一本专著,被引用9万余次(Google scholar)。他已经指导了40多位博士生、30多位博士后。

刘军教授在序贯蒙特卡洛和粒子滤波方法领域做出了奠基性的贡献,对马尔可夫链蒙特卡洛(MCMC)方法的设计构建了重要理论框架和新技术,并广泛应用这些理论和方法于工程学、生物信息学、大数据分析、个性化医疗等许多领域。在生物信息学方面,由刘军教授提出的“Gibbs保守串抽样和指针”是到目前为止生物学者寻找DNA和蛋白序列中精巧模式的两种最流行的算法,在了解基因调控和蛋白同源性方面有非常成功的应用。近年来,刘军教授在统计学习理论和方法方面取得取得一系列突破性进展,对大数据处理方面有重大影响。

10月19日上午 | AI4Science (六号楼1会场)
主席 | 许洪腾

许洪腾,中国人民大学高瓴人工智能学院长聘副教授、博导,2017 年博士毕业于佐治亚理工学院,2013 年硕士毕业于上海交通大学,2010 年本科毕业于天津大学。研究聚焦通用人工智能技术与应用,特别是最优传输驱动的机器学习理论与方法、生成式大模型架构设计与高效适配、AI4Math 及 AI4Science 等方向,发表论文 70 余篇,并多次在 AAAI、IJCAI 等会议组织相关 Tutorial 与研讨会。

9:15-9:45An SE(3)-Transformer for Molecular Conformation Optimization Driven by Wasserstein Gradient Flows
HongtengXu
演讲内容摘要
Predicting molecular ground-state conformation (i.e., energy-minimized conformation) is crucial for many chemical applications such as molecular docking and property prediction. Classic energy-based simulation is time-consuming when solving this problem, while existing learning-based methods have advantages in computational efficiency but sacrifice accuracy and interpretability. In this work, we propose a novel and effective method to bridge the energy-based simulation and the learning-based strategy, which designs and learns a Wasserstein gradient flow-driven SE(3)-Transformer, called WGFormer, for ground-state conformation prediction. Specifically, our method tackles this task within an auto-encoding framework, which encodes low-quality conformations by the proposed WGFormer and decodes corresponding ground-state conformations by an MLP. The architecture of WGFormer corresponds to Wasserstein gradient flows -- it optimizes conformations by minimizing an energy function defined on the latent mixture models of atoms, thereby significantly improving performance and interpretability. Extensive experiments demonstrate that our method consistently outperforms state-of-the-art competitors, providing a new and insightful paradigm to predict ground-state conformation.
演讲嘉宾简介
许洪腾,高瓴人工智能学院长聘副教授,博导。2017年博士毕业于佐治亚理工学院,2013年硕士毕业于上海交通大学,2010年本科毕业于天津大学。其研究方向为通用人工智能技术及其应用,特别是(1)最优传输驱动的机器学习理论与方法;(2)生成式大模型架构设计、模型压缩、模型融合;(3)AI4Math以及AI4Science等前沿应用。以第一作者或通讯作者身份在人工智能领域知名会议和期刊上发表论文70余篇,并曾在AAAI、IJCAI等会议上针对最优传输与机器学习组织Tutorial和研讨会等活动。近年来的代表性工作包括基于最优传输距离的图神经网络设计与学习方法、数值算法驱动的大模型架构设计与高效适配、基于生成式人工智能的柔性大分子建模技术等。
9:45-10:15Self-Supervised Learning Empowers Scientific Discovery in Life Science and Drug Discovery
YanyanLan
演讲内容摘要
在生命科学与药物发现领域,高成本、长周期、高失败率是长期存在的核心痛点。自监督学习正通过挖掘海量、未标注的生物医学大数据,为解决这些痛点带来革命性突破。本报告将深入探讨自监督学习如何通过学习基因序列、分子结构和蛋白-分子相互作用的内在规律,显著加速靶点发现、药物筛选和性质预测等关键环节。我们将通过前沿案例证明,自监督学习不仅是技术工具的升级,更是驱动从“假设驱动”向“数据驱动”科研范式转变的核心引擎。
演讲嘉宾简介
兰艳艳,清华大学智能产业研究院(AIR)首席研究员/教授,人工智能学院博士生导师,国家青年人才。研究方向为机器学习、信息检索和AI for Science。在人工智能和机器学习领域重要国际期刊和会议上发表论文80余篇,Google Scholar引用超过10000次。获得人工智能领域顶级国际会议SIGIR最佳学生论文奖和CIKM最佳论文Runner-Up奖。获得中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖。担任AI领域多项国际重要会议的PC Chair和Area Chair,国际期刊AI Journal副主编。她是中国计算机学会高级会员,中文信息学会信息检索专委会秘书长,应用数学学会通信与数学专委会副主任。
10:15-10:45Going beyond Data Limitation with Physical Laws
ChangLiu
演讲内容摘要
Artificial intelligence (AI) has shown unprecedented capability as a computational approach to solving scientific tasks. Nevertheless, scientific tasks hold their unique challenge of the enormous problem space, while data generation approaches are limited in accuracy, scale, system coverage and conditions. This talk will introduce recent advances that go beyond the data limitation by using physical laws, the blessing from the science side. We demonstrate a series of effective approaches for molecular science across scales, starting from improving the accuracy and generalizability of electronic structure prediction beyond data using quantum mechanics equation, which in turn improves energy and microscopic property prediction. We then show that leveraging the energy function corrects data bias for thermodynamic ensemble modeling, which leads to accurate prediction of observable design properties.
演讲嘉宾简介
Bio: Dr. Chang Liu is a researcher at Zhongguancun Academy, and previously worked at Microsoft Research. He received his Ph.D. degree in 2019 from the Department of Computer Science and Technology of Tsinghua University. His research interest includes sampling methods, generative models, and AI methods for molecular science problems. Dr. Liu has a rich publication record in top-tier conferences and journals, including ICML, NeurIPS, ICLR, and Nature series journals, and has served as area chair for major AI conferences.
10:45-11:15基于Uni-Mol的分子设计
ZhifengGao
演讲内容摘要
近年来,AI基座模型驱动的分子设计在生物医药、能源化工、功能材料等等领域取得了非常多显著的进展,Uni-Mol作为首个3D分子预训练大模型,也在多领域赋能AI for Science,整体围绕以下几点进行介绍: 1. 分子基座模型的现状和发展; 2. 基于Uni-Mol的分子设计整体框架; 3. 案例介绍(工业界、学术界等等);
演讲嘉宾简介

2015年本科毕业于南京工业大学,2018年硕士毕业于北京大学软件与微电子学院,毕业后在微软亚洲研究院机器学习组工作多年,主要研究方向为生成式对话学习、数据挖掘以及AI4S相关算法的研发落地,曾带领团队开发出新冠传播预测最准模型,获得CDC官方认可。现就职于北京深势科技有限公司担任AI算法负责人,负责深势科技相关AI for Science算法的研发和落地,包括分子、材料预训练大模型的研发以及在垂直领域的应用,AI在材料与工艺优化与表征建模的应用等。

近年来主要从事小分子表征学习、预训练、分子设计相关的研究和落地,带领团队研发出首个分子3D预训练大模型Uni-Mol,其在属性预测、构象生成、分子蛋白结合位点预测等重要下游任务上取得最佳性能,并且把Uni-Mol拓展到药物、材料、电池、化工等领域,形成多种基于AI的工业级别解决方案和成功的企业落地案例;作为核心主导多项高校、科研机构关键项目攻坚合作,以第一作者或通讯作者在Nature Communication;Nature Computational Science; ICLR; NeurIPS; ICML; ICDE 等顶级期刊会议上发表多篇论文,作为第一负责人主持以及参与多项相关省部级科技项目,作为核心人员获得第二届“祖冲之奖”-人工智能前沿创新奖,Kaggle GrandMaster,共获得国内、国际顶级数据挖掘比赛冠军九项;

11:15-11:45Panel
10月19日上午 | 具身智能 (六号楼2会场)
主席 | 许华哲

许华哲博士,清华大学交叉信息研究院助理教授、博导,具身智能实验室负责人,星海图智能联合创始人。曾在斯坦福大学从事博士后研究,博士毕业于加州大学伯克利分校,研究方向为具身人工智能的理论、算法与应用。曾获 CoRL 2023 最佳系统论文奖、2024 年 WAIC “云帆奖”,在 IJRR、RSS、NeurIPS 等发表论文七十余篇,并在 IJCAI、ICRA、ICLR、CoRL 等会议担任领域主席或副主编。

9:15-9:45观察-协作-反思:从示教与交互中学习物体操纵
DiHu
演讲内容摘要
物体操纵能力的习得一般源自两种途径,即从示教中模仿或从交互中历练。从示例中学习是一种能力快速增长的有效方式,但其有限的探索空间所形成的能力瓶颈却制约着对外界环境特性的深刻理解与操纵行为的有效规划;而同环境的交互能够提供可拓展的探索空间和丰富的信息反馈,但是其高昂的探索成本却阻碍着操纵能力的持续增长。在本次报告中,我将以“观察-协作-反思”的技术路径,思考如何从示教学习出发,以矫错为核心,将形成的基础能力逐步拓展到交互学习场景中,以高效支持物体操纵能力的持续提升,进而形成示教与交互协同支撑的操纵能力习得。
演讲嘉宾简介
胡迪,现任中国人民大学高瓴人工智能学院副教授,博导。主要研究方向为机器多模态感知、交互与学习,以主要作者在T-PAMI/ICML/CVPR/CoRL等人工智能顶级期刊及会议发表论文60余篇,代表性工作如视音指代分割与问答;平衡多模态学习理论,机制与方法;面向物体操纵的动态多模态交互算法等。作为副主编出版本科教材一部。曾入选 CVPR Doctoral Consortium;荣获2020中国人工智能学会优博奖;荣获2022年度吴文俊人工智能优秀青年奖;入选第七届中国科协青托计划、微软铸星学者、智源学者等。所指导学生获百度奖学金(全球10人)。担任AAAI、IJCAI Senior PC等,主办/协办多场国际顶级会议的多模态学习讲习班(Tutorial)。
9:45-10:15Image-Goal Representations are Atomic Control Units for Foundation Models in Embodied AI
LiZhao
演讲内容摘要
We present Image-GOal Representations (IGOR), aiming to learn a unified, semantically consistent action space across human and various robots. Through this unified latent action space, IGOR enables knowledge transfer among large-scale robot and human activity data. We achieve this by compressing visual changes between an initial image and its goal state into latent actions. IGOR allows us to generate latent action labels for internet-scale video data. This unified latent action space enables the training of foundation policy and world models across a wide variety of tasks performed by both robots and humans.
演讲嘉宾简介
Li Zhao is a Principal Researcher at Microsoft Research Asia in the Machine Learning Group. Her research interests include embodied AI, reinforcement learning, and natural language processing. She received her B.S. and Ph.D. in Computer Science from Tsinghua University, advised by Professor Xiaoyan Zhu and Minlie Huang. She was a core contributor to the Mahjong AI system, Suphx, the first AI system to reach the 10th Dan on the internationally renowned professional mahjong platform "Tenhou”, surpassing most of top human players in the platform. Her work received ICDM Best Student Paper Runner-up Award, and her research has also been applied to many Microsoft products and their development, including machine translation, traffic control behind Teams, Xbox automated game testing, etc.
10:15-10:45试探究脑认知科学、脑机接口与具身智能的联动
XuGuangyuan
演讲内容摘要
脑认知科学、脑机接口(BCI)与具身智能的融合,正开启人机交互的革命性前沿。其核心机制在于构建了一个“感知-行动-反馈”的闭环:脑认知科学为BCI提供了大脑功能的“地图”;BCI技术负责“读取”大脑意图(如运动指令),并将其解码以控制具身智能体(如机械臂、外骨骼);同时,BCI还能“写回”智能体从环境中获取的感官信息(如触觉),使大脑得以学习和适应,形成高效的神经可塑性。在应用上,这一联动已帮助瘫痪患者通过意念控制智能假肢并重获触觉。尽管目前仍面临信号保真度、长期稳定性及数据隐私等伦理挑战,但三者的结合预示着“人机共生”的未来,将在医疗康复、虚拟现实和认知增强等领域产生深远影响。
演讲嘉宾简介
徐光远是北京邮电大学人工智能学院研究员、博士生导师,清华大学博士后,中国人工智能学院原理事长钟义信院士助手,范式革命与机制主义人工智能 团队骨干成员。2019 年获新西兰奥克兰大学博士(优秀论文,首位华人),长期研究脑认知与具身智能,发 20多篇学术论文,授权专利 3 项,主持国家自然科学基金、北京市自然科学基金、国家重大科技项目子课题、上海市经信委脑机接口创新专项等,获全国博士后创新创业金奖、全国创新创业优秀博士后、国家引进博士后称号、首批水木学者等称号。
10:45-11:15基于软磁弹性体的机器人触觉传感器及其抓取应用
XiaZiWei
演讲内容摘要

随着具身智能技术向智能抓取、精密制造、医疗康复等领域推广渗透,触觉传感器在机器人领域的需求愈发增加,磁触觉传感器作为一种高灵敏度、宽量程、柔性可拉伸的触觉传感器,为机器人提供了理想解决方案,成为机器人感知领域的研究热点。

本报告介绍了磁触觉传感器的感知机理、制备方法及数据处理方法,通过结构优化与算法优化,实现了高灵敏度力感知与位置识别、磁性特征识别等任务,显著提升了机器人对不同特性物体的抓取适应性、安全性与稳定性。在此基础上,结合视触觉传感器提出了多模态触觉传感器方案,用于增强视触觉传感器感知精度和接近觉感知能力,以提高机器人感知操作能力。

演讲嘉宾简介
夏子炜,博士毕业于中国地质大学(北京),主要研究方向为:机器人灵巧手,机器人磁触觉传感器、机器人感知抓取研究。作为科研骨干参与国家重点研发计划“智能机器人”专项、北京市“揭榜挂帅项”项目等项目。已发表包含IEEE TIE、RAM、IROS在内的SCI/EI论文十余篇。
10月19日下午 | 生物医药统计与大模型 (六号楼2会场)
主席 | 俞声 王健桥

俞声:清华大学统计与数据科学系长聘副教授,研究方向为医学文本类智能,涵盖自然语言处理、大型语言模型等。与哈佛大学蔡天西教授合作研发的高通量表型提取技术将疾病表型识别算法开发速度提升千倍,并服务于美国国家级精准医学项目;主导 BIOS 生物医学信息学本体系统及 GENIE 电子病历结构化大模型,获评国家青年拔尖人才,现任 JASA Associate Editor。

王健桥:清华大学统计与数据科学系助理教授、博士生导师,2022 年获宾夕法尼亚大学生物统计学博士学位,曾在哈佛大学生物统计系从事博士后研究。致力于开发稳健、可解释的高维统计方法并应用于大规模基因组数据分析,在医学健康领域与合作者深入开展心血管与慢性肾病研究,相关成果发表于统计、医学与科学领域顶级期刊。

13:00-13:30基于大模型的电子病历结构化与医学本体建设
ShengYu
演讲内容摘要
电子病历包含患者诊疗过程中的丰富医学信息,通过自动化信息提取并对术语进行标准化,转化为规范的结构化数据,可以为医学研究与临床自动化提供丰富的数据支持、大幅降低人力成本、提高科研数据采集与医院管理效率。然而,真实的临床病历用语高度个性化、存在大量简称和非标准表达,电子病历的结构化、标准化对自然语言处理工具和基础设施都是巨大挑战。本报告将介绍利用大模型中的庞大背景知识,实现电子病历的准确理解,并在其术语抽取的基础上,利用大模型实现大规模数据驱动的医学本体自动化建设。
演讲嘉宾简介
俞声,清华大学统计与数据科学系长聘副教授。研究方向为医学文本类智能,包括自然语言处理、大型语言模型、知识图谱、搜索引擎、电子病历分析等。俞声与哈佛大学蔡天西教授合作发明的高通量表型提取技术使疾病表型识别算法开发速度提高千倍,应用于"Million Veteran Program"等美国国家级精准医学研究项目以及Mass General Brigham等医院的生物样本库、科研患者注册库建设。俞声主持开发了拥有2210万概念、4602万中英文术语、9985万关系三元组的"生物医学信息学本体系统"BIOS,体量达到美国"统一医学语言系统"UMLS的数倍。俞声与蔡天西教授于2014年发布了电子病历自然语言处理系统NILE,被10个国家和地区的医学研究机构和学者使用;2024年,俞声与蔡天西、Isaac Kohane课题组联合发布中英文电子病历结构化大模型GENIE。俞声获评国家青年拔尖人才,现任JASA Associate Editor。
13:30-14:00深度学习赋能的药物发现与开发
TianfanFu
演讲内容摘要
药物设计和开发是一个既漫长又昂贵的过程,涉及从分子发现到临床试验的多个复杂步骤。人工智能(AI)技术展示了巨大的潜力,可以显著加速这一过程并降低成本。在药物发现的初期阶段,目标是识别具备理想药理特性的分子。本报告将深入探讨最新的药物设计方法,包括连续空间深度生成模型和离散空间药物设计路径搜索算法。这些先进的AI工具能够高效地探索化学空间,预测新化合物的活性和安全性,并优化候选药物的设计,以满足特定的治疗需求。进一步讲,在药物开发的后期阶段,重点转向了临床试验,这是评估药物对人体安全性和有效性的重要环节。为了提高临床试验的成功率和效率,本报告将介绍一系列最新的可信赖的方法,包括可解释性、不确定性感知的临床试验设计与预测技术。这些方法不仅能够模拟真实的临床试验过程,还能帮助科学家更好地理解潜在的风险和收益,从而做出更加明智的决策。
演讲嘉宾简介
符天凡,现任南京大学计算机学院副教授,长期从事人工智能赋能的药物发现(AI for Drug)、人工智能赋能的科学发现(AI for Science)方面的研究。他本科硕士毕业于上海交通大学计算机科学与技术系,博士毕业于美国佐治亚理工学院计算机科学与工程系。曾任美国伦斯勒理工学院计算机科学系常任轨道助理教授。2024年12月加入南京大学计算机科学与技术系,入选国家级青年人才项目。他在Nature、Nature Chemical Biology、Nature Machine Intelligence、Nature Scientific Data、Foundations and Trends in Machine Learning、ICML、ICLR、NeurIPS、KDD、TKDE等知名会议和期刊上发表学术论文40余篇。论文被国内外同行广泛引用(谷歌学术引用量达到5000余次),引用者来自斯坦福、麻省理工、哈佛、耶鲁、普林斯顿等国际著名机构,包括中、美、英、加、欧等国/地的20余位科学院/工程院院士和50余位AAAI/ACM/IEEE Fellow。2017年翻译了深度学习(“花书”),销量达50余万册。研究成果应用于多家生物医药企业。他还共同组织了前三届AI for Science研讨会。
14:30-15:00Multivariate Conformal Prediction for Brain Volumetry From Accelerated MRI
HuaqingJin
演讲内容摘要
Accelerated Magnetic Resonance Imaging (MRI) is essential for clinical practice but introduces uncertainty into brain volumetry. We propose a framework combining the semiparametric modelling with Multivariate Conformal Prediction (MCP) to generate statistically-guaranteed prediction sets for brain regions volumes.Our model-agnostic approach provides rigorous uncertainty bounds without making distributional assumptions. Integrating the method with the reconstruction and segmentation algorithms, a pipeline is developed to construct prediction sets directly from the k-space downsampled MRI measurements. The pipeline is validated on the Alzheimer's Disease Neuroimaging Initiative (ADNI) dataset, demonstrating its effectiveness. This work provides a practical tool to enhance the reliability of volumetric biomarkers from accelerated MRI scans.
演讲嘉宾简介
Huaqing Jin is an assistant professor in the department of statistic and data science at Tsinghua University. He completed his postdoctoral training at the University of California, San Francisco (UCSF) and earned his PhD degree in statistics from the University of Hong Kong. His research focuses on high-dimensional statistics, change point detection, and Bayesian statistics, with a particular emphasis on applications in neuroimaging data analysis and clinical trials.
15:00-15:30Features fusion or not: harnessing multiple pathological foundation models using Meta-Encoder for downstream tasks fine-tuning
ZhangshengYu
演讲内容摘要
The emergence of diverse pathological foundation models has empowered computational pathology tasks, including tumor classification, biomarker prediction, and gene expression prediction. However, variations in model architecture and data sources lead to inconsistent downstream performance and complicate centralized training. Specifically, the lack of data sharing makes retraining foundation models with pooled data infeasible. Alternatively, the release of model parameters enables combining multiple models during fine-tuning. Inspired by the meta-analysis method, we propose the Meta-Encoder framework, which integrates features from multiple foundation models to generate a comprehensive representation, improving downstream fine-tuning task performance. Comparative experiments demonstrate that Meta-Encoder is more effective than individual foundation models, with its strengths more pronounced in handling complex tasks. While single models may perform sufficiently well for simple tasks, Meta-Encoder can match or even surpass the best-performing single model, alleviating concerns over model selection. Moderately challenging tasks benefit from Meta-Encoder's concatenation or self-attention strategies, with the latter demonstrating superior performance in more challenging scenarios. For highly complex tasks, such as high-dimensional gene expression prediction, self-attention proves to be the most effective Meta-Encoder strategy, balancing feature integration and computational efficiency. For three patch-level spatial gene expression prediction tasks (HEST-Benchmark, CRC-inhouse, and Her2ST), the self-attentionstrategy improved the Pearson correlation by 38.58%, 26.06%, and 20.39%, respectively, compared to the average performance of three patch-level single models. Similarly, for the TCGA-BRCA, TCGA-NSCLC, and TCGA-CRC WSI-level bulk gene expression prediction tasks, the Pearson correlation increased by 14.36%, 9.27%, and 42.55%, respectively, compared to the average performance of two WSI-level single models. By leveraging multiple pathological foundation models using Meta-Encoder, it can further improve molecular characterization in pathology images to advance precision oncology.
演讲嘉宾简介
俞章盛,上海交通大学医学院临床研究中心主任,上海交通大学长聘教授、博士生导师,耶鲁大学公共卫生学院生物统计学系客座教授,上海市海外高层次特聘专家,上海市优秀学术带头人。此前,他在密西根大学获得生物统计学博士。他在JAMA, Journal of Hematology and Oncology, Nature Communication, Biometrika, 等发表论文100余篇,任Statistics in Medicine副主编,Heart Rhythm统计编辑,Pediatric Pulmonology编委。他的统计方法研究包括基于统计及深度学习方法的医疗影像处理与预测模型、生存分析方法、临床试验方法,医学合作研究包括儿童发育,肾脏病,疼痛、肿瘤。
10月19日下午 | AI赋能健康统计 (六号楼2会场)
主席 | 李扬 林存洁

李扬:中国人民大学吴玉章特聘教授、博士生导师,学校交叉科学学术委员会副主任,入选国家级青年人才项目。研究聚焦模型选择与不确定性评价、复杂调查设计与分析、潜变量建模、试验设计与推断等领域,在 JASA、AOAS、Biometrics 等期刊发表论文九十余篇,并主持国家自科基金、教育部重大项目等。

林存洁:中国人民大学统计学院副教授,研究方向包括生存分析、精准医疗、亚组分析、健康医疗数据建模与分析等,在 Biometrics、AOAS、JCGS 等国内外统计期刊发表学术论文三十余篇。

15:30-15:55AI医药数智化应用生态与价值创造
BenLi
演讲内容摘要
随着AI/ML等前沿技术的快速演进,医药研发正迎来数智化转型的重要机遇。复星医药围绕AI在信息洞察、决策支持、药物发现、临床开发、上市营销等全生命周期中的应用,系统构建了以PharmAID决策智能体为代表的数智化平台,推动从数据资产管理到智能决策的深度融合。通过分享平台架构、场景落地及价值评估等方面的实践经验,助力行业共同探索AI赋能医药研发的创新路径与协同生态。
演讲嘉宾简介
李贲,现任复星医药全球研发中心生物统计负责人。美国Emory大学生物统计与生物信息学博士,曾在外资药企,初创公司,风险投资基金等从事多年统计学与数据科学相关的工作。主要研究方向为应用贝叶斯统计,适应性设计,临床试验中的因果分析,临床试验中机器学习和AI的应用等。现担任中国临床肿瘤学会(CSCO)生物统计学专家委员会委员、Contemporary Clinical Trials杂志副主编、DIA中国统计社区联席负责人等。
15:55-16:20临床试验方案的AI辅助撰写、数字化与自动化
AlexGoh
演讲内容摘要
Clinical study protocols serve as foundational documents for trial execution but typically exist in non-machine-readable formats, creating barriers to system integration and data exchange. Traditional protocol development is labor-intensive, error-prone, and constrained by tight timelines. This presentation demonstrates how artificial intelligence can revolutionize protocol development through digitalization and clinical content reuse. AI-driven implementation increases quality in a tight timeline while maintaining regulatory compliance. Digital protocols enable seamless integration with electronic systems and automate document generation, reducing manual data entry and minimizing transcription errors. This transformative technology addresses critical industry challenges, and establishes foundations for accelerated drug development while improving patient outcomes through more efficient clinical trial execution.
演讲嘉宾简介
Alex Goh 现任百济神州产品管理副总监,负责将先进的数据科学与人工智能能力融入全球临床研究运营;他拥有计算机科学博士、硕士和学士学位,并发表23篇同行评议论文,兼具深厚技术背景与逾十年的产品领导经验。Alex Goh博士主导数字化研究方案与临床内容复用项目,显著缩短试验启动周期、简化监管申报流程,并提高组织的 AI 赋能水平。此前,他在澳大利亚医保基金担任高级数据科学家兼产品经理,建立会员流失预测与未决赔付深度学习模型,为高层决策提供数据支撑并获澳大利亚审慎监管局认可。他的职业起点源于人体姿势控制的脑电跨学科研究,如今将其严谨方法学转化为可执行的产品路线图,带领跨职能团队推进数据驱动创新,改善患者获益并提升运营效率;他擅长分享机器学习与产品思维加速药物开发的实践经验。
16:20-16:45MAGIC:多智能体疑难肝病智能诊疗新方法
YucongLin
演讲内容摘要

我国肝病患者约4亿,占总人口28%,严重威胁人民健康。目前肝病的精确诊疗对医生的知识广度和深度要求极高,往往需多科室跨专业的综合性会诊。但仍面临以下挑战:(1)肝病类型众多,早期表现隐匿,其症状和体征特异性差,病变诊断严重依赖经验,缺乏结构化知识和系统量化标准,易导致误诊和漏诊;(2)肝病病程长,可同时合并全身多系统病变,诊断需多学科交叉知识的综合性判别,具有不同背景的临床专家治疗决策冲突点多;(3)不同级别医疗机构诊疗水平参差不齐,严重影响疑难复杂肝病的决策精度和效率,难以为肝病患者提供同质及时的诊疗方案。

为此,我们团队提出基于LLM的多智能体激活图推理协同模型MAGIC应对这一挑战。通过多尺度分析增强肝脏疾病认知,包括相似病例研究、异常指标识别和知识图谱分析。在模拟临床渐进式诊断过程中,该模型利用多智能体辩论结果动态调整图推理中的关键节点与关系权重,提升预诊断准确性。同时,模型通过临床指南对预诊断结论进行验证,确保其符合既定医疗标准,最终生成可靠诊断结果。我们提出的方法一举将疑难肝病的 AI 诊断准确率提升到 94.5%,多中心验证仍保持 91.6%,显著领先现有模型。本研究已经发表于人工智能顶刊Information Fusion中,IF=20.4(2024),并作为核心辩论技术开发了一套人机融合疑难肝病会诊系统,并在8家医院实现了示范应用。

演讲嘉宾简介
林毓聪,北京理工大学光电学院特别副研究员。本科毕业于人民大学,博士毕业于清华大学,其间在哈佛大学医学院进行了一年的访问,于北京理工大学从事博士后研究。林毓聪专注于多模态医学数据的研究,在医学影像、医学知识图谱与电子病历中进行了多项智能化方法研究,共计发表约40篇SCI论文,以第一作者或通讯作者发表Information Fusion, IEEE JBHI, Neurocomputing等16篇代表性SCI论文,平均IF=6.0。获批2023年国自然青年基金,作为项目骨干参与科技创新2030重大项目等4项国家级项目,其研究成果作为重要支撑荣获2024年电子学会科技进步一等奖。
17:10-17:35基于人工智能的临床研究效率提升
YangZhao
演讲内容摘要
Applying artificial intelligence to the design, operation, analysis, and interpretation of clinical research will help improve efficiency. In this report, we will review the current applications of artificial intelligence, especially large language models, in the field of enhancing clinical research efficiency. We will also introduce our work in areas such as protocol review and virtual digital twins.
演讲嘉宾简介
赵杨,博士,教授,博士生导师。2009年获南京医科大学流行病与卫生统计学系博士学位。2010年至2012年在美国美国哈佛大学公共卫生学院环境流行病学系主要从事肺癌遗传数据的研究。曾在Nature Communications, AJRCCM, International Journal of Epidemiology, BMC Medicine,Cell Reports,中华流行病学杂志,中国卫生统计等杂志以第一/通讯作者发表学术论文90余篇,合计发表学术论文350余篇。研究方向包括复杂生物医学数据整合分析及因果推断方法研究、临床试验中的统计方法、真实世界研究中的统计理论与方法。先后主持国自然项目5项,国家重点研发计划课题1项。作为统计专家或独立数据监察委员会专家,参与过数十个创新药物和疫苗的临床研发工作。现任中国卫生信息与健康大数据学会卫生统计学教育委员会主任委员,中华预防医学会生物统计学分会副主任委员,中国临床肿瘤学会生物统计专家委员会副主任委员、中国医药教育学会医药统计专委会副主任委员,江苏省预防医学会卫生统计学专委会主任委员。在新冠病毒肺炎疫情期间,参加了国家有关新型冠状病毒肺炎防控、新冠肺炎疫情预测预警和防控政策调整模型研究等工作。
16:45-17:10基于大语言模型的多样化私有数据临床试验仿真
ZhiboCai
演讲内容摘要
Clinical trial emulation has emerged as an important approach in real-world drug research, enabling investigators to replicate the design and analysis of randomized controlled trials using observational data. However, traditional emulation typically relies on expert knowledge and extensive literature review to construct a hypothetical trial, a process that is often time-consuming and constrained by limited scalability. In this work, we develop a domain-specific large language model (LLM) based AI agent trained with advanced direct preference optimization techniques to facilitate semi-automated trial emulation. Given the drugs or interventions of interest, the agent generates a complete hypothetical trial design, including detailed inclusion and exclusion criteria, treatment allocation strategies, follow-up protocols, and outcome definitions. Building on this, the system leverages LLM to align the hypothetical trial with the user’s diverse private datasets, producing tailored data extraction schemes that enable efficient retrieval of relevant patient cohorts and variables. This AI agent significantly improves the efficiency and reduces the cost of conducting emulation studies for researchers with heterogeneous, privately held data sources, expanding the accessibility and scalability of real-world evidence generation.
演讲嘉宾简介
蔡智博,中国人民大学统计学院数据科学与大数据统计系讲师。主要研究兴趣包括充分降维、变量选择及其在机器学习中的应用、人工智能的理论和应用。学术论文在JASA、CSDA等学术期刊,以及NeurIPS、SIGIR等会议上发表。