来自俄罗斯的声音:寻求中俄两国科学领域的协同发展。9月24日至26日,2024 CCF全国高性能计算学术年会(CCF HPC China 2024)在湖北省武汉市举行。俄罗斯科学院院士、马尔丘克数值数学研究所所长叶夫根尼·季尔季什尼科夫(Evgeny Tyrtyshnikov)参加了本次年会。
据悉,叶夫根尼·季尔季什尼科夫曾于去年获得了俄罗斯最大商业银行——俄罗斯储蓄银行(Sber)颁发的科学奖。会议前夕,《中国科学报》记者采访了季尔季什尼科夫以及Sber科学奖组委会成员——Sber副总裁、研究与创新部门负责人艾伯特·埃菲莫夫(Albert Efimov)。在专访中,季尔季什尼科夫表示,他此次参会一方面是来学习和了解一些前沿信息,另一方面也希望分享俄罗斯在高性能计算(High Performance Computing,HPC)和人工智能(AI)方面的成果,加强与中国同行的交流与合作。埃菲莫夫则表示,希望能够在高性能计算和人工智能领域寻找到中国和俄罗斯科学家都感兴趣并愿意为之努力的方向,深化彼此间的合作。
数学可以为HPC做什么,为人工智能带来什么?
季尔季什尼科夫的主要研究领域是线性代数、矩阵方法及其应用,这些领域影了大量涉及复杂计算的应用问题。这些似乎是“简单的科学”,大学生们通常由此开始数学学习,这些领域中的问题似乎都已经解决了,但实际上并不是这样。季尔季什尼科夫举例说:“想象一下,你需要解一个线性方程组,其中未知数和方程的数量为10的83次方,等同于宇宙中的总原子数量。如何才能做到这一点呢?事实证明,在大学里线性代数学得再好也没有用,借助经典方法,这种‘天文数字’的问题看似毫无解决的希望。”
季尔季什尼科夫表示,其研究的主要目标是帮助现代超级计算机用其特殊的数量较小的参数表示来取代“天文数字般大”的数据数组,并提供基于这些表示的高效计算算法。这是对某种通用计算范例的实现的研究,它补充了经典线性代数计算的成熟模型。
随着科学技术的发展,越来越多的领域需要进行大规模、高复杂度的计算,如天气预测、生物信息分析、物理和水动力模拟等。HPC作为解决这些计算问题的关键技术,越来越受到人们的关注。这其中,旨在最大限度地利用计算资源、提高计算效率的高效算法和软件,以及能够执行多个任务或操作的并行计算方法,成为发展HPC的重中之重。而这也正是季尔季什尼科夫为数学和HPC找到的“结合点”。
叶夫根尼·季尔季什尼科夫
俄罗斯科学院院士,物理学与数学博士
俄罗斯科学院马尔丘克数值数学研究所所长
他介绍说,早在1980年,俄罗斯科学家马尔丘克院士就提出“将算法映射到计算机系统的体系结构上”这一重要思路。在他之后,研究HPC高效算法和并行计算技术的俄罗斯科学家越来越多,并为此在国内外举办了很多研讨会,积极探索解决办法。2023年,季尔季什尼科夫获得Sber科学奖。谈及获奖理由,季尔季什尼科夫坦言,这主要是由于他对矩阵和张量方法发展所做出的贡献,特别是因为他发明了“张量火车”(Tensor Trains,TT)。“ 这些方法可以解决那些甚至超出了现代超级计算机处理能力的问题。其关键思想是使用特殊模型来表示基于低秩矩阵的多维数组(张量)。”如今,这一方法已经得到包括中国机构在内的全球数十个甚至数百个研究团队使用。
他介绍说,其中一个成就是训练此类模型的有效方法,允许通过极少量的数组元素获得模型参数。紧凑数据表示模型必须具有一个重要的属性,即除了数据压缩之外,还需要高效、可靠的算法来计算该模型的格式。此外,他成功组建了一支由年轻研究人员组成的强大团队。正是在计算数学研究所,该团队在2009 年开发出一个非常成功的多维矩阵低参数表示模型—— 一个张量火车。我们使用英文缩写 TT(Tensor Train,张量火车)来表示这个模型。
“在张量火车的情况下,我们有一个惊人的算法,其性质类似于使用著名的奇异值分解(SVD)算法获得近似值。其计算复杂度依赖于‘车’的大小,线性依赖于数组的维数,同时保证了对近似精度的良好估计。一个特殊的成就是基于数组元素近似构造张量火车的交叉算法,数组元素的数量与其元素总数相比可以忽略不计。”季尔季什尼科夫说。
目前,有关此类方法的数学理论获得了积极的发展,同时其实际应用在过去15年来也表现出了惊人的效率。在此基础上,他们成功构建了一种用于全局优化的新型启发式算法,该算法与遗传算法相比具有相当的竞争力,在某些情况下甚至更有效,例如在新药研发过程中解决“对接”(docking)问题。
季尔季什尼科夫认为,神经网络与函数论和近似论中非常深奥的数学问题有关。安德烈·柯尔莫哥洛夫求得了希尔伯特第13问题之解的著名研究可以被认为是现代神经网络的先驱。这项研究证明了任何多变量的连续函数都是通过一个变量的函数和加法的组合来实现的。随后,人们证明了一个变量的函数可以通过将自变量乘以一个因子和一个移位,从一个单一函数中获得。目前,已经出现了基于柯尔莫哥洛夫此项研究思想建立起来的神经网络。它们的潜力仍有待更详细的研究。同时,他认为人工智能方法的广泛工程应用与数学之间存在明显的差距,数学将真正帮助工程师进行开发。没有数学理论可以令人信服地解释为什么一种或另一种架构(例如在大型语言模型中)比另一种架构更好或更差。
那么,人工智能方法给数学带来了什么直接影响呢?季尔季什尼科夫解释说:“人工智能方法被用于解决数学物理问题,例如,优化整个过程的各个要素。在我看来,这些方法将有助于解决将算法映射到计算系统架构的问题。现在更准确地谈论这些方法的地位还为时过早。”
产研合作助力前沿科技发展
近年来,HPC和AI的结合正迅速改变着科学研究和创新领域。人工智能,尤其是以ChatGPT为代表的生成式人工智能(Generative AI)的发展,更是对HPC提出了更高的要求,也成为其重要的应用领域之一。Sber副总裁艾伯特·埃菲莫夫是该公司研究与创新部门负责人,并创办了其机器人实验室。他对高性能计算与人工智能及机器人发展之间的互动与促进有着深入的洞察。
在专访中,埃菲莫夫首先介绍了Sber科学奖。该奖项共包括四大类别,即“物理类”,涵盖了物理学、化学、天文学、地球科学、技术科学;“生命科学类”,涵盖了生物学、医学和农业科学;“数字宇宙类”,涵盖了数学、计算机科学、信息学;以及“人工智能科学类”,专门颁发给35岁以下的年轻科研人员,旨在表彰他们在人工智能领域的杰出成就。
艾伯特·埃菲莫夫 Sber副总裁、研究与创新部门负责人
在谈及Sber决定设立科学奖的初衷时,埃菲莫夫表示,Sber目前已经成为俄罗斯最大的科技公司,其竞争优势是基于研发对科技领域进行投资。Sber非常清楚如何进行应用研究并创造有用的技术和产品,但对一家商业公司来说,始终存在一个难题,即如何支持基础科学研究?“我们设立Sber科学奖的初衷就是为了支持基础科学研究。” 埃菲莫夫说。
Sber科学奖有两大主要特点。首先,它授予在科学研究中开辟新视野的科学家。其次,这一奖项在科学界有绝对的权威性。“这两大特点使得Sber科学奖成为年轻科学家和整个俄罗斯科学界在创造全新突破性解决方案,并在此基础上创造新技术方面的一个标杆。”埃菲莫夫说。
那么,未来这一奖项有没有可能进入国际舞台?对此,埃菲莫夫表示当然可以,但他也认为这并不容易。例如,需要确定俄罗斯和中国科学家都感兴趣和认为有用的领域。在他看来,其中一个领域就是人工智能的研究。
作为俄罗斯目前最大的科技公司,Sber产出了诸多科技成果,涉及人工智能、高性能计算等多个方面。在人工智能领域,Sber开展了几十个不同的项目,应用了很多前沿科技,包括生成式人工智能等。埃菲莫夫举了三个例子:第一是Sber的生成式人工智能模型系统。Sber将之称为“GigaChat”。这个系统可以允许用户处理文本、图像和其他类型的数据。第二个例子是Sber的 神经网络“Kandinsky”(康定斯基)。该模型允许客户通过文本描述生成图像和视频,同时该模型还支持中文。第三个例子是一个气候模型。由于全球变暖已经成为目前世界面临的主要威胁,因此基于AI技术创建了一个气候模型,能够预测气候风险。
Kandinsky生成的图片
(本文图片均由受访者提供)
作者:计红梅 来源:中国科学报