约翰·克罗克原以为会看到一条平坦的线——一条熟悉的水平轨道,有一些轻微的波峰和波谷——但他面前的能量图急剧下降。
“这是千载难逢的发现,”克罗克说。
“就好像模拟意外地掉进了能量表面的深峡谷。这很幸运,原因有二。首先,它改变了我们对玻璃材料的研究。其次,类似的峡谷有从研究机器学习算法的计算机科学家到研究蛋白质折叠的生物工程师,有可能帮助其他人解决我们在该领域面临的相同计算障碍。我们最终取得了重大成果,因为我们好奇地尝试了一种本不该尝试的方法奏效了。但确实如此。”
该方法是元动力学,一种探索能源景观的计算方法。它违反直觉的应用是宾夕法尼亚大学宾夕法尼亚大学一组工程师最近在PNAS上发表的一篇文章的主题,该团队由化学与生物工程系(CBE)教授兼研究生组主席Crocker以及副教授RobertRiggleman领导CBE教授和AmrutheshThirumalaiswamy博士CBE的学生。
大多数固体是玻璃状的(或玻璃状的)。我们将其余的归类为晶体。这些分类并不局限于我们可能想象的玻璃或水晶,而是表明任何固体中的原子是如何排列的。晶体具有整齐、重复的原子结构。然而,玻璃是无定形的。它们的原子和分子呈现出大量的无序结构。
像所有系统一样,玻璃结构在追求它们最稳定、最低的能量状态时会卡住。如果有足够的时间,玻璃仍然会非常缓慢地释放能量,但它们无序的原子使它成为一个缓慢而困难的过程。
低能量、稳定的眼镜或“理想眼镜”是研究人员渴望打开的知识库的钥匙。
为了理解并最终复制克服自身原子怪癖障碍的玻璃材料的条件,科学家们同时使用了实验和理论方法。
例如,实验室已经熔化并重新冷却化石琥珀,以开发工艺来重现数百万年来对低能量状态的玻璃追求所产生的令人鼓舞的影响。Crocker的团队隶属于跨学科的宾夕法尼亚计算科学研究所(PICS),他们使用数学模型探索物理结构。
“我们使用计算模型来模拟原子在不同玻璃中的位置和运动,”Thirumalaiswamy说。“为了跟踪材料的粒子,这些粒子数量众多且动态,无法在三个维度上可视化,我们需要在高维虚拟空间中以数学方式表示它们。例如,如果我们有300个原子,我们需要以900个维度来表示它们。我们称这些为能量景观。然后我们调查这些景观,几乎像探险家一样在它们中航行。”
在这些计算模型中,单个配置点、原子运动的摘要讲述了玻璃能级的故事。它们显示了玻璃卡住的位置以及可能达到低能量状态的位置。
问题是,直到现在,研究人员还无法有效地导航景观以找到这些罕见的稳定性实例。
“大多数研究都以巨大的计算成本在高维景观中随机行走。找到任何感兴趣的东西都需要无限的时间。景观是巨大的,这些行走是重复的,浪费了大量的时间固定在一个单一的在继续下一个之前的状态,”Riggleman说。
因此,他们抓住机会尝试元动力学,这种方法似乎注定要失败。
元动力学是一种算法策略,旨在探索整个景观并避免重复。它对两次回到同一个地方进行处罚。然而,元动力学从不适用于高维空间,因为构造惩罚花费的时间太长,抵消了该策略的效率潜力。
然而,当研究人员观察到他们的配置能量呈下降趋势时,他们意识到它已经成功了。
克罗克说:“我们无法猜到,但事实证明,这些峡谷的地面只有二维或三维的。”“我们的算法完全正确。我们发现在几种不同的眼镜中经常出现低能量配置,我们认为这种方法对其他学科也可能是革命性的。”
克罗克实验室峡谷的潜在应用范围很广。
在人类基因组计划完成其绘图后的二十年里,科学家们一直在使用计算模型将肽序列折叠成蛋白质。通过进化,在自然界中折叠良好的蛋白质已经找到了探索类似于理想眼镜的低能量状态的方法。
蛋白质的理论研究使用能量景观来了解为生物健康创造功能(或功能障碍)基础的折叠过程。然而,测量这些结构需要花费时间、金钱和精力,而科学家和他们旨在服务的人群却无暇顾及。由于玻璃材料研究人员面临同样的计算效率低下问题,基因组科学家可能会发现基于元动力学的方法取得了类似的成功,从而加快了医学研究的步伐。
机器学习过程与高维空间中的随机游走有很多共同点。训练人工智能需要大量的计算时间和能力,并且在预测准确性方面还有很长的路要走。
例如,神经网络需要“看到”成千上万张面孔,才能获得足够的面部识别技能。通过更具战略性的计算过程,机器学习可以变得更快、更便宜和更容易获得。元动力学算法可能有潜力克服对过程中典型的庞大且昂贵的数据集的需求。
这不仅可以为行业效率提供解决方案,还可以使AI民主化,让资源有限的人可以自己进行培训和开发。
“我们推测这些不同领域的景观具有与我们相似的几何结构,”克罗克说。“我们怀疑这些峡谷存在的原因可能有深刻的数学原因,它们可能存在于其他相关系统中。这是我们的邀请;我们期待着它开始的对话。”