深圳商报·读创客户端首席记者吴吉 跟着国产AI DeepSeek崛起,“巧妙的东方力量”激勉了科技圈的鼎新。而近日,一篇在《洽商力学学报》上发表的最新商讨效果,将东谈主们的眼神再次引向了中国。科研团队开发的一种基于图形处理器(GPU)并行的快速近场能源学算法,只需使用平时的家用GPU,即可达成性能的大幅升迁,为处置传统洽商力学算法的效率问题找到了新的倡导。 该著述的第一完成单元是深圳北理莫斯科大学,作家为深圳北理莫斯科大学杨杨副磨真金不怕火、南边科技大学硕士商讨生苏梓鑫。1月31日,在接受深圳商报采访时,杨杨副磨真金不怕火走漏,这项效果的最大改进在于无须更换GPU,即可将洽商遵守“最大化”,从而为工业软件的中枢技巧国产化保驾护航。 跨学科联结催生新灵感 近场能源学是一种有用处置断裂问题的要领。然则,其非局部表面使得洽商历程较为耗时。并行洽商是加快数值洽商的有用道路,主要分为基于中央处理器(CPU)的并行洽商和GPU的并行洽商。其中,GPU并行洽商更允洽处理逻辑省略但洽研究大的场景。 当今,基于GPU的近场能源学并行商讨,大多荟萃在将串行门径调治为并行门径。许多优化战术带来的加快效果主要依赖于GPU自身性能的升迁,而针对GPU硬件结构的优化相对较少。此外,GPU并行洽商仍存在一些问题,举例在处理大范围问题时“心过剩力不及”、内存带宽蹧跶、一些算法仅能处理均匀分散且未受损的碎裂结构…… 针对这种情况,科研团队商讨缱绻了一个资本效益高且性能优异的近场能源学模拟框架。该分析框架能够以高效的洽商速度准确模拟键基和态基近场能源知识题。该算法接受了粒子并行花样,征战了一个通用的邻域生成模块用以优化存储,并建议了一种通用寄存器技巧,用于高速拜谒寄存器内存,减少全局内存拜谒。该技巧不仅舍弃了对邻域点数目的戒指,还适用于材料点的非均匀分散,不错大大升迁洽商的效率。 “这项商讨咱们花了大致两年的时候,之是以能取得豪迈,是因为咱们是一个交叉学科的团队”,杨杨说,她自己是商讨力学算法的,但团队里招收的硕士商讨生是商讨洽商机范围的,“他关于洽商机的架构很明晰。跨学科的联结与碰撞,使得咱们建议了一个全新的想路,也走出了不相似的路。” ![]() 通用寄存器优化算法暗示图 无需升级硬件,即可“榨干”算力 “洽商效率升迁800倍”,这么的刻画迥殊“捏眼球”,有东谈主致使说AI与之比拟齐小巫见大巫。但杨杨严谨地强调:“不要将它与AI比拟,两者不在一个架构下,不具备可比性。” 杨杨走漏,经过科学测试,与现存基于串行门径和OpenMP并行的近场能源学算法门径比拟,该算法分手可达成高达800倍和100倍的加快。在典型的百万级粒子模拟中,实行4000次迭代在单精度下可在5分钟内完成,在双精度下可在20分钟内完成,这在低端GPU PC上即可达成。这意味着,在处理复杂的材料缱绻和毁伤模拟时,商讨东谈主员能够更快地取得扫尾,从而加快科学商讨和工程应用的发展。 “咱们的上风是能够把英伟达显卡里的一些里面结构充分愚弄起来,通过对GPU里面寄存器显卡的读取,不需要更换更高档的显卡,即可达收效率的升级,”杨杨说,该效果不错减少对更高水平洽商机硬件的硬性需求,只需使用平时的家用GPU,就能够将蓝本需要数天才能完成的洽商任务缩小至几个小时,致使几分钟,但是“它跟AI处置问题的倡导是不相似的”。 杨杨走漏,在现存征战单卡的英伟达显卡下,“算力升迁800倍”已是现存算法的上限,不外这不料味着该项商讨不错画下句号。“咱们的商讨还有需要完善和迭代的地点,后续咱们也会连续将商讨深化下去,力图让它奇迹于更多推行场景。” 为中枢技巧国产化装上“加快器” 在科技界,有“得算力者得全国”的说法,这亦然深北莫该项商讨效果如斯令东谈主“心潮澎湃”的原因。 杨杨走漏,这项技巧的无为应用将有助于鼓动多个范围的改进,迥殊是在需要高性能洽商救济的行业中。通过愚弄耗尽级GPU的精深洽商才能,商讨东谈主员能够更高效地处置复杂的物理问题,从而鼓动科技跳跃和产业升级。 “当今,大部分企业应用的软件齐是国际的商用软件。更永远的改日,咱们但愿新算法不错匡助更多中国的企业研发我方的工业软件开云体育,从而辅助更多的开发场景。”杨杨走漏,据她所知,许多科研东谈主员和企业正在为工业软件的技巧自主而发奋,该算法有望助他们解衣衣人,为工业软件的中枢技巧国产化孝顺力量。 |