凤凰联盟·(中国区)-四川大学研制“鲁班

2025-10-01 12:57:22

科技日报记者 刘侠

近日,记者从四川年夜学获悉,该校计较机学院吕建成传授研究团队经由过程网络海量工业数据,立异年夜模子留意力机制,研制首个工艺设计年夜模子——“鲁班-10B”,于试验中揭示出更高的工艺天生质量,有望提高我国制造业现有工艺体例效率,揭示出人工智能赋能进步前辈制造的广漠远景。

据悉,跟着通用年夜模子于天然语言处置惩罚范畴的快速成长,其于文本天生、问答体系及语言理解等使命中已经取患上显著结果。然而,于工艺设计等高度专业化的工程运用场景中,现有年夜模子的合用性仍面对诸多挑战。

本年5月,吕建成传授研究团队于《四川年夜学学报(天然科学版)》发表学术论文《面向工艺设计的范畴年夜模子构建要领》,体系性地论述工艺设计范畴垂直年夜模子的构建及练习要领。

文章指出,工艺设计范畴的文本天生使命面对两重挑战。一方面,工艺设计文本专业术语密集、流程描写冗长,传统留意力机制于处置惩罚长文本时,计较效率低下,且全局语义轻易呈现掉稳环境,难以精准捕获文本焦点信息。另外一方面,通用年夜语言模子依靠年夜范围标注数据举行练习,而工艺设计范畴的数据具备怪异性,与通用年夜语言模子的练习范式存于显著差异,这使患上通用模子难以直接适配工艺设计需求。

为此,该研究团队提出“混淆稀少留意力机制”,经由过程动态筛选要害标识符、锁定肇始标识符权重,有用压缩了非焦点语义的计较承担,把自留意力机制原本需要两两对于比(N²级别)的计较方式,优化成只需要线性级别(N的倍数)的计较量,于降低资源耗损的同时晋升了模子对于长文本的天生不变性。

“今朝,‘鲁班-10B’工艺年夜模子体系已经于多家制造企业中被现实利用。该年夜模子的立异实践注解,针对于特定场景的数据特性与使命需求设计专用模子架构,或者将成为冲破行业瓶颈的要害。”吕建成暗示。

-凤凰联盟·(中国区)

分享