学术科研

当前位置: 网站首页 > 学术科研 > 正文

【成果】信息与控制工程学院学子杨毅婷在国际顶级会议ICCV发表学术论文

发布时间: 2025-07-17 作者:来源: 信息与控制工程学院 点击:

建大新闻网讯    近日,我校信息与控制工程学院硕士研究生杨毅婷在国际顶级会议ICCV上发表题为“Efficient Adaptation of Pre-trained Vision Transformer underpinned by Approximately Orthogonal Fine-Tuning Strategy”(基于近似正交微调策略的预训练Vision Transformer高效适配)的学术论文。杨毅婷为论文第一作者,董玮副教授为通讯作者,西安建筑科技大学为第一完成单位。

在机器视觉领域,利用大规模预训练模型处理各类下游任务已成为主流研究范式之一。通过在大规模数据上进行模型预训练,获取丰富的先验知识,旨在提升下游任务的训练效率与性能。针对预训练Vision Transformer(ViTs)的参数高效微调(PEFT)方法,主流策略是通过学习低秩自适应矩阵以适配下游任务。

研究发现,主干网络参数中任意权重矩阵的行向量或列向量间具有近似正交性,而这一特性在下/上采样投影权重矩阵的向量中并不存在。近似正交性可降低模型泛化误差的上界,预示着更强的泛化能力。研究提出了一种新的 PEFT 方法:受奇异值分解(SVD)启发表征下/上采样投影矩阵,并仅通过单个向量及近似正交映射生成SVD中的酉矩阵,从而显著减少参数量。标准下游视觉任务上的大量实验验证了该方法优异的微调性能。

该研究得到了同济大学、电子科技大学、西北工业大学的支持,信息与控制工程学院本科生罗昊参与了相关研究工作。

ICCV,全称International Conference on Computer Vision(国际计算机视觉大会),是计算机视觉领域最具权威性和影响力的国际学术会议之一,与CVPR、ECCV并称“计算机视觉三大顶会”。

论文链接:

https://arxiv.org/abs/2507.13260

文字、图片:信息与控制工程学院

编辑:肖雯雯

建大要闻

影像建大

  • 官方微信

  • 官方微博