把指纹焊死在频率上：抗微调神经网络指纹的硬核方案来了_ai|人工智能

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

论文第一作者唐灵，张拳石老师课题组的博二学生。
今天要聊的是个硬核技术 —— 如何给神经网络刻上抹不掉的 \"身份证\" 。现在大模型抄袭纠纷不断，这事儿特别应景。
所谓神经网络指纹技术，是指使用神经网络内部如同人类指纹一样的特异性信息作为身份标识，用于判断模型的所有权和来源。传统方法都在玩 \"贴标签\"：往模型里塞各种人造指纹。但问题是，模型微调（fine-tuning）就像给整容 —— 参数一动， \"整张脸\" 就变了，指纹自然就糊了。
面对神经网络微调训练的威胁，现有方案都在修修补补，而我们上升到理论层面重新思考：神经网络是否先天存在某种对微调鲁棒的特征？如果存在，并将该固有特征作为网络指纹，那么无论对模型参数如何微调，该指纹就能始终保持不变。在这一视角下，前人的探索较为有限，没有从理论上证明出神经网络内部对微调天然鲁棒的特征。

论文地址：https://arxiv.org/pdf/2505.01007 论文标题：Towards the Resistance of Neural Network Watermarking to Fine-tuning方法介绍
这里我们发现了一个颠覆性事实：卷积核的某些频率成分根本不怕微调。就像给声波做 DNA 检测，我们把模型参数转换到频率域，找到了那些 \"焊死\" 在频谱上的特征点 —— 我们拓展了离散傅里叶变换，从而定义了神经网络一个卷积核所对应的频谱，并进一步证明：当输入特征仅包含低频成分时，卷积核的某些特定频率成分在微调过程中能够保持稳定。

实验
最后，我们开展了一系列实验，以评估所提出神经网络指纹方法对微调操作的鲁棒性。实验结果表明，相较于现有主流的模型指纹与模型溯源方法，在所有数据集和微调使用的学习率设置下，我们的方法在模型溯源任务中均取得了最优表现，尤其在高学习率条件下展现出显著优势。
【把指纹焊死在频率上：抗微调神经网络指纹的硬核方案来了】

把指纹焊死在频率上：抗微调神经网络指纹的硬核方案来了

推荐阅读

电脑升级换代主板和CPU的选择是关键电脑换了主板和cpu

苹果手机拍抖音不清晰怎么办

泥鳅可以清理鱼的粪便吗

下列不属于中国六大古都下列哪个不是中国六大古都

figaloo是什么型号 figaloo是啥型号

一念逍遥3月8日最新密令是什么一念逍遥2022年3月8日最新密令

抖音“唉呀妈呀脑瓜疼”是什么歌唉呀妈呀脑瓜疼出处介绍

绿豆汤怎么浓稠起沙

35岁的女孩有糖尿病，结婚后会影响生育吗?为什么?

575的刷机技术和教程

怎么查询有哪些可转债这样做就行了

卧龙吟红孙坚是是什么技能,《卧龙吟》新版将星降临

永康保温杯厂家排名，永康保温杯十大排名

遵义至龙洞堡国际机场高铁站，从合肥新桥机场到合肥高铁南站怎么走

哪些外语类期刊是匿名投稿,外语类期刊有哪些

微波炉烤花生米太硬怎么办