全球数字化进程的加速伴随着数据主体信息失控现象日益显著。国内外数据安全相关法律相继出台,其中遗忘权(the Right to Be Forgotten)强调了数据主体拥有从数据使用方撤回其数据的权利。模型遗忘(Machine Unlearning)是机器学习领域践...全球数字化进程的加速伴随着数据主体信息失控现象日益显著。国内外数据安全相关法律相继出台,其中遗忘权(the Right to Be Forgotten)强调了数据主体拥有从数据使用方撤回其数据的权利。模型遗忘(Machine Unlearning)是机器学习领域践行遗忘权的技术,允许模型拥有方(即数据使用方)从已训练的模型中遗忘原本训练数据的指定数据,以满足数据拥有方撤回其数据的需求。现有针对模型遗忘效果的验证方法通常假设存在一个从未使用过被遗忘数据的基准模型,并通过测量遗忘后模型和基准模型的参数分布或输出分布是否足够相似来完成验证。然而,在恶意攻击场景下,模型拥有方容易伪造遗忘后模型的参数和输出分布,且模型参数通常难以归因于特定的训练数据,导致验证方难以有效验证目标模型是否遗忘其数据。本文提出了一种新的公开可验证模型遗忘方案,该方案在数据拥有方和模型拥有方之间执行,并在模型拥有方出现恶意行为时,数据拥有方能够生成任意第三方可验证的不可否认凭证。具体地,数据拥有方先利用动态通用累加器来认证被授权使用的数据或删除不被授权使用的数据;随后,模型拥有方在公开可验证隐蔽模型下证明模型训练使用了被累加数据或没有使用不被累加数据;最后,数据拥有方验证证明的有效性,若发现模型拥有方使用了未授权数据,则其生成公开可验证的凭证来追责模型拥有方的不合法行为。实验评估了不同数据量下证明和验证的计算开销,同时评估了不同数据点删除对模型预测结果的影响。展开更多
为了挖掘多模态信息潜在的同构语义关系,并学习更好的项目表示,提出一种语义图增强多模态推荐(SGEMR)算法。首先,利用辅助的多模态信息补充历史的用户-项目交互,捕捉用户在不同模态下的偏好;然后,基于度量学习将松散的项目序列重新构建...为了挖掘多模态信息潜在的同构语义关系,并学习更好的项目表示,提出一种语义图增强多模态推荐(SGEMR)算法。首先,利用辅助的多模态信息补充历史的用户-项目交互,捕捉用户在不同模态下的偏好;然后,基于度量学习将松散的项目序列重新构建为紧密的项目-项目语义图,并设计一个语义层级注意力机制,融合项目的多模态信息;同时,提出一个图重构损失函数,使项目表示保留更多的语义关系,从而提高推荐性能。实验结果表明,在3个真实的数据集上与最优基线算法FREEDOM(FREEzes the item-item graph and DenOises the user-item interaction graph simultaneously for Multimodal recommendation)相比,所提算法的Recall@10分别提升了6.70%、11.30%、5.09%,NDCG@10分别提升了9.09%、12.73%、7.62%,并通过多个消融实验,验证了所提算法的有效性。展开更多
文摘全球数字化进程的加速伴随着数据主体信息失控现象日益显著。国内外数据安全相关法律相继出台,其中遗忘权(the Right to Be Forgotten)强调了数据主体拥有从数据使用方撤回其数据的权利。模型遗忘(Machine Unlearning)是机器学习领域践行遗忘权的技术,允许模型拥有方(即数据使用方)从已训练的模型中遗忘原本训练数据的指定数据,以满足数据拥有方撤回其数据的需求。现有针对模型遗忘效果的验证方法通常假设存在一个从未使用过被遗忘数据的基准模型,并通过测量遗忘后模型和基准模型的参数分布或输出分布是否足够相似来完成验证。然而,在恶意攻击场景下,模型拥有方容易伪造遗忘后模型的参数和输出分布,且模型参数通常难以归因于特定的训练数据,导致验证方难以有效验证目标模型是否遗忘其数据。本文提出了一种新的公开可验证模型遗忘方案,该方案在数据拥有方和模型拥有方之间执行,并在模型拥有方出现恶意行为时,数据拥有方能够生成任意第三方可验证的不可否认凭证。具体地,数据拥有方先利用动态通用累加器来认证被授权使用的数据或删除不被授权使用的数据;随后,模型拥有方在公开可验证隐蔽模型下证明模型训练使用了被累加数据或没有使用不被累加数据;最后,数据拥有方验证证明的有效性,若发现模型拥有方使用了未授权数据,则其生成公开可验证的凭证来追责模型拥有方的不合法行为。实验评估了不同数据量下证明和验证的计算开销,同时评估了不同数据点删除对模型预测结果的影响。
文摘为了挖掘多模态信息潜在的同构语义关系,并学习更好的项目表示,提出一种语义图增强多模态推荐(SGEMR)算法。首先,利用辅助的多模态信息补充历史的用户-项目交互,捕捉用户在不同模态下的偏好;然后,基于度量学习将松散的项目序列重新构建为紧密的项目-项目语义图,并设计一个语义层级注意力机制,融合项目的多模态信息;同时,提出一个图重构损失函数,使项目表示保留更多的语义关系,从而提高推荐性能。实验结果表明,在3个真实的数据集上与最优基线算法FREEDOM(FREEzes the item-item graph and DenOises the user-item interaction graph simultaneously for Multimodal recommendation)相比,所提算法的Recall@10分别提升了6.70%、11.30%、5.09%,NDCG@10分别提升了9.09%、12.73%、7.62%,并通过多个消融实验,验证了所提算法的有效性。