汉阳大学校 数学专业 金美兰 教授于30日宣布,开发了在防止个人信息泄露的同时也能安全执行强化学习(Reinforcement Learning)的“基于同态加密的安全技术”。
随着人工智能技术近期迅速扩散至医疗·金融·自动系统等处理敏感数据的领域,不仅在模型推理阶段,而且在深度学习学习过程整体中,能够保障数据机密性的安全技术的重要性正在提升。然而,现有安全技术因学习过程中产生的运算负担与数值不稳定性,在实际深度学习学习中适用存在局限。
尤其是,强化win 토토사이트是状态(state)、行动(action)、奖励(reward)信息的反复累积、神经网络参数持续更新的结构,win 토토사이트过程本身一直被指出是个人信息泄露的潜在风险要素。尽管如此,现有基于同态加密的方法由于高运算成本,难以有效适用于强化win 토토사이트等反复win 토토사이트环境。
金教授研究团队为了解决上述问题,提出了能够在加密状态下直接执行基于深度win 토토사이트的强化win 토토사이트win 토토사이트全过程的新框架。研究团队利用了密文打包运算结构与多项式近似技法,设计了在同态加密环境中也能够进行神经网络的前向传播及反向传播的运算。此外,为了改进在现有同态加密环境中难以实现的优化过程,将深度win 토토사이트win 토토사이트中广泛使用的 Adam 优化算法按照加密环境进行重构。
由此有效减少了因高阶非线性运算导致的计算瓶颈与学习不稳定性,并基于 Soft Actor-Critic(SAC)的强化学习算法为对象,成功在加密状态下执行包括模型参数更新在内的学习全阶段。在该框架中不仅状态·行动·奖励信息·学习过程中生成的中间结果亦在无需解密的情况下由外部运算服务器处理。
研究团队为了验证所提框架的实效性,在加密环境中进行了强化win 토토사이트实验,其结果显示,加密的基于深度win 토토사이트的强化win 토토사이트与非加密环境相比,在将性能下降维持在 10% 以内的同时,确保了稳定的win 토토사이트收敛特性。
金教授表示:“本研究展示了同态加密技术不仅用于人工智能推理阶段的保护,还能够安全地应用于深度学习模型的实际训练过程。在涉及敏感数据的人工智能服务中,该技术有望作为一种可靠的学习基础设施加以应用。”
此次研究在韩国研究财团(NRF)与美国国立卫生研究院(NIH)的支持下进行,并发表于人工智能领域国际学术期刊《Nature Machine Intelligence(IF 23.9)》于去年12月1日刊登。
该论文《Empowering artificial intelligence with homomorphic encryption for secure deep reinforcement learning》,由University of Technology Sydney 的 Chi-Hieu Nguyen 博士课程研究员作为第一作者,Thai Hoang Dinh 教授、Diep N.Nguyen 教授、FAIR Labs North America 的 Senior Director Kristin Lauter 博士、汉阳大学 金美兰教授作为通讯作者参与。

'한양위키' 키워드 보기