기존 동형토토사이트 공지 기반 행렬곱 방식에 비해 10배 이상 빠른 속도
의료·금융 등 개인정보 보호 핵심 산업에 폭넓은 적용 기대
“토토사이트 공지화된 상태에서도 추론 가능”, 기업 도입 필요성 강조

김미란 수학과 교수 연구팀이 개인정보 유출 없이도 대규모 언어모델(LLM, Large Language Model)을 안전하게 추론할 수 있는 새로운 보안 기술을 개발했다. 

 

▲ 개인정보 보호형 대규모 언어모델(LLM) 추론 기술을 개발한 김미란 수학과 교수의 모습. ⓒ 김미란 교수
▲ 개인정보 보호형 대규모 언어모델(LLM) 추론 기술을 개발한 김미란 수학과 교수의 모습. ⓒ 김미란 교수

김 교수는 “최근 Chat GPT와 같은 LLM 활용 서비스가 급속히 확산하면서 개인정보를 보호하면서 안정적으로 모델을 운영할 수 있는 암호 기술의 필요성이 커지고 있다”며 “이번 연구는 보안 문제를 해결하고 성능을 개선하는 것을 목표로 했다”고 말했다. 

 

'행렬 대각선 암호화'로 기존 동형암호 기술의 한계 극복 

기존 동형암호(Homomorphic Encryption) 기반 기술은 대규모 행렬 연산의 비효율성, 모델 구조 변경 및 재학습의 필요성 등으로 서비스에 적용하기 어렵다는 한계가 있었다. 연구팀은 이 한계를 극복하기 위해 행렬을 대각선 방향으로 암호화하고, 하나의 암호문에 여러 데이터를 저장할 수 있는 패킹(packing) 기술을 접목한 새로운 연산 방식을 개발했다. 

김 교수는 “행렬의 대각선을 암호문에 저장하고 덧셈·곱셈·회전 연산을 조합해 효율적인 행렬 연산을 구현했다”며 “이를 통해 암호화된 상태에서도 복잡한 연산을 빠르게 처리할 수 있도록 했다”고 설명했다. 이는 2018년 김 교수 연구팀이 개발한 기존 동형암호 기반 행렬곱 방식보다 10배 이상 빠른 속도를 보였다. 

연구팀은 개발된 알고리즘을 LLM 추론 과정에 적용해 별도의 재학습 없이도 동형암호 환경에서 모델을 실행할 수 있는 프레임워크를 구축했다. BERT-base 모델(약 1억 1천만 개의 파라미터)을 대상으로 실험한 결과, 단일 GPU 환경에서 약 10분 내 추론 완료가 가능했다.  

김 교수는 “기존 NEXUS 방식이 BERT-base 모델 추론에 약 2.7시간이 걸렸던 반면 이번 기술은 10분 내에 추론을 완료했다”며 “이는 약 16배 이상의 성능 향상을 달성한 결과다“고 강조했다. 그는 “병렬 행렬 연산이 필요한 멀티헤드 어텐션 층에서 비효율적이었던 기존 연구의 한계를 개선해, 반복 연산 시 추가 변환 없이 다음 연산으로 바로 이어질 수 있는 알고리즘을 제안했다”고 설명했다. 

 

▲ 지난 16일 김 교수가 ACM Conference on Computer and Communications Security에서 논문 발표를 진행했다. ⓒ 김미란 교수
▲ 지난 16일 김 교수가 ACM Conference on Computer and Communications Security에서 논문 발표를 진행했다. ⓒ 김미란 교수

해당 논문은 기술의 독창성과 우수성을 인정받아 전 세계 보안 분야 최고 권위 학술대회 'ACM Conference on Computer and Communications Security(ACM CCS 2025)'에서 발표됐다. 또한 한국암호포럼이 주관하고 국가정보원이 후원하는 ‘2025년 국가암호공모전’에서 대상을 받았다. 

 

개인정보 유출 문제의 근본적 해결 

김 교수가 개발한 기술은 의료, 금융, 공공 데이터 등 개인정보 보호가 필수적인 산업 분야에서 폭넓게 활용될 것으로 기대된다. 김 교수는 “클라우드 기반 LLM 서비스를 이용할 때는 개인 데이터를 제공해야 한다"며 "이번 기술을 적용하면 개인정보가 암호화된 상태에서도 안전하게 추론을 수행할 수 있다”고 말했다. 

최근 잇따른 대규모 개인정보 유출 사건과 관련해 그는 “가장 큰 원인은 기업들의 안일한 데이터 관리에 있다”며 “데이터 저장 시 단순히 암호화하는 수준을 넘어 암호화된 상태에서도 연산이 가능한 기술을 반드시 도입해야 한다“고 강조했다. 이를 통해 개인정보를 복호화하지 않고도 안전한 서비스를 제공할 수 있다. 김 교수는 “이번 연구가 기술적 기반을 마련해 개인정보 유출 문제를 근본적으로 해결할 것이다”고 전망했다. 

 

▲ 김 교수 연구팀은 클라우드 기반 개인 맞춤형 서비스에서도 안전한 환경을 구현하기 위해 연구를 이어가고 있다. ⓒ 김미란 교수
▲ 김 교수 연구팀은 클라우드 기반 개인 맞춤형 서비스에서도 안전한 환경을 구현하기 위해 연구를 이어가고 있다. ⓒ 김미란 교수

연구팀은 현재 BERT-Large(약 3억 4천만 개의 파라미터)나 Meta의 라마(LLaMA, 대규모 언어 모델 메타 AI) 등과 같은 더욱 큰 크기의 대규모 모델에서도 효율적인 추론이 가능하도록 기술을 확장하는 연구를 진행 중이다. 김 교수는 “장기적으로는 학습 단계에서도 동형암호 기반 연산을 적용할 수 있는 방법을 탐구하고 있다”고 밝혔다. 

삼성 갤럭시의 ‘생성형 사진 편집(Generative Photo Edit)’과 같은 기능은 클라우드 환경에서 실행되며 사용자가 네트워크를 통해 사진을 업로드하면 포토 어시스트(Photo Assist)의 생성형 편집 기능이 적용된다. 이러한 서비스 구조에서는 데이터가 외부 서버를 거치기 때문에 개인정보 보호가 강화된 AI 기술의 구축이 필수적이다. 이에 김 교수 연구팀은 LLM 기술을 확장해 클라우드 기반 개인 맞춤형 서비스에서도 개인정보를 안전하게 보호하는 기술 개발에 더 집중할 계획이다. 

관련기사

저작권자 © 토토사이트 무단전재 및 재배포 금지