
한양대학교 (총장 이기정) 융합전자공학부 장준혁 교수팀이 지난 4월에 진행된 ‘국제 인공지능(AI) 신호처리 경진대회 (IEEE Signal Processing Cup)’에서 세계 유수의 178개 대학과의 경쟁에서 최종 준우승을 차지했다고 밝혔다.
해당 대회는 국제 전기·전자공학자협회 (IEEE)가 주관하며 1월부터 2월까지 온라인 예선을 거쳐 상위 3개의 팀을 선정한 뒤, 세계적 권위의 신호처리 AI 학회인 ‘IEEE ICASSP (IEEE International Conference on Acoustics, Speech, and Signal Processing)’에서 발표를 통해 최종 순위를 결정하게 된다.
2014년부터 이어져 11주년을 맞이한 이번 대회는 세계적 컴퓨팅 소프트웨어 개발 업체인 매스웍스 (MathWorks)의 후원을 받아 전 세계의 대학생·대학원생들의 AI기술 저변확대를 목표로 진행됐다.
이번 대회는 ‘모바일 로봇을 통해 원거리 화자인식 기술 (RoboVox: Far-field speaker recognition by a mobile robot)’이라는 주제로 개최됐으며, 178개의 팀이 참가했다. 화자인식 기술은 입력받은 음성 데이터에서 화자의 고유한 음성 특성을 추출 및 분석하여 화자가 누구인가를 알아내는 기술이다. 이번 대회는 로봇청소기와 같이 방에서 움직이는 로봇을 설계한 뒤 로봇을 움직이며 프랑스어를 녹음하여 참가팀들에 제공했다. 제공된 음성에는 실내 환경에서 발생할 수 있는 잡음, 잔향이 포함되어 화자를 식별하는데 어려움이 발생하게 된다.
장준혁 교수의 지도를 받은 최정환 박사과정생과 김가은, 김현수, 안세윤, 이희재 석사과정생으로 구성된 청소년 토토사이트 추천 연구팀은 삼성전자(주) 산하 삼성리서치의 산학과제 지원을 받아 이번 대회에 참가했다.
장 교수팀은 전이 학습을 활용한 화자인식 모델 개발과 학습가능한 화자인식 점수 정규화 방법을 제안하며 독창적인 AI 기술을 선보였다. 세부적으로, 다국어 음성 데이터를 확보하여 범용적으로 활용할 수 있는 사전학습 화자인식 모델을 개발하고 대회에서 제공된 음성을 분석하여 원거리에서 녹음된 프랑스 음성에 맞게 화자인식 모델을 Fine-tuning 했다. 이후 낮은 화자인식 오류율을 달성할 수 있도록 화자 인식모델에서 얻을 수 있는 점수를 정규화하는 방법을 제안 및 적용했다.
독창적인 기술을 인정받아 최종 준우승을 차지한 한양대 연구팀은 “삼성리서치와 몇 년 동안 진행하고 있는 음성 연구와 화자인식에 대한 산학협력 과제연구 경험 덕분에 준우승을 수상하게 됐다”며 “앞으로도 삼성리서치와 긴밀한 협력을 통해 AI 기반 화자인식 기술을 실용화하고, 글로벌 AI 기술경쟁에서 지속적인 우위를 점할 수 있도록 노력하겠다”고 소감을 전했다.

관련기사
키워드
