A.I

오픈AI, 목소리 클론 AI ‘보이스 엔진’ 공개_어떻게 받아들어야 하나

오픈AI, 목소리 클론 AI ‘보이스 엔진’ 공개

챗GPT로 주목을 받아온 인공지능(AI) 기업 오픈AI가 이번에는 사람의 목소리를 그대로 복제할 수 있는 ‘보이스 엔진’을 선보였습니다. 보이스 엔진은 불과 15초 분량의 목소리 샘플만으로 원래의 목소리와 매우 유사한 음성을 생성해낼 수 있다고 하는데요. 오픈AI는 이 기술이 다양한 분야에서 혁신을 가져올 수 있을 것으로 기대하면서도, 오남용 가능성을 우려해 당장은 상용화 계획이 없다고 밝혔습니다. AI 음성 기술의 잠재력과 위험성에 대한 오픈AI의 고민이 엿보이는 대목입니다.

Screenshot
Screenshot

텍스트와 15초 음성 샘플로 목소리 클론 생성

오픈AI가 공개한 보이스 엔진은 매우 짧은 길이의 목소리 샘플만 있으면 이를 학습해 비슷한 음색과 말투의 음성을 만들어낼 수 있습니다. 블로그에 공개된 예시를 들어보면 원음과 거의 구분이 안 될 정도로 정교하게 구현된 것을 확인할 수 있는데요. 텍스트만 입력하면 마치 그 사람이 직접 말하는 것 같은 자연스러운 음성이 생성됩니다. 심지어 다른 언어로 말하는 것도 가능해 음성 번역에도 활용 가능할 전망입니다.

교육부터 의료까지…다양한 분야 활용 기대

오픈AI는 보이스 엔진이 여러 분야에서 긍정적인 변화를 가져올 수 있을 것으로 내다봤습니다. 어린이 교육용 오디오북 제작, 동영상 자막 번역, 장애인 보조기구 음성 고도화 등 다양한 활용 사례를 예로 들었는데요. 발달장애가 있는 자녀와 대화하는 부모의 음성을 학습해 언제든 자연스러운 목소리로 상호작용할 수 있게 하는 등 의료 분야에서도 혁신적 도구가 될 수 있을 것으로 기대를 모았습니다.

오남용 위험 우려…당장 출시는 보류

하지만 이런 잠재력에도 불구하고 오픈AI는 아직 보이스 엔진의 상용화 계획은 없다고 밝혔습니다. 특정인의 목소리를 그대로 복제하는 기술인 만큼 악용 소지가 있다는 점을 염두에 둔 것으로 보이는데요. 특히 선거를 앞둔 시점에서 정치인들의 목소리를 도용해 가짜뉴스를 만드는 등의 위험성도 제기됐습니다. 이에 오픈AI는 음성 워터마크를 통한 출처 추적, 유명인 목소리 생성 제한 등의 안전장치를 마련했다고는 하지만, 아직 충분치 않다고 판단한 모양입니다.

AI 목소리, 어떻게 맞이할 것인가

인공지능 기술이 빠르게 발전하면서 보이스 엔진과 같은 혁신적 도구들이 곧 우리 일상으로 들어올 전망입니다. 윤리적 딜레마와 사회적 파장에 대한 우려의 목소리도 있지만, 기술 발전을 멈출 수는 없는 노릇이겠죠. 오픈AI는 상용화를 유보하는 대신 정책 입안자, 연구자, 개발자들과 협력해 AI 음성 기술을 어떻게 발전시켜 나갈지 지혜를 모으겠다고 밝혔습니다. 잠재된 위험을 경계하면서도 기술 혁신이 가져올 긍정적 변화의 방향을 함께 고민해 나가야 할 때입니다.

IT note 의 한마디

1.인공지능 목소리 합성이 새로운건 아닙니다.

2.15초밖에 걸리지 않는다는게 대단합니다.

3.보이스피싱을 우려해서 인공지능의 목소리를 알아낼 수 있는 기술이 먼저 마련되어야 할 것 같습니다.

#오픈AI #보이스엔진 #AI음성 #음성클로닝 #AIEthics

댓글 남기기