Google, 텍스트를 음악으로 변환하는 새로운 AI ‘MusicLM’ 공개

인공지능과 로봇이 등장할 무렵, 우리는 예술만큼은 인간 고유의 영역이라며 안일하게 안심하곤 했다. 그러나 텍스트를 입력하면 상상했던 이미지로 변환해주는 ‘DALL·E’, 미켈란젤로 급의 조각을 며칠 만에 뚝딱 만들어내는 ‘Chisel’ 등, 인간의 창작 능력을 가뿐히 뛰어넘는 기술이 속속들이 등장하는 시대가 왔다. 이번에는 뮤지션과 프로듀서가 긴장할 차례. 구글이 텍스트를 음악으로 변환하는 새로운 AI 툴, ‘MusicLM’을 개발했기 때문이다.

‘MusicLM’은 28만 시간의 음악을 학습하여 복잡다단한 음악을 생성한다. 이는 한 트랙당 5분으로 잡아도 336만 곡의 분량이다. 한 사람이 평생 동안 듣는 음악이 평균 130만 곡이라는 연구 결과와 비교해보면 ‘MusicLM’의 뮤직 라이브러리는 실로 어마어마한 숫자다.

“우주에서 길을 잃어버린 듯한 경험을 불러일으키는, 초자연적인 사운드를 지닌 레게톤과 일렉트로닉 댄스의 퓨전 음악”이라는 캡션으로 어떤 샘플이 나왔는지 확인해 보자.

https://twitter.com/ProductHunt/status/1619031717834272769

이전에도 음악을 창작하는 인공지능을 개발한 시도가 있었으나 제한된 데이터베이스와 기술의 부족으로 그 한계가 명확했다. 그러나 구글의 ‘MusicLM’는 “인상적인 색소폰 솔로 파트와 보컬을 지닌 황홀한 재즈”부터 “묵직한 베이스와 강렬한 킥을 지닌 90년대 베를린 테크노”까지, ‘상당한 복잡성(Significant Complexity)’을 지닌 음악을 생성할 수 있다.[1]

무의미한 영어 혹은 알아들을 수 없는 언어의 가사를 만들어내거나, 생성한 음악의 약 1%가 학습된 데이터에서 직접 복제되었음이 밝혀지는 등 ‘MusicLM’의 부족한 점 역시 존재한다. 이에 구글은 저작권과 윤리적 문제를 종합적으로 고려하여 현재로서는 ‘MusicLM’을 세상에 공개하지 않기로 결정했다. AI가 생성한 음악을 상업적으로 사용한다면 어디까지를 원본의 요소로 볼 것인지, 사례별로 저작권을 어떻게 적용할 것인지 법적으로 모호한 사각지대가 생기기 때문이다.

너무 이르게 찾아와 오히려 빛을 보지 못하게 된 ‘MusicLM’. 그러나 처음으로 제대로 된 음악을 생성할 수 있는 AI라는 점에서 큰 의미를 지닌다. 앞으로 이에 영향을 받은 후발주자들이 인간과 독자적으로, 혹은 인간과 어우러져 어떤 음악 세계를 펼쳐 나갈지 기대해보자.


이미지 출처 | Ummid, Logll

[1] MusicLM: Generating Music From Text, Cornell University에서 발췌한 표현.

RECOMMENDED POST