‘3분’ 만에 한 곡 뚝딱…가요계 침투한 AI의 현재 [메이드 바이 음악AI①]

입력
기사원문
박정선 기자
본문 요약봇
성별
말하기 속도

이동 통신망을 이용하여 음성을 재생하면 별도의 데이터 통화료가 부과될 수 있습니다.

[데일리안 = 박정선 기자] “전 국민이 작곡하는 날 올 것”

ⓒ포자랩스 홈페이지
국내 유명 대중음악 작곡가 김형석의 말이다. 현재 생성형 AI가 만들어 내는 문화예술 콘텐츠를 매우 쉽게 접할 수 있는 가운데, 대중음악 시장도 이와 밀접한 관계에 놓여 있다는 것이다.

대중음악 시장의 변화는 기계와 인간이 공존하며 진행됐다. 초기에는 인간의 음악적 재능에 의존했다면, 지금은 기술과 인간의 창의력이 상호 보완적으로 작용하면서 발전하고 있다. 예컨대 디지털 녹음 기술의 등장으로 음악 제작과 편집이 이전보다 훨씬 쉬워진 것이 대표적이다.

기술 발전의 산물로 볼 수 있는 현재의 생성형 AI에 대해 대중음악계가 ‘위협적’이라고 느낀 이유는 앞서 언급한 ‘기계와 인간의 보완 관계’가 흔들리고 있기 때문이다. 과거 인간과 기계의 공존에서 늘 중요시된 것은 ‘인간 중심의 창작’이다. 이는 불변의 전제이고, 이 같은 상황에서 기계는 ‘보완 존재’일 뿐이었다.

그런데 생성형 AI가 만드는 음악은 기존에 있는 대량의 콘텐츠를 학습해 이를 통해 결과물을 만들어 내며, 두 존재의 위치가 달라졌다. 단순히 유명 가수의 목소리를 학습시킨 AI 커버곡이 나오는 걸 넘어 하나의 새로운 곡을 만들어 내기까지 3~5분이면 충분한 시대다.

이미 상황은 꽤 진행됐다. 시장분석업체 마켓닷어스에 따르면 세계 음악 생성 AI 시장 규모는 지난해 2억2900만달러(약 2900억원)에서 10년 뒤인 2032년 26억6000만달러(약 3조3800억원)로 11배 이상 성장할 전망이다.

국내 AI 작곡 기술 선구자는 AI기술기업 포자랩스와 같은 스타트업들이다. CJ ENM은 지난해 포자랩스와 손잡고 콘텐츠 제작에 필수적인 음원을 AI로 제작하고 활용할 수 있는 AI 음원 제공 서비스 ‘비오디오: CJ ENM 에어’를 공개했다. 단 5분이면 완성도 높은 음원을 만들어 내고, 편곡까지 가능하다. 이를 활용하면 드라마 등 콘텐츠 한 편당 약 100여개의 음원을 수급하기 위해 드는 시간과 비용을 줄일 수 있다는 분석이 나왔다.

지니리라의 '편곡 생성 기술' ⓒ지니리라
KT의 음원 플랫폼 자회사 지니뮤직도 지난해 AI스타트업 주스를 인수했다. 주스 역시 포자랩스처럼 AI편곡, AI 음원 기술을 보유한 업체다. 최근엔 AI 기반의 편곡 서비스 ‘지니리라’를 런칭했다. 현재는 AI 기반의 디지털 악보를 구현하고 편곡한 곡의 장르 전환, 편곡한 노래와 나의 목소리의 적합성 매칭 기술을 보유하고 있다.

향후에는 아티스트의 작품 생산도 지원할 계획이다. 예컨대 창작자들의 즉흥 연주를 악보로 변환하거나, 갑자기 떠오른 악상을 허밍으로 녹음했다가 추후 악보로 전환, 작업하는 식이다.

지니리라 관계자는 “현재 토치(torch)를 이용해 개발된 AI 모델을 활용해 자체 제작 웹 기반의 DAW를 이용해 작곡, 편곡을 할 수 있도록 시스템이 구축되어 있다”면서 “음원에서 멜로디와 화성, 리듬을 추출해 리드 악보와 미디를 생성하고 음원과 사용자 요구사항을 바탕으로 미디 기반의 반주(피아노, 기타, 드럼, 베이스, 효과음 등)를 만들어 내는데 이 모든 과정이 AI를 이용해 이뤄진다. 이후 웹 기반 가상 악기 기능을 이용한 미디를 기반으로 악기 소리를 생성하고, 웹 기반 Audio FX(EQ, 리버브, 리미터, 컴프레서)를 적용하여 상용 수준의 음원으로 생성하는 등 AI 기반 자동 믹싱, 마스터링 기능까지 탑재되어 있다”고 설명했다.

이처럼 AI가 하나의 곡을 만들기 위해서는 텍스트와 이미지를 입력하거나, 음악 파일이나 악보를 입력해서 만드는 식으로 진행된다. 곡의 주제를 입력하면 이를 이해하고 주제에 맞게 작곡과 작사를 한다. 또 새로운 무드, 텍스트, 영상을 입력하면 그에 맞는 음악을 만들어주기도 한다. 더해 간단한 음악 샘플링만 들려줘도 완전한 음악으로 만들어 내기도 한다. 지니리라처럼 기존의 음악을 들려주고 이를 새로운 형태로 변형하도록 요구할 수도 있다.

김형석 작곡가는 “사람의 감정을 움직이는 게 음악이다. 이걸 AI가 할 수 있을까 생각하면 이론적으로 가능하다. 음악도 수열이다. 그러니 얼마든지 가능할 거라고 생각한다”면서 “중요한 포인트는 숫자가 과연 어떤 진동을 통해서 사람에게 감동을 주냐다. 그날도 멀지 않은 거 같다. 작곡을 빨리한다는 게 좋은 작곡가라고 생각하지 않지만 AI 기술을 통해 아이디어를 얻을 때 많은 걸 확장시킬 수 있다”고 말했다.

기자 프로필

이 기사는 언론사에서 생활 섹션으로 분류했습니다.
기사 섹션 분류 안내

기사의 섹션 정보는 해당 언론사의 분류를 따르고 있습니다. 언론사는 개별 기사를 2개 이상 섹션으로 중복 분류할 수 있습니다.

닫기
이 기사를 추천합니다
3