Ngay cả người khiếm thính cũng có thể hát như một ngôi sao K-Pop
Sẽ thế nào nếu bất kỳ ai, bất kể khả năng ca hát của họ ra sao, cũng có thể hát giống như một thần tượng K-pop tài năng—như G-Dragon hay IU?
Tầm nhìn đó đang trở thành hiện thực nhờ Supertone, một công ty AI của Hàn Quốc đang có những bước tiến lớn trong việc thay đổi cách chuyển đổi giọng nói.
Với AI, nghệ sĩ không cần giọng hát tự nhiên hoàn hảo nữa để sáng tác nên những bài hát tuyệt vời.
Supertone, một công ty khởi nghiệp đến từ Hàn Quốc, đang dẫn đầu sự thay đổi này bằng công nghệ có thể biến bất kỳ giọng nói nào thành phong cách K-pop hoàn hảo.
Tại hội nghị Fortune Brainstorm AI gần đây ở Singapore, người sáng lập Supertone, Kyogu Lee, đã trình diễn cách các công cụ AI của ông biến các bản ghi âm giọng hát đơn giản thành những màn trình diễn phong phú, du dương với chiều sâu cảm xúc — ngay cả với những người không có kinh nghiệm ca hát.
Kyogu Lee (trái) đang phát biểu về Supertone trên sân khấu tại hội nghị AI Fortune Brainstorm.
Cách Supertone tạo ra giọng nói độc đáo từ bất kỳ bản ghi âm nào
Phương pháp của Supertone chia giọng nói thành bốn yếu tố chính: cao độ, độ to, âm sắc và nội dung ngôn ngữ.
Lee mô tả âm sắc là “bản sắc giọng nói” riêng biệt của mỗi người.
Bằng cách tách âm sắc và điều chỉnh các đặc điểm khác, Supertone có thể tạo ra những giọng hát hoàn toàn mới nhưng vẫn giữ được âm thanh đặc trưng của từng cá nhân.
Điều này có nghĩa là bất kỳ ai cũng có thể thử nghiệm những phong cách hát mà họ chưa bao giờ nghĩ là có thể.
Lee đã chứng minh điều này bằng cách biến một giai điệu đều đều thành một bản nhạc theo phong cách K-pop sôi động, làm nổi bật khả năng thêm phong cách và cảm xúc của công cụ này.
Tác động của AI đến sản xuất âm nhạc
Trước khi có công nghệ này, các nhà sản xuất phải tìm kiếm những ca sĩ có chất giọng phù hợp với một phong cách cụ thể.
Hiện nay, Supertone cho phép thiết kế những giọng nói độc đáo ngay từ đầu, giảm sự phụ thuộc vào người biểu diễn.
Tuy nhiên, Lee nhấn mạnh rằng mục tiêu là hợp tác chứ không phải thay thế.
“Chúng tôi coi người sáng tạo và nghệ sĩ là những người đồng sáng tạo.”
Công ty hợp tác chặt chẽ với các nghệ sĩ để cải tiến công nghệ, giúp họ khám phá những thể loại hoặc phong cách mới vượt ra ngoài phạm vi giọng hát tự nhiên của họ.
Được hỗ trợ bởi HYBE và Powering AI Idols
Sự phát triển nhanh chóng của Supertone gắn liền chặt chẽ với mối quan hệ đối tác với HYBE, công ty giải trí đứng sau hiện tượng toàn cầu BTS.
HYBE đã đầu tư 3,6 triệu đô la vào năm 2021 và sau đó mua lại toàn bộ Supertone với giá 32 triệu đô la vào năm 2023.
Sự tích hợp này đã dẫn đến các dự án như MIDNATT, nghệ sĩ hỗ trợ AI của HYBE, sử dụng công nghệ của Supertone để sản xuất các bài hát đa ngôn ngữ có giọng hát của ca sĩ Lee Hyun.
Việc mua lại này đánh dấu sự đặt cược nghiêm túc vào vai trò của AI trong tương lai của âm nhạc.
Chuyển đổi giọng nói thời gian thực và phạm vi tiếp cận rộng hơn
Tại hội nghị, Lee đã chứng minh cách công cụ tổng hợp giọng nói của Supertone có thể biến bài đọc đơn điệu của một tình nguyện viên thành một bản nhạc hài hòa, giàu cảm xúc khi biểu diễn trực tiếp trên sân khấu.
Quá trình xử lý thời gian thực như vậy không chỉ khiến các nhà sản xuất phấn khích mà còn có thể giúp việc sáng tạo âm nhạc dễ tiếp cận hơn trên toàn thế giới.
Khả năng sản xuất các bài hát đa ngôn ngữ liền mạch có thể định hình lại thị trường toàn cầu, cho phép nghệ sĩ tiếp cận khán giả mà không gặp rào cản ngôn ngữ.
Mối quan tâm và câu hỏi đạo đức xung quanh giọng nói tổng hợp
Sự phát triển của giọng hát tổng hợp đặt ra câu hỏi về tính xác thực và vai trò tương lai của ca sĩ con người.
Một số người hâm mộ và người trong ngành lo ngại AI sẽ thay thế ca sĩ, trong khi những người khác lại ủng hộ sự tự do sáng tạo mà các công cụ này mang lại.
Lee thừa nhận những lo ngại này và nhấn mạnh việc sử dụng có đạo đức.
Trong một cuộc phỏng vấn gần đây, ông nhấn mạnh sự đồng thuận và minh bạch là những nguyên tắc cốt lõi.
Liệu AI có thay đổi linh hồn của âm nhạc không?
Khi Supertone tiếp tục phát triển các công cụ AI mới để sáng tác nhạc hoàn chỉnh, ranh giới giữa khả năng sáng tạo của con người và máy móc ngày càng mờ nhạt.
Với sự hậu thuẫn của các công ty giải trí lớn và mở rộng sang các thị trường ngoài Hàn Quốc, công ty này đang có ảnh hưởng đến cách thức sáng tác và tiêu thụ âm nhạc trên toàn thế giới.
Tuy nhiên, khi giọng nói tổng hợp trở nên phổ biến hơn, ngành công nghiệp này phải đối mặt với những câu hỏi về tính toàn vẹn nghệ thuật và định nghĩa về tài năng.
Tương lai của âm nhạc có phải là nơi AI nâng cao khả năng sáng tạo của con người, hay là nơi nó có nguy cơ thay thế tâm hồn - yếu tố tạo nên âm nhạc thực sự mang tính nhân văn?