Nvidia ra mắt công nghệ AI sửa giọng nói
Công nghệ mới nhất của Nvidia này bao gồm cả những âm thanh mới lạ. Ảnh: Nvidia
Công nghệ mới của Nvidia có tên Fugatto (viết tắt từ Foundational Generative Audio Transformer Opus 1). Từ Fugatto cùng với các công nghệ khác, các công ty khởi nghiệp như Runway và các công ty lớn hơn như Meta Platforms có thể tạo âm thanh hoặc video từ lời nhắc văn bản.
Tạo ra hiệu ứng âm thanh và âm nhạc từ mô tả văn bản, công nghệ mới nhất của Nvidia này bao gồm cả những âm thanh mới lạ, chẳng hạn như biến âm thanh của một cây kèn trumpet thành tiếng như chó sủa.
Điều khiến cho Fugatto khác biệt so với các công nghệ A.I khác là khả năng tiếp nhận và sửa đổi âm thanh hiện có như có thể biến một đoạn nhạc chơi trên piano thành giọng hát của con người, hoặc chuyển đổi giọng nói đã ghi âm với giọng điệu và cảm xúc khác biệt.
Ông Bryan Catanzaro, Phó Chủ tịch nghiên cứu của Nvidia tuyên bố rằng A.I có tính sáng tạo sẽ mang lại những khả năng mới cho âm nhạc, trò chơi điện tử và cho những người bình thường muốn sáng tạo mọi thứ.
Trong khi các công ty như OpenAI đang đàm phán với các hãng phim Hollywood về việc liệu A.I có thể được sử dụng trong ngành giải trí hay không và bằng cách nào, mối quan hệ giữa ngành công nghệ và Hollywood đã trở nên căng thẳng, đặc biệt sau khi ngôi sao Hollywood Scarlett Johansson cáo buộc OpenAI bắt chước giọng nói của cô.
Mô hình mới của Nvidia đã được đào tạo về dữ liệu nguồn mở và tập đoàn cho biết vẫn đang tranh luận về việc liệu có nên phát hành một cách hay không và bằng cách nào.
Theo ông Catanzaro, bất kỳ công nghệ tạo sinh nào cũng luôn tiềm ẩn rủi ro. Đó là nguyên nhân vì sao Nvidia chưa có kế hoạch ngay lập tức phát hành công nghệ mới.
Có thể bạn quan tâm:
A.I và thách thức chuyển đổi công bằng cho lao động châu Á
Nguồn Theo Reuters
Cập nhật tin Đầu Tư, Bất Động Sản, tin nhanh kinh tế chứng khoán, kiến thức Doanh Nghiệp tại Fanpage.
Theo dõi Nhịp Cầu Đầu Tư
Tin cùng chuyên mục
-
Trọng Hoàng
-
Trực Thanh