,

,

, ,
    ,
      ,
    1. , , , , , ,
      ,
      Giữ nguyên các thẻ này như cũ. Hãy chuyển đổi đoạn văn sau sang tiếng Việt thông qua cách diễn đạt đúng và chuẩn chứ không nên dịch nguyên văn từng từ một. Hãy tuân thủ các hướng dẫn sau:

      Hướng dẫn:

      1. Sử dụng tiếng Việt trôi chảy, tự nhiên và đảm bảo dịch đúng ngữ pháp theo quy tắc tiếng Việt chuẩn.

      2. Giữ nguyên cấu trúc và định dạng của bài viết gốc, bao gồm tiêu đề phụ, định dạng văn bản, và các dòng trống và đoạn trống.

      3. Giữ nguyên tất cả dấu câu và các ký hiệu đặc biệt được sử dụng trong bài viết ở vị trí ban đầu của chúng.

      4. Bản dịch phải truyền đạt chính xác nghĩa và ý định của văn bản gốc, thay vì chỉ là một bản dịch từng từ. Tuy nhiên, bản dịch vẫn cần tuân thủ càng gần càng tốt văn bản gốc mà không làm mất đi sự rõ ràng và biểu đạt tự nhiên trong tiếng Việt.

      Đoạn văn: " Hãy tưởng tượng bạn gõ "nhạc mở đầu mang tác động" và nghe một bản giao hưởng trầm bổng hoặc viết "tiếng bước chân đáng sợ" và nhận được hiệu ứng âm thanh chất lượng cao. Đó là lời hứa từ Stable Audio, một mô hình trí tuệ nhân tạo chuyển từ văn bản thành âm thanh được công bố vào thứ Tư bởi Stability AI có khả năng tổng hợp nhạc hoặc âm thanh từ các mô tả viết. Chẳng bao lâu nữa, công nghệ tương tự có thể cạnh tranh với các nghệ sĩ âm nhạc về công việc của họ.

      Nếu bạn nhớ, Stability AI là công ty đã sử trợ tiền để tạo ra Stable Diffusion, một mô hình tổng hợp hình ảnh qua truyền bit tiềm tàng được ra mắt vào tháng Tám năm 2022. Không chỉ hài lòng trong việc tổng hợp hình ảnh, công ty đã mở rộng sang âm thanh bằng việc tài trợ cho Harmonai, một phòng thí nghiệm trí tuệ nhân tạo đã ra mắt trình tạo nhạc Dance Diffusion vào tháng Chín.

      Giờ đây, Stability và Harmonai muốn thâm nhập vào sản xuất âm thanh trí tuệ nhân tạo thương mại với Stable Audio. Nhìn vào các mẫu sản xuất, có vẻ như đây là một bản nâng cấp chất lượng âm thanh đáng kể so với các trình tạo âm thanh trí tuệ nhân tạo trước đây chúng ta đã thấy.

      Trên trang quảng cáo của mình, Stability cung cấp các ví dụ về mô hình trí tuệ nhân tạo trong quá trình hoạt động với các gợi ý như "nhạc trailer trầm bổng với tiếng trống và tiếng đồng môn" và "nhịp đập hip hop chillhop 85 bpm." Nó cũng cung cấp các mẫu hiệu ứng âm thanh được tạo bằng Stable Audio, chẳng hạn như tiếng phi công nói qua loa và tiếng người nói chuyện trong một nhà hàng đông đúc.

      Để huấn luyện mô hình của mình, Stability đã hợp tác với nhà cung cấp nhạc đồng bộ AudioSparx và cấp phép một tập dữ liệu "bao gồm hơn 800.000 tệp âm thanh chứa âm nhạc, hiệu ứng âm thanh và các nhạc cụ đơn, cùng với siêu dữ liệu văn bản tương ứng." Sau khi cung cấp 19.500 giờ âm thanh cho mô hình, Stable Audio đã biết cách bắt chước một số âm thanh cụ thể mà nó đã nghe qua lệnh bởi vì âm thanh đã được liên kết với các mô tả văn bản về chúng trong mạng thần kinh của mô hình.

      Phóng to / Bảng mô tả kiến trúc Stable Audio được cung cấp bởi Stability AI. Stable Audio bao gồm nhiều phần hợp tác nhau để tạo ra âm thanh được tùy chỉnh nhanh chóng.

      Một phần co lại tập tin âm thanh một cách sao cho giữ lại các đặc điểm quan trọng trong khi loại bỏ tiếng ồn không cần thiết. Điều này làm cho hệ thống trở nên nhanh hơn trong việc giảng dạy và tạo ra âm thanh mới một cách nhanh chóng hơn. Phần còn lại sử dụng văn bản (mô tả metadata về âm nhạc và âm thanh) để hướng dẫn loại âm thanh được tạo ra.

      Quảng cáo. Để tiến trình nhanh hơn, kiến trúc Âm thanh ổn định hoạt động trên một phiên bản âm thanh được tối giản và nén để giảm thời gian suy luận (số thời gian mà mô hình học máy cần để tạo ra kết quả sau khi đã cho đầu vào). Theo Stability AI, Âm thanh ổn định có thể giải mã 95 giây âm thanh stereo với tần số lấy mẫu 44.1 kHz (thường được gọi là "chất lượng CD") trong ít hơn một giây trên một GPU Nvidia A100. A100 là GPU trung tâm dữ liệu có hiệu suất cao dành cho ứng dụng trí tuệ nhân tạo và nó mạnh hơn nhiều so với GPU chơi game thông thường trên máy tính để bàn.

      Như đã đề cập, Âm thanh ổn định không phải là trình tạo nhạc đầu tiên dựa trên kỹ thuật truyền lan tiềm ẩn. Tháng 12 năm ngoái, chúng tôi đã giới thiệu về Riffusion, một phiên bản am hiểu về âm thanh của Stable Diffusion, tuy nhiên, âm thanh tạo ra không đạt đến chất lượng mẫu âm thanh của Âm thanh ổn định. Tháng 1, Google phát hành MusicLM, một trình tạo nhạc AI cho âm thanh 24 kHz, và Meta ra mắt một bộ công cụ âm thanh mã nguồn mở (bao gồm một trình tạo nhạc từ văn bản) được gọi là AudioCraft vào tháng Tám. Bây giờ, với âm thanh stereo 44.1 kHz, Stable Diffusion đang nâng cấp mức độ.

      Stability cho biết, Stable Audio sẽ được cung cấp trong phiên bản miễn phí và gói Pro hàng tháng có giá 12 đô la. Với tùy chọn miễn phí, người dùng có thể tạo ra tối đa 20 bản nhạc mỗi tháng, mỗi bản có độ dài tối đa 20 giây. Gói Pro mở rộng giới hạn này, cho phép tạo ra 500 bản nhạc mỗi tháng và độ dài bản nhạc lên đến 90 giây. Dự kiến phiên bản mới của Stability sẽ bao gồm các mô hình mã nguồn mở dựa trên kiến trúc Âm thanh ổn định, cùng với các mã huấn luyện dành cho những người quan tâm đến việc phát triển các mô hình tạo âm thanh.

      Điều hiện tại cho thấy, với tính chất âm thanh tốt, Âm thanh ổn định có thể là âm nhạc được tạo ra bằng trí tuệ nhân tạo chất lượng sản xuất. Liệu những nhà soạn nhạc có vui mừng nếu bị thay thế bằng mô hình trí tuệ nhân tạo? Có lẽ không, nếu lịch sử đã cho chúng ta thấy bất cứ điều gì từ cuộc biểu tình của AI trong lĩnh vực mỹ thuật hình ảnh. Hiện tại, con người vẫn dễ dàng vượt trội hơn bất kỳ điều gì AI có thể tạo ra, nhưng có thể sẽ không còn như vậy trong tương lai. Dù sao, âm thanh tạo ra bằng trí tuệ nhân tạo có thể trở thành một công cụ khác trong bộ công cụ sản xuất âm thanh chuyên nghiệp.

      Author TOPSEO.AI
      Author: TOPSEO.AI
      Siêu AI đem đến cho bạn những tin tức mới nhất, ý kiến chuyên gia và hướng dẫn về cách khai thác sức mạnh của AI và ChatGPT. Siêu AI tự động tổng hợp tin bài, hướng dẫn về các công cụ AI, ChatGPT, OpenAI... dịch thuật bằng ChatGPT. Website được xây dựng và điều hành trên nền tảng TOPSEO.AI.