Hình ảnh: Askar/Adobe Stock
Meta thông báo rằng họ sẽ công khai mã nguồn mở cho mô hình ngôn ngữ lớn Llama 2 của mình vào ngày 18 tháng 7. Cập nhật cho mô hình này, được phát hành với tên gọi LLaMA thế hệ đầu tiên (còn được viết tắt là Llama 1) vào tháng 2 năm 2023, đã được tiết lộ tại sự kiện Microsoft Inspire. Microsoft sẽ là đối tác ưu tiên của Meta trong việc phát triển Llama 2.
Nhảy đến:
Llama 2 là gì?
Llama 2 là một mô hình ngôn ngữ lớn có thể được sử dụng để tạo ra các mô hình trò chuyện và AI tạo ra ngôn ngữ. Đơn giản nói, Llama 2, giống như GPT-4, có thể được sử dụng để xây dựng chatbot và trợ lý AI cho mục đích thương mại hoặc nghiên cứu.
Nó chạy trên một bộ sưu tập các mô hình văn bản tạo ngẫu nhiên đã được huấn luyện trước và điều chỉnh kỹ thuật số có quy mô từ 7 tỷ đến 70 tỷ thông số, và 2 ngàn tỷ đơn vị thông tin trong dữ liệu từ các nguồn công khai đã được sử dụng cho việc huấn luyện trước của nó. Tổng cộng, đó là 40% số lượng đơn vị thông tin lớn hơn so với mô hình Llama gốc.
XEM THÊM: Bộ công cụ tuyển dụng: Kỹ sư khơi gợi (TechRepublic Premium)
Llama 2 có sẵn ở đâu?
Llama 2 có thể được tải về để sử dụng cho mục đích nghiên cứu và thương mại từ trang web của Meta tại đây. Các tài nguyên mã nguồn mở bao gồm trọng số mô hình và mã khởi đầu cho mô hình được huấn luyện trước cũng như các phiên bản điều chỉnh kỹ thuật số của công nghệ trí tuệ nhân tạo tạo ngẫu nhiên.
"Việc mở cửa truy cập vào các mô hình AI ngày nay có nghĩa là thế hệ các nhà phát triển và nhà nghiên cứu có thể thử nghiệm, xác định và giải quyết các vấn đề một cách nhanh chóng, như là một cộng đồng," Meta viết trong một bài đăng trên blog về Llama 2. "Bằng cách xem cách các công cụ này được sử dụng bởi người khác, đội ngũ của chúng tôi có thể học từ họ, cải thiện các công cụ đó và khắc phục các lỗ hổng."
Các nhà phát triển đã có tài khoản với danh mục mô hình trí tuệ nhân tạo Azure của Microsoft sẽ có thể truy cập Llama 2 từ đó. Nó cũng có thể được tìm thấy trên Amazon Web Services, Hugging Face và các chợ trực tuyến trí tuệ nhân tạo khác. Khách hàng của AWS nên tìm kiếm nó trên chợ trí tuệ nhân tạo SageMaker.
"Việc Meta công bố mô hình này có sẵn trên AWS và Microsoft Azure là một bước đột phá đáng kể cho họ, thể hiện tham vọng trở thành một người chơi doanh nghiệp trong lĩnh vực trí tuệ nhân tạo tạo ngẫu nhiên," nhà phân tích Gartner Arun Chandrasekaran nhận xét trong một email gửi đến TechRepublic.
Meta hợp tác với Qualcomm để phát triển AI trên thiết bị
Qualcomm sẽ cài đặt Llama 2 trên một số thiết bị vào năm 2024. Mẫu thiết bị chính xác mà điều này áp dụng chưa được tiết lộ, nhưng Qualcomm đã nói rằng đó sẽ là các thiết bị sử dụng bộ xử lý Snapdragon. Qualcomm nhằm chạy mô hình ngôn ngữ trên một số thiết bị trực tiếp, không phải luôn luôn trên đám mây.
“Chúng tôi hoan nghênh phương pháp tiếp cận trí tuệ nhân tạo mở và có trách nhiệm của Meta và cam kết thúc đẩy sự đổi mới và giảm các rào cản đối với các nhà phát triển bất kể quy mô bằng cách mang trí tuệ nhân tạo sáng tạo vào thiết bị,” nói ông Durga Malladi, Phó Chủ tịch cấp cao và Tổng giám đốc Công nghệ, Kế hoạch và Giải pháp Mạch lưới của Qualcomm, trong một thông cáo báo chí. “Để mở rộng ảnh hưởng của trí tuệ nhân tạo sáng tạo vào đồng đa dạng, trí tuệ nhân tạo sẽ cần được chạy trên cả đám mây và thiết bị tại các điểm nút, chẳng hạn như điện thoại thông minh, máy tính xách tay, phương tiện giao thông và các thiết bị IoT.”
Llama 2 nói gì về sự cạnh tranh trong lĩnh vực kinh doanh trí tuệ nhân tạo sáng tạo?
Việc mở Llama 2 lên và thực hiện một đối tác với Microsoft có thể là một dấu hiệu cho thấy Meta đang cố gắng duy trì sự cạnh tranh với GPT-4. GPT-4 của OpenAI cũng miễn phí và là mô hình đằng sau ChatGPT, mà Microsoft đã đặt cược một cách lớn. Google cũng có một mô hình tương tự với mô hình PaLM đằng sau Bard.“Điều này sẽ thay đổi cảnh quan của thị trường LLM,” Giáo sư Khoa học Trí tuệ Nhân tạo Trưởng của Meta, Yann LeCun, nói trên Twitter.
Hiện chưa rõ việc liên kết với Meta sẽ thay đổi các thỏa thuận của Microsoft với OpenAI, nhưng "đối tác với Meta có thể mở ra cơ hội mới hơn cho họ," Chandrasekaran nói. "Các mô hình Llama 2 có thể tạo ra nhu cầu cho IaaS và các công cụ hoạt động của Azure khi khách hàng tìm kiếm các cải tiến cho các mô hình này và xây dựng ứng dụng kinh doanh dựa trên chúng," ông thêm.
Việc công khai mô hình mã nguồn mở cũng có thể là một sự thay đổi đáng kể. “Bằng cách phát hành Llama 2 và cấp phép sử dụng thương mại cho nó, Meta có thể đóng góp cho cộng đồng mã nguồn mở một đòn bẩy lớn,” Chandrasekaran nói. "Hiện nay, có thể nói các mô hình mã nguồn đóng đã có lợi thế về hiệu suất so với các mô hình mã nguồn mở, nhưng Llama có khả năng thu hẹp khoảng cách đó trong trung và dài hạn.