Theo một nghiên cứu mới nhất của Viện Giá trị Kinh doanh của IBM (IBV), 64% CEO đã được khảo sát đối mặt với áp lực tăng tốc việc triển khai trí tuệ nhân tạo (AI) tái tạo, và 60% không có phương pháp nhất quán trên toàn doanh nghiệp để triển khai nó. Một nền tảng AI và dữ liệu, như watsonx, có thể giúp các doanh nghiệp tận dụng các mô hình nền tảng và tăng tốc quá trình triển khai AI tái tạo trên toàn tổ chức của họ.

Các tính năng và khả năng mới được ra mắt của watsonx.ai, một khả năng trong watsonx, bao gồm các mô hình nền tảng tổng quát và tạo mã mới, một loạt các tùy chọn mô hình mã nguồn mở đa dạng hơn, và các lựa chọn dữ liệu và khả năng điều chỉnh bổ sung có thể mở rộng tác động kinh doanh tiềm năng của AI tái tạo. Những cải tiến này đã được hướng dẫn bởi những yếu tố chiến lược cơ bản của IBM là AI phải là mở, đáng tin cậy, nhắm đúng mục tiêu và đầy sức mạnh.

Tìm hiểu thêm về watsonx.ai, Studio dành cho người xây dựng AI tập trung vào doanh nghiệp của chúng tôi.

Các mô hình nền tảng dành cho doanh nghiệp được phát triển bởi IBM từ dữ liệu đáng tin cậy

Các nhà lãnh đạo doanh nghiệp đảm nhiệm việc áp dụng AI tái tạo cần có tính linh hoạt và sự lựa chọn về mô hình. Họ cũng cần truy cập bảo mật vào các mô hình có liên quan đến doanh nghiệp có thể giúp gia tăng thời gian giá trị và những hiểu biết. Nhận ra rằng một kích cỡ không phù hợp cho tất cả, Studio watsonx.ai của IBM cung cấp một loạt các mô hình nền tảng ngôn ngữ và mã hóa trong các kích cỡ và kiến trúc khác nhau để giúp khách hàng cung cấp hiệu suất, tốc độ và hiệu quả.

"Atsushi Hasegawa, Kỹ sư trưởng, Honda R&D, cho biết: 'Trong một môi trường nơi tích hợp với hệ thống của chúng tôi và kết nối mượt mà với phần mềm khác nhau là điểm yếu, watsonx.ai trở thành một giải pháp hấp dẫn. Sự linh hoạt bẩm sinh và khả năng triển khai linh hoạt, kết hợp với cam kết mạnh mẽ đối với an ninh thông tin, làm tăng đặc tính hấp dẫn của nó.'"

Phiên bản ban đầu của watsonx.ai bao gồm các mô hình chỉ mã hóa Slate hữu ích cho các nhiệm vụ xử lý ngôn ngữ tự nhiên (NLP) doanh nghiệp. Chúng tôi hân hạnh giới thiệu phiên bản đầu tiên của mô hình nền tảng tái tạo do IBM phát triển, Granite. Loạt mô hình Granite được xây dựng trên kiến trúc chỉ giải mã và phù hợp với các công việc tái tạo như tóm tắt, tạo nội dung, tạo thêm thông tin, phân loại và trích xuất hiểu biết.

Tất cả các mô hình nền tảng Granite đã được đào tạo trên các tập dữ liệu tập trung vào doanh nghiệp, được IBM chọn lọc. Để cung cấp chuyên môn sâu hơn, loạt mô hình Granite đã được đào tạo trên các tập dữ liệu liên quan đến doanh nghiệp từ năm lĩnh vực: internet, học thuật, mã nguồn, pháp lệnh và tài chính, tất cả đều được kiểm tra để loại bỏ nội dung không thích hợp, và so sánh với các mô hình nội bộ và bên ngoài. Quá trình này được thiết kế để giúp giảm thiểu rủi ro để đầu ra mô hình có thể triển khai một cách có trách nhiệm với sự trợ giúp của watsonx.data và watsonx.governance (sẽ được công bố sớm).

Dựa trên đánh giá và kiểm tra nghiên cứu và thử nghiệm của IBM Ban công nghệ, với 11 tác vụ tài chính khác nhau, kết quả cho thấy rằng bằng cách đào tạo mô hình Granite-13B với dữ liệu tài chính chất lượng cao, chúng là một trong những mô hình có hiệu suất cao nhất trên các nhiệm vụ tài chính và có tiềm năng đạt được hiệu suất tương tự hoặc thậm chí tốt hơn so với các mô hình lớn hơn nhiều.

Các nhiệm vụ tài chính đánh giá bao gồm: cung cấp điểm cảm xúc cho các bản ghi chứng khoán và cuộc trò chuyện về lợi nhuận, phân loại tiêu đề tin tức, trích xuất đánh giá rủi ro tín dụng, tóm tắt văn bản tài chính dài và trả lời các câu hỏi liên quan đến tài chính hoặc bảo hiểm.

Xây dựng tính minh bạch vào các mô hình AI được phát triển bởi IBM

Đến nay, nhiều mô hình AI hiện có thiếu thông tin về nguồn gốc dữ liệu, kiểm tra và độ an toàn hoặc thông số hiệu suất. Đối với nhiều doanh nghiệp và tổ chức, điều này có thể gây ra sự bất định làm giảm tốc độ áp dụng AI sáng tạo, đặc biệt là trong các ngành công nghiệp được quy định chặt chẽ.

Hôm nay, IBM chia sẻ các nguồn dữ liệu sau được sử dụng trong quá trình huấn luyện các mô hình Granite (tìm hiểu thêm về cách các mô hình này được huấn luyện và nguồn dữ liệu được sử dụng):

  1. Common Crawl
  2. Webhose
  3. GitHub Clean
  4. Arxiv
  5. USPTO
  6. Pub Med Central
  7. SEC Filings
  8. Free Law
  9. Wikimedia
  10. Stack Exchange
  11. DeepMind Mathematics
  12. Project Gutenberg (PG-19)
  13. OpenWeb Text
  14. HackerNews

Phương pháp phát triển AI của IBM được hướng dẫn bởi nguyên tắc cốt lõi được nhấn mạnh vào cam kết về sự tin cậy và minh bạch. Là một bằng chứng cho sự nghiêm túc mà IBM đều đặn đưa vào việc phát triển và kiểm tra các mô hình cơ sở của nó, IBM sẽ bảo hiểm cho khách hàng chống lại các yêu sách nhãn quyền của bên thứ ba đối với các mô hình cơ sở do IBM phát triển. Và trái ngược với một số nhà cung cấp khác của các mô hình ngôn ngữ lớn và nhất quán với phương pháp tiêu chuẩn của IBM về bảo hiểm, IBM không yêu cầu khách hàng bảo hiểm cho việc sử dụng các mô hình do IBM phát triển. Cũng như tiếp cận của IBM đối với nghĩa vụ bảo hiểm, IBM không giới hạn trách nhiệm bảo hiểm về nhãn quyền của mình đối với các mô hình do IBM phát triển.

Khi khách hàng muốn sử dụng các mô hình do IBM phát triển để tạo ra các tài sản AI khác biệt, chúng tôi khuyến khích khách hàng tùy chỉnh thêm các mô hình IBM để đáp ứng các nhiệm vụ cụ thể phía dưới. Qua các kỹ thuật kỹ sư và điều chỉnh tức thì đang được tiến hành, khách hàng có thể sử dụng dữ liệu doanh nghiệp riêng của mình một cách có trách nhiệm để đạt được độ chính xác cao hơn trong đầu ra của mô hình, tạo ra lợi thế cạnh tranh.

Giúp tổ chức sử dụng các mô hình bên thứ ba một cách có trách nhiệm

Xét đến việc có hàng nghìn mô hình ngôn ngữ lớn nguồn mở để làm việc, không dễ để biết nên bắt đầu từ đâu và làm thế nào để chọn mô hình phù hợp cho nhiệm vụ đúng. Tuy nhiên, việc chọn LLM "đúng" từ một bộ sưu tập hàng nghìn mô hình nguồn mở không phải là một công việc dễ dàng và yêu cầu việc xem xét cẩn thận về các sự đánh đổi giữa chi phí và hiệu suất. Và khi xem xét tính không thể dự đoán của nhiều LLM, quan trọng là cân nhắc đến đạo đức và quản trị AI trong việc xây dựng, huấn luyện, điều chỉnh, kiểm tra và đầu ra của mô hình.

Hiểu rằng một mô hình sẽ không đủ - chúng tôi đã tạo ra một thư viện mô hình cơ sở trên watsonx.ai để khách hàng và đối tác làm việc với nó.

Bắt đầu với 5 mô hình nguồn mở đã được xác định từ Hugging Face, chúng tôi đã chọn những mô hình này dựa trên các đánh giá kỹ thuật, pháp lý và hiệu suất nghiêm ngặt, cũng như hiểu rõ về các trường hợp sử dụng mà những mô hình này phù hợp nhất. Mô hình LLM nguồn mở mới nhất mà chúng tôi đã thêm vào trong tháng này bao gồm mô hình 70 tỷ tham số của Meta, Llama 2-chat, trong studio watsonx.ai. Llama 2 hữu ích cho việc trò chuyện và sinh mã code. Nó được tiền huấn luyện bằng dữ liệu trực tuyến công khai có sẵn và được "fine-tune" bằng cách sử dụng học tăng cường từ phản hồi của con người. Llama 2 hữu ích cho việc nâng cao ứng dụng trợ lý ảo và trò chuyện, và dành cho các kịch bản thương mại và nghiên cứu.

Mô hình StarCoder LLM của BigCode cũng đã có sẵn trên watsonx.ai. Được đào tạo trên dữ liệu được cấp phép từ GitHub, mô hình có thể được sử dụng như một trợ lý kỹ thuật, giải thích và trả lời các câu hỏi chung về mã nguồn bằng ngôn ngữ tự nhiên. Nó cũng có thể giúp tự động hoàn chỉnh mã nguồn, thay đổi mã và giải thích các đoạn mã bằng ngôn ngữ tự nhiên.

Người dùng của các mô hình bên thứ ba trên watsonx.ai cũng có thể bật chức năng AI guardrails để tự động loại bỏ ngôn ngữ xúc phạm khỏi đầu vào và đầu ra được tạo ra.

Giảm rủi ro đào tạo mô hình với dữ liệu tổng hợp

Trong quá trình thông thường của việc ẩn danh dữ liệu, có thể xảy ra lỗi gây ảnh hưởng nghiêm trọng đến đầu ra và dự đoán. Nhưng dữ liệu tổng hợp cung cấp cho tổ chức khả năng giải quyết khoảng trống dữ liệu và giảm rủi ro tiết lộ dữ liệu cá nhân của bất kỳ cá nhân nào bằng cách tận dụng dữ liệu được tạo ra nhân tạo thông qua mô phỏng máy tính hoặc thuật toán.

Dịch vụ tạo dữ liệu tổng hợp trong watsonx.ai sẽ cho phép tổ chức tạo dữ liệu bảng tổng hợp được đánh nhãn trước và bảo tồn các thuộc tính thống kê của dữ liệu doanh nghiệp gốc. Dữ liệu này sau đó có thể được sử dụng để điều chỉnh mô hình trí tuệ nhân tạo nhanh hơn hoặc cải thiện độ chính xác của chúng bằng cách tiêm vào nhiều biến thể hơn vào tập dữ liệu (rút ngắn thời gian thu thập dữ liệu dài cần thiết để thu thập sự biến đổi rộng rãi trong dữ liệu thực). Có khả năng xây dựng và kiểm tra mô hình với dữ liệu tổng hợp có thể giúp tổ chức khắc phục khoảng trống dữ liệu và từ đó cải thiện tốc độ đưa sản phẩm AI mới vào thị trường.

Tạo điều kiện cho các trường hợp sử dụng tập trung vào kinh doanh bằng cách điều chỉnh gợi ý

Phiên bản chính thức của Tuning Studio trong watsonx.ai cho phép người dùng kinh doanh tùy chỉnh mô hình cơ sở cho các nhu cầu cụ thể của họ trong các trường hợp sử dụng bao gồm Q&A, tạo nội dung, nhận dạng thực thể đã đặt tên, trích xuất thông tin, tóm tắt và phân loại.

Phiên bản đầu tiên của Tuning Studio sẽ hỗ trợ việc điều chỉnh gợi ý. Bằng cách sử dụng việc điều chỉnh gợi ý tiên tiến trong watsonx.ai (dựa trên từ 100 đến 1,000 ví dụ), các tổ chức có thể tùy chỉnh các mô hình cơ sở hiện có cho dữ liệu độc quyền của họ. Ðiều chỉnh gợi ý cho phép một công ty với dữ liệu hạn chế tùy chỉnh một mô hình khổng lồ cho một nhiệm vụ cụ thể, với tiềm năng giảm việc tính toán và sử dụng năng lượng mà không cần đào tạo lại một mô hình trí tuệ nhân tạo.

Tiến bộ và hỗ trợ AI cho kinh doanh

Nền tảng AI và dữ liệu watsonx của IBM được xây dựng cho kinh doanh, nhằm giúp các cá nhân trong tổ chức của bạn mở rộng và tăng tốc tác động của AI với dữ liệu đáng tin cậy của bạn. Khi công nghệ AI tiến bộ, kiến trúc watsonx được thiết kế để tích hợp mượt mà các mô hình cơ sở mới hướng đến doanh nghiệp như những mô hình được phát triển bởi IBM Research, và thích ứng với các mô hình bên thứ ba như những mô hình được cung cấp trên nền tảng mã nguồn mở Hugging Face, trong khi cung cấp các quy tắc quản trị quan trọng với phiên bản tương lai của watsonx.governance.

Nền tảng watsonx chỉ là một phần trong các giải pháp AI phát sinh của IBM.

Với IBM Consulting, khách hàng có thể nhận được sự trợ giúp trong việc điều chỉnh và vận hành các mô hình cho các trường hợp sử dụng kinh doanh cụ thể, thông qua việc tiếp cận với sự chuyên môn về trí tuệ nhân tạo tạo ra của hơn 1.000 tư vấn viên.

Trải nghiệm thử watsonx.ai với trải nghiệm dùng thử watsonx của chúng tôi