ChatGPT của Open AI và các mô hình tương tự đã chiếm trọn tiêu đề trong năm nay, thu hút sự chú ý của tỷ phú, người hâm mộ, cơ quan quản lý và những người dự đoán tận thế. Tuy nhiên, nhiều bài viết gần đây cũng đã tiết lộ lý do tại sao Pentagon đang theo đuổi các phương pháp AI khác nhau: những nhà lãnh đạo quân sự cần các công cụ mà họ có thể tin tưởng.
Một lý do lớn của ChatGPT và các mô hình ngôn ngữ lớn khác là tại sao chúng tốt đến vậy trong việc mô phỏng việc viết của con người cũng chính là lý do chúng được dùng để gian lận: mạng thần kinh ở trung tâm của AI được cung cấp thông tin từ hàng triệu trang web. Trong khi Open AI chưa tiết lộ những trang web nào được sử dụng để đào tạo các công cụ của mình, một cuộc điều tra gần đây của Washington Post đã xem xét 15 triệu trang web mà các nhà nghiên cứu đã sử dụng để đào tạo các mô hình tương tự. Không ngạc nhiên khi phần lớn dữ liệu lớn này chứa nhiều thông tin không đúng sự thật – và các mô hình AI ngôn ngữ lớn và sinh sản thường hay nói dối.
Ngay cả khi bạn huấn luyện mô hình ngôn ngữ lớn trên một nhóm trang web được chọn kỹ, bạn vẫn có thể gặp phải "ảo giác nhân tạo": "hiện tượng của một máy móc, ví dụ như một chatbot, tạo ra những trải nghiệm giác quan có vẻ thực tế mà không tương ứng với bất kỳ thông tin đầu vào nào trong thế giới thực”.
Vì vậy, Bộ Quốc phòng rất cẩn trọng trong việc sử dụng các công cụ như vậy.
"Chúng tôi sẽ không sử dụng ChatGPT trong trạng thái hiện tại của nó. Tuy nhiên, các mô hình ngôn ngữ lớn rất hữu ích", Maynard Holliday, phó giám đốc công nghệ quân sự cho các công nghệ quan trọng của Bộ Quốc phòng, nói vào thứ 5 tại Defense One Tech Summit. “Chúng tôi sẽ sử dụng những mô hình ngôn ngữ lớn này, những mô hình sinh sản AI, dựa trên dữ liệu của chúng tôi. Và vì thế chúng sẽ được điều chỉnh với dữ liệu của Bộ Quốc phòng, được huấn luyện trên dữ liệu của chúng tôi, và sau đó cũng trên các máy tính của chúng tôi – bất kỳ máy tính đám mây của chúng tôi nào hoặc bên trong cơ sở của chúng tôi để nó được mã hóa, và chúng tôi có thể... phân tích, các phản hồi của nó.”
Tuần này, Holliday nói, Bộ Quốc phòng sẽ tổ chức một cuộc tụ họp "để tìm hiểu, chúng ta chỉ cần xem các trường hợp sử dụng là gì; chỉ xem các trạng thái của nghành và học thuật là gì.”
Bộ Quốc phòng cũng cần phải cải thiện việc cấu trúc và chia sẻ dữ liệu, ngay cả sau hai năm từ khi có một chỉ thị tầm quan trọng về vấn đề này, theo Mike Horowitz, người đứng đầu Văn phòng Chính sách Năng lực Nổi bậc trong Văn phòng của Phó thứ trưởng Quốc phòng về chính sách.
"Bạn cần có dữ liệu tốt, như là dữ liệu áp dụng cho các câu hỏi mà bạn muốn sử dụng AI để trả lời," Horowitz nói. "Bạn cần dữ liệu đó được làm sạch, được đánh dấu, và quá trình đó tốn thời gian. Và quá trình đó đã được... thách thức. Và nó đã thách thức vì chúng tôi xây dựng tất cả các ống dẫn dữ liệu này mà được thiết kế để độc lập với nhau."
"Những chỉ huy không tin tưởng một công cụ trừ khi họ có thể hiểu được cách nó được đào tạo và trên dữ liệu gì," Holliday cho biết.
"Trong quá khứ, khi tôi đang tham gia Ban Khoa học Quốc phòng nghiên cứu về tự động hóa năm 2015, khi chúng tôi phổ biến đến chỉ huy chiến đấu của chúng tôi, họ đã nói: 'Bạn biết đấy, điều này tuyệt vời, tiềm năng thay đổi trò chơi, nhưng... chúng tôi sẽ không sử dụng nó trừ khi chúng tôi có thể tin tưởng nó,'" ông nói.
Xây dựng niềm tin
Bất kỳ ai cũng có thể tìm hiểu ChatGPT để tìm ra mức độ tin tưởng của nó cho một việc sử dụng cụ thể, nhưng Bộ Quốc phòng đang thực hiện một con đường chính thức hơn.
"Niềm tin ban đầu có thể được đạt được thông qua các quyết định thiết kế và phát triển thông qua các điểm tiếp xúc của người lính và an toàn tâm lý cơ bản, và niềm tin được liên tục hiệu chỉnh thông qua bằng chứng về hiệu quả và phản hồi được cung cấp bởi hệ thống trong quá trình tích hợp và vận hành. Và vì thế những thách thức tồn tại trong việc đo lường niềm tin của các chiến binh chiến đấu, đòi hỏi nghiên cứu và hiểu rõ hơn để xác định những yếu tố ảnh hưởng đến nó," ông ta nói.
Trong thực tế, điều này giống như một số bài tập mà CENTCOM đang thực hiện, đưa các nhà điều hành sử dụng nhiều dịch vụ và trò chơi trung tâm số hóa để đánh giá các công nghệ mới nổi.
Các bài tập như Scarlet Dragon Oasis và Falcon Oasis có cấu trúc khác biệt so với trò chơi huấn luyện quân sự truyền thống, nói Schuyler Moore, Giám đốc Công nghệ CENTCOM. Những bài tập mới tập trung vào các công nghệ mới dựa trên các phản hồi của người lính hơn là việc xây dựng kỹ năng nhà điều hành. Việc đưa người điều hành và người xây dựng hợp tác là một phần quan trọng khác.
Đó là "một kế hoạch chuẩn để làm những điều tốt nhất của cộng đồng phát triển phần mềm và khu vực tư nhân, đó là: bạn thực hiện điều này theo các bước nhỏ; bạn làm nó theo cách lặp đi lặp lại và bạn lặp lại những bài tập này nhiều lần để cải thiện theo thời gian," bà nói. "Và vì thế đối với bài tập chúng tôi đang thực hiện bây giờ, có một ký ức cơ bản mà chúng tôi đang xây dựng, lặp đi lặp lại với một nhà phát triển phần mềm và không nói rằng bất kỳ khả năng phần mềm nào mà tôi được thừa kế là tĩnh lặng... Mong đợi bây giờ là bạn có thể và sẽ đưa ra ý kiến của mình, chia sẻ phản hồi của bạn, lặp đi lặp lại với nhóm, tiếp tục cung cấp phản hồi của bạn mỗi lần và điều đó - để thành thật - đã là một sự thay đổi tư duy văn hóa vì trước đây, các bài tập không bao giờ cung cấp cho mọi người cơ hội thử nghiệm với loại hoạt động đó".
Andrew Moore, cố vấn về trí thông minh nhân tạo, robot, đám mây tính toán và phân tích dữ liệu của CENTCOM, đến từ Google, nơi ông làm việc về nhiều dự án liên quan đến trí thông minh nhân tạo, bao gồm Project Maven, được xem là một mô hình về cách quân đội có thể phát triển đội ngũ con người - AI trong tương lai.
CENTCOM đóng vai trò quan trọng trong việc khởi động Maven, vì nhiều chuyên gia phân tích đã phải sàng lọc qua hàng giờ và giờ của dữ liệu máy bay không người lái để hiểu cách mọi người trên đất đang hành động như thế nào và người nào có thể đưa ra mối đe dọa.
Lực lượng đang cố gắng đưa nghiên cứu đó xa hơn, để cho phép các động cơ trí tuệ nhân tạo hiểu được rõ hơn về các đối tượng được nhận thấy bằng đầu dò, ông Moore bày tỏ.
"Câu hỏi tiếp theo thực sự là đảm bảo rằng bạn có thể suy ra những gì đang xảy ra dựa trên việc tìm ra mối quan hệ giữa tất cả những dấu chấm trên bản đồ," ông nói.
Một ứng dụng trí tuệ nhân tạo đột phá cho CENTCOM trong những năm tới có lẽ sẽ trông ít giống một trình tạo văn bản nổi bật - và khó sửa lỗi - hơn và phản chiếu hơn một knowledge graph, mà Moore đã làm việc tại Google. Một knowledge graph hoạt động để cấu trúc dữ liệu đang nhanh chóng đến theo một khái niệm lược đồ về các thuộc tính của nó và mối quan hệ giữa các đối tượng. Khi bạn truy cập vào một trang web mạng xã hội và thấy các đề xuất cho ai bạn có thể kết nối, đó là một phần do knowledge graph."
"Trong suy nghĩ của tôi, các biểu đồ tri thức là những gì tạo ra các công ty triệu đô mà bạn thấy ở Bờ Tây Hoa Kỳ," ông nói.
Nhưng đối với CENTCOM, Moore nghĩ tới việc xây dựng một công cụ để hiểu quan hệ giữa các đối tượng ở một cấp độ sâu hơn, cho phép nhân viên chỉ huy nhìn thấy những kết nối sẽ minh họa chiến trường và tất cả các đối tượng trong nó theo các cách mà các đối thủ cố giấu đi hoặc có thể chẳng nhận thức được.
“Tôi nghĩ rằng đó sẽ là một trong những chủ đề thống nhất mà bạn sẽ thấy,” ông nói. “Đó là sự quan trọng tuyệt đối không chỉ có khả năng tiêu thụ lượng lớn dữ liệu, mà còn có khả năng chuẩn hóa nó theo một cách mà chúng ta có thể thực sự suy luận được, để có thể đưa ra những thông tin phụ họa thứ cấp hoặc thứ ba như vậy như tài chính, hoặc có thể bởi quyền sở hữu của họ.”