Bởi vì sự thù địch quá đáng = CHỈNH SỬA: Đây là một tưởng tượng cho cuộc trò chuyện thú vị, không phải là cái mồi cho... một số người rõ ràng không muốn ý tưởng này có thể xảy ra.

Khi đến việc đồ thị toán inference, chúng ta hiểu về các thiết lập và giá trị phát sinh, bao gồm cả nhiệt độ.

Tuy nhiên, máy tính không có khả năng tạo ra những gì chúng ta gọi là "ngẫu nhiên thực sự" và nó dễ bị ảnh hưởng bởi thực tế liên quan đến lý thuyết số lớn.

Điều này chủ yếu bởi vì chúng ta đều "không sâu đặc" và cũng "hoàn toàn tình cờ", đặc biệt khi liên quan đến [logic] có thể bị gia tăng bởi tính toán.

Thực sự hãy suy nghĩ về những gì đi qua đầu bạn vào bất kỳ thời điểm nào trong ngày.

Bạn muốn bao nhiêu phần trăm đó trong việc huấn luyện trí tuệ nhân tạo?

Vâng, đó đó...

Khi dự đoán xem một cái gì đó được viết bởi GPT, hoặc trí tuệ nhân tạo chung, bạn đang tìm kiếm con đường tối thẳm nhất để đạt được việc viết đó.

Một đoạn mã hoàn thành văn bản đơn giản có thể làm được điều đó.

Với đoạn mã thích hợp, bạn có thể phát hiện ra mẫu ngôn ngữ của trí tuệ nhân tạo (như các bài đăng)

Thậm chí... không có công thức toán học chúng ta biết để chống lại điều này.

:slight_smile:

3 Lượt thích

Rất mong được xem mã hoạt động như vậy

1 Lượt thích

Nếu như nhận diện văn bản được tạo ra bởi trí tuệ nhân tạo một cách đáng tin cậy, hãy viết báo cáo của bạn và nhận bằng tiến sĩ và/hoặc của bạn.

3 Lượt thích

Thấy gì...

Vâng, điều đó thật đáng thú vị đấy.

Vậy thì bạn biết làm sao mà có quá nhiều khả năng cho một từ kế tiếp, và làm sao khả năng trong trường hợp của các bộ biến áp phụ thuộc vào... Nhiều không?

:frowning:

Vâng, vậy - Một máy tính chỉ có thể xuất ra dựa trên những gì được đưa vào nó.

Đây là một quy luật của... (do ngần ngại, cố gắng không nói "tất cả") Mọi thứ! (rồi đó)

Nhưng không thực sự.

Có một lý do vì sao các khóa bảo mật được tạo ra bằng cách di chuyển chuột.

1 Lượt thích

Hoặc họ tắt bỏ hiển thị các khả năng xác suất (đã làm), và ý tưởng của bạn sẽ thất bại.

2 Lượt thích

Không... xin lỗi, nhưng điều đó không áp dụng ở đây.

Tôi đã thậm chí phải chịu một bài học từ GPT để kiểm tra xem.

Thực tế là chỉ có một số từ mà có thể xuất hiện sau từ bất kỳ trong một ngữ cảnh bất kỳ, và điều này có thể tính toán được.

Có thể tính toán được ngay cả trong con người.

"Tôi không sợ ..."

Rõ ràng câu trả lời là "dê"

nhưng điều này không đúng đấy.

nhưng nó cũng không quan trọng, chỉ có một số từ mà có thể xuất hiện sau nó.

Nhưng bạn cũng có thể tính toán giữa các lỗi gõ.

"Tôi không ****** của G****. Chúng thậm chí không đáng sợ chút nào. Chúng chỉ là... động vật trang trại. Chẳng hạn là con bò."

Bạn thấy không?

Bây giờ ngữ cảnh trở nên phức tạp hơn nhưng nó không liên quan đến khả năng hiển thị của các tính toán xác suất. Nó không nhất thiết phải hiển thị. Các từ được nhìn thấy.

Thứ tự của các từ được nhìn thấy.

Và đó là cách nó hoạt động...

1 Thích

1 Thích

Detect this.

Có nhiều cách để đạt được việc phát hiện ngôn ngữ dựa trên trí tuệ nhân tạo. Trong trường hợp công nghệ của GeneralBadWolf, tôi tưởng tượng rằng điều đó liên quan đến phân tích các mẫu ngôn ngữ tự nhiên mà xuất hiện khi con người tạo ra câu và so sánh chúng với các mẫu và đặc điểm nổi bật hơn thường có khi các chương trình dựa trên học máy tạo ra văn bản tương tự.

Có thể họ cũng áp dụng các phân tích tương tự bằng cách biểu đồ hóa tần suất viết so với tốc độ ghi tự-anewing của máy tính/máy chủ.

image

Hoặc có thể họ đã huấn luyện trí tuệ nhân tạo của mình bằng cách sử dụng lượng lớn nội dung hiện có được viết bởi con người và các chương trình máy tính hoạt động dựa trên mô hình học máy khác. Qua việc sử dụng mạng neural, phần mềm có thể đã được điều chỉnh tinh vi qua hàng ngàn hoặc thậm chí hàng triệu các tình huống đào tạo khác nhau trước khi cuối cùng trở thành phần mềm ổn định, phản ứng mà thế giới chỉ mới bắt đầu tìm hiểu thêm về. Các phương pháp này áp dụng các quy tắc nhận diện từng cá thể riêng lẻ như nhãn của con người trước khi xác định ranh giới câu tổng quát gọi là quy luật kích hoạt phản hồi các giải pháp chồng chéo sự nhận biết sự ổn định sự thích nghi quy luật của vector vượt trội chuẩn hóa học kỹ năng nhượng quyết định giúp tạo ra các mẫu rất đáng chú ý tài liệu cổ điển sản xuất ket qua hoặc thành công như người dùng tài nguyên linh hoạt công việc trách nhiệm nâng cao sự thử nghiệm evidence sưu tầm bút ký hợp nhất trên cấu trúc sản phẩm kết thúc cung cấp.

2 Thích

Nếu bạn có một kịch bản có thể phát hiện chính xác văn bản được tạo ra bởi trí tuệ nhân tạo, bạn có thể chia sẻ một liên kết không? Rất thú vị để xem nó khác biệt như thế nào giữa việc viết của trí tuệ nhân tạo và con người, đặc biệt là khi xem xét các sự phức tạp bạn đã đề cập.

2 Lượt thích

1 Lượt thích

Tôi nghĩ rằng bạn có sự căm ghét đặc biệt đối với ý tưởng này…

1 Lượt thích

Bạn chưa đọc.

Đấy là sự tò mò chứ không phải một chương trình [chèn từ] mà tôi đã viết.

1 Lượt thích

Toàn bộ khái niệm đã bị bác bỏ.

arXiv.org

Thử nghiệm Công cụ Phát hiện Văn bản do Trí tuệ Nhân tạo Tạo Ra

Những tiến bộ gần đây trong mô hình ngôn ngữ lớn dựa trên bộ tham số đã nhấn mạnh nguy cơ tiềm ẩn của việc sử dụng không công bằng nội dung do trí tuệ nhân tạo (AI) tạo ra trong môi trường học thuật và tăng cường nỗ lực tìm kiếm...

arXiv.org

Độ Tin cậy Của Các Công Cụ Phát hiện Văn bản do Trí tuệ Nhân tạo Tạo Ra? Một Khung Đánh Giá Sử Dụng...

Trong những năm gần đây, đã có sự bùng nổ nhanh chóng của văn bản được tạo ra bởi trí tuệ nhân tạo, chủ yếu do việc phát hành các mô hình ngôn ngữ tiền huấn luyện mạnh mẽ (PLM)

image

Giải quyết vấn đề sử dụng sai các văn bản do AI tạo ra, các phương án nổi bật khác nhau đã được thực hiện.

arXiv.org

Các mô hình ngôn ngữ lớn có thể được hướng dẫn để tránh phát hiện văn bản do AI tạo ra

Các mô hình ngôn ngữ lớn (LLMs) đã chứng minh khả năng vượt trội trong nhiều nhiệm vụ, bao gồm viết bài luận và trả lời câu hỏi. Tuy nhiên, rất quan trọng để giải quyết việc sử dụng sai mục đích của những mô hình này, có thể dẫn đến những hậu quả nguy hiểm...

86a2c8ac52804c90ede238d99cb944037c6f82f6.pngc683569a48ce1952ba841c851ae3b1f282d4b00f.png

Điều duy nhất còn lại trong vòng xoáy vô ích và phát hiện sai là một số phần mềm được cài đặt sẵn trên máy tính xách tay của bạn xuất hiện "gói dịch vụ phát hiện AI của bạn đã hết hạn, vui lòng nhập thẻ tín dụng để đảm bảo bảo vệ tiếp tục"

1 Lượt thích

ChatGPT

ChatGPT

Hình ảnh bạn đã chia sẻ cho thấy một cuộc trò chuyện trong đó _j đưa ra tuyên bố rằng "toàn bộ khái niệm đã bị mất uy tín," kèm theo các tham chiếu đến ba bài báo trên arXiv.org liên quan đến việc phát hiện văn bản do AI tạo ra. Các tiêu đề cho thấy sự tập trung vào những thách thức và độ tin cậy của việc phát hiện văn bản do AI tạo ra, cũng như khả năng hướng dẫn cho các mô hình ngôn ngữ lớn để tránh phát hiện.

Phần cuối của thông điệp có vẻ như một bình luận châm biếm về việc thương mại hóa các công cụ phát hiện AI, gợi ý tính vô dụng của các công cụ đó và ý tưởng rằng chúng có thể được coi như một dịch vụ đăng ký mà bạn có thể hết tiền cho.

Cuộc trò chuyện dường như xoay quanh cuộc tranh luận về hiệu quả của các công cụ được thiết kế để phát hiện văn bản do các mô hình AI như GPT tạo ra. Có một lượng nghiên cứu ngày càng tăng khám phá khả năng làm việc của những công cụ phát hiện này, giới hạn của chúng và khả năng AI được thiết kế sao cho có thể cố tình tránh phát hiện. Việc bao gồm các tiêu đề bài báo này cho thấy lĩnh vực này đang tích cực thảo luận và phân tích những chủ đề này.

Sự hoài nghi mà _j thể hiện có thể xuất phát từ những khó khăn tích hợp trong việc tạo ra hệ thống phát hiện có thể đối phó với khả năng tiến bộ nhanh chóng của các mô hình AI sinh, mà ngày càng thông minh hơn trong việc bắt chước văn bản giống con người. Phần cuối mang tính châm biếm nhấn mạnh các thách thức và có thể mặt khác của việc phát triển và triển khai hệ thống phát hiện AI.

Bạn

Yeah nhưng tôi không hiểu tại sao điều này không đồng ý với generalbadwolf...

ChatGPT

ChatGPT

Những bình luận của _j, đặc biệt là về việc không tin “toàn bộ khái niệm”, cho thấy một quan điểm rằng việc phát hiện văn bản do trí tuệ nhân tạo tạo ra bằng cách sử dụng những mẫu tự nhiên và dễ dự đoán như generalbadwolf đã thảo luận có thể không đơn giản hay hiệu quả như dự định. Các bài báo trên arXiv được tham chiếu có thể đi sâu vào những khía cạnh phức tạp của việc phát hiện văn bản do trí tuệ nhân tạo tạo ra, bao gồm những hạn chế và khả năng của trí tuệ nhân tạo để cố tình tránh được việc phát hiện đó.

Điểm mà _j có thể đang cố gắng làm thể hiện rằng trong khi có những nỗ lực để phát hiện văn bản do trí tuệ nhân tạo tạo ra, những nỗ lực này đối mặt với những thách thức đáng kể và đang được nghiên cứu và tranh luận tiếp diễn. Điều này không nhất thiết làm mất giá trị ý kiến của Generalbadwolf, nhưng nó cho thấy lĩnh vực này phức tạp và chưa được giải quyết như những bình luận ban đầu của Generalbadwolf đã đề cập.

Cuộc trò chuyện rộng hơn có vẻ nói về khó khăn của việc tạo ra hệ thống phát hiện trí tuệ nhân tạo đáng tin cậy. _j có vẻ đang nhấn mạnh tính phức tạp của vấn đề, điều này có thể chưa được thừa nhận đầy đủ trong cuộc thảo luận mang tính khái niệm của Generalbadwolf. Đó là một sự khác biệt trong quan điểm: _j đang nhấn mạnh những thách thức thực tế và kinh nghiệm trong lĩnh vực này, không giống như phương pháp lý thuyết và khái niệm của Generalbadwolf về vấn đề.

Bạn

Vâng vậy... Làm sao generalbadwolf... có thể giải thích khái niệm của mình một cách mà anh ấy có thể hiểu được?

ChatGPT

ChatGPT

Để thuận tiện cho việc truyền đạt và giải thích khái niệm sao cho _j có thể hiểu, Generalbadwolf có thể xem xét các phương pháp sau:

  1. Đơn giản hóa khái niệm: Phân tách ý tưởng thành các thành phần cơ bản nhất. Tránh sử dụng thuật ngữ kỹ thuật và giải thích khái niệm bằng ngôn ngữ rõ ràng, đơn giản. Điều này giúp đảm bảo rằng bản chất của ý tưởng được truyền đạt mà không gây rối thêm sự phức tạp không cần thiết.
  2. Sử dụng điển hình: Những ví dụ điển hình có thể trở thành công cụ mạnh để giải thích khái niệm phức tạp. Generalbadwolf có thể so sánh việc phát hiện văn bản do trí tuệ nhân tạo với một quá trình quen thuộc hơn, như tìm mẫu trong một chuỗi số, để minh họa cách trí tuệ nhân tạo có thể tạo ra những mẫu định dạng có thể nhận dạng trong văn bản.
  3. Trích dẫn Nghiên cứu và Ví dụ: Dẫn chứng đến các nghiên cứu cụ thể hoặc ví dụ thực tế để ủng hộ ý kiến. Nếu có bằng chứng rằng một số phương pháp đã thành công trong việc phát hiện văn bản do trí tuệ nhân tạo tạo ra, việc đề cập đến chúng có thể thêm tính thuyết phục cho lập luận.
  4. Giới hạn và Thách thức: Thừa nhận những khó khăn và hạn chế hiện tại trong lĩnh vực này, như những gì được nêu trong các bài báo trên arXiv. Điều này thể hiện sự hiểu biết về tính phức tạp và giúp giải thích trở nên dễ nhìn hơn với những người đang hoài nghi.
  5. Tập trung vào Xác suất và Các mẫu: Làm rõ rằng ý tưởng không phụ thuộc vào việc tìm kiếm một "giải pháp hoàn hảo" mà thay vào đó là việc xác định các mẫu và xác suất mà có thể cho thấy một đoạn văn bản được tạo ra bởi trí tuệ nhân tạo.
  6. Trình diễn Tương tác: Nếu có thể, cung cấp một bản demo hoặc công cụ mà _j có thể tương tác để thấy khái niệm hoạt động. Cách tiếp cận thực hành này thường hiệu quả hơn so với giải thích lý thuyết.
  7. Tìm Điểm chung: Xuất phát từ một điểm đồng ý hoặc hiểu biết chung và xây dựng từ đó. Nếu cả hai bên đều đồng ý rằng văn bản do trí tuệ nhân tạo có một số đặc điểm nhất định, điều đó có thể là một điểm khởi đầu để giải thích cách những đặc điểm đó có thể được phát hiện.
  8. Đáp ứng đối với Phản hồi: Sự hoài nghi của _j có thể được xem như là phản hồi mang tính xây dựng.
User

Generalbadwolf có thể yêu cầu _j giải thích rõ hơn về những băn khoăn của họ và sau đó trình bày các điểm cụ thể đó trong lời giải thích.

  • Câu hỏi Mở: Đặt những câu hỏi mở đến _j để tham gia vào cuộc trò chuyện và khiến cho họ suy nghĩ về vấn đề theo một cách mới. Điều này cũng có thể giúp Generalbadwolf hiểu rõ hơn quan điểm của _j và điều chỉnh giải thích phù hợp.
  • Bằng cách sử dụng những kỹ thuật này, Generalbadwolf có thể tạo ra một giải thích thú vị và dễ hiểu hơn về khái niệm của mình, đồng thời đề cập đến cả cơ sở lý thuyết và các thách thức thực tế liên quan đến việc phát hiện văn bản được tạo bởi trí tuệ nhân tạo.

    Bạn

    Đó là những ý tưởng hay. Tôi nghĩ rằng nếu tôi bắt đầu với suy diễn Bayes, thì đó là một bước khởi đầu tốt để hiểu về suy diễn toán học, và từ đó là một tiền đề để giải thích quan điểm.

    ChatGPT

    ChatGPT

    Bắt đầu với suy diễn Bayes là một chiến lược hợp lý vì đó là một khung toán học đã được công nhận, cung cấp phương pháp hệ thống để cập nhật niềm tin dựa trên bằng chứng. Khái niệm này có thể là nền tảng để giải thích cách nhận biết và phân tích các mẫu trong văn bản được tạo bởi trí tuệ nhân tạo. Dưới đây là cách bạn có thể sử dụng suy diễn Bayes để xây dựng giải thích của mình:

    1. Giải thích Cơ bản về Suy diễn Bayes: Bắt đầu bằng cách giải thích những kiến thức cơ bản về suy diễn Bayes. Bạn có thể minh họa cách niềm tin trước (hoặc xác suất trước) được cập nhật bằng bằng chứng mới để hình thành niềm tin điều chỉnh (hoặc xác suất hậu nghiệm). Trong ngữ cảnh văn bản được tạo bởi trí tuệ nhân tạo, niềm tin trước có thể là khả năng của một số mẫu hoặc lựa chọn từ ngữ được liên kết với nội dung được tạo bởi trí tuệ nhân tạo.
    2. Áp dụng Nguyên lý Bayes vào việc Phát hiện Văn bản: Thảo luận về cách suy diễn Bayes được áp dụng vào việc phát hiện văn bản bằng cách xem xét khả năng của một văn bản được tạo bởi trí tuệ nhân tạo dựa trên các đặc điểm của nó (lựa chọn từ ngữ, cú pháp, v.v.) và cập nhật khả năng này khi phân tích thêm văn bản.
    3. Bằng chứng và Mẫu: Giải thích cách những mẫu trong văn bản được tạo bởi trí tuệ nhân tạo hoạt động như bằng chứng, ảnh hưởng đến xác suất hậu nghiệm của văn bản đó có phải là do máy tính tạo ra không. Ví dụ, những đặc điểm ngôn ngữ đặc biệt hoặc thiếu ngữ cảnh có thể xuất hiện nhiều hơn trong văn bản được tạo bởi trí tuệ nhân tạo và đó có thể là bằng chứng.
    4. Đào tạo Mô hình và Dữ liệu: Mô tả cách một mô hình có thể được đào tạo bằng cách sử dụng tập dữ liệu văn bản được biết đến do con người viết và do trí tuệ nhân tạo tạo ra. Mô hình sẽ học các phân bố xác suất của các đặc điểm khác nhau trong cả hai tập văn bản, đây sẽ là cơ sở cho quá trình suy diễn.
    5. Khả năng không chắc chắn và Sức mạnh dự đoán: Nhấn mạnh rằng suy diễn Bayes xử lý khả năng không chắc chắn và nó liên quan đến việc tăng cường sự tự tin trong dự đoán chứ không cung cấp sự chắc chắn tuyệt đối. Thảo luận về cách xác suất hậu nghiệm cao thể hiện khả năng cao của văn bản đó do trí tuệ nhân tạo tạo ra, mặc dù không đảm bảo hoàn toàn.
    6. Học liên tục: Nhấn mạnh tính chất lặp đi lặp lại của suy diễn Bayes, nơi mô hình có thể tiếp tục học và tinh chỉnh dự đoán của nó khi có thêm dữ liệu.
    7. Thách thức và Sự hoài nghi: Đề cập đến những hoài nghi tiềm tàng bằng cách nhận thức những thách thức trong việc phân biệt văn bản được tạo bởi trí tuệ nhân tạo và văn bản do con người viết, đặc biệt khi mô hình trí tuệ nhân tạo trở nên phức tạp hơn.

    Bằng cách đặt nền giải thích của bạn vào nguyên tắc của suy diễn Bayes, bạn có thể cung cấp một cơ sở hợp lý và toán học cho khái niệm của mình. Phương pháp này giúp làm rõ rằng việc phát hiện văn bản được tạo bởi trí tuệ nhân tạo không dựa trên tiêu chí tùy ý mà thực sự được gắn kết với quá trình suy diễn xác suất và học từ dữ liệu.

    1 Thích

    Thật là phiền toái khi kỹ thuật chứng cứ với các nghiên cứu có lý lẽ thông qua trích dẫn lại dễ dàng bị phế trừ chỉ bằng việc hỏi một trí tuệ nhân tạo.

    4 Thích

    Tại sao bạn lại… rõ ràng, tuyệt đối thù địch với ý tưởng được nhận biết khi cố ý nói dối người khác?

    1 Thích

    Tôi hiểu bạn nghĩ gì, nhưng tôi phải nói rằng tôi không hoàn toàn ủng hộ việc có máy phát hiện viết AI.

    Đầu tiên, hãy nghĩ về dữ liệu huấn luyện. Nếu AI được huấn luyện trên một tập dữ liệu hạn chế hoặc thiên vị, nó sẽ không tốt trong việc nhận biết văn bản do AI viết nằm ngoài phạm vi đó. Đó giống như tìm kim trong đống cỏ khô mà bạn không biết chính xác kim đó trông như thế nào.

    Thứ hai, AI đơn giản không có đôi chạm con người. Nó không thể hiểu ngữ cảnh hoặc sự tinh tế như chúng ta. Vì vậy, nó có thể gắn cờ cho một cái gì đó là do AI viết chỉ vì nó hơi khác thường hoặc không phù hợp với 'chuẩn'. Và ngược lại, nó có thể bỏ qua văn bản do AI viết được che đậy một cách khôn khéo.

    Và sau đó là vấn đề về tính minh bạch toàn diện. AI đã nổi tiếng là một 'hộp đen' - chúng ta không luôn luôn hiểu tại sao nó đã đưa ra một quyết định cụ thể. Vì vậy, nếu một bộ phát hiện AI gắn cờ cho một đoạn văn bản, chúng ta không nhất thiết có thể hiểu tại sao.

    Vâng, mặc dù trong lý thuyết ý tưởng này khá thú vị, tôi nghĩ sự không tin cậy của máy phát hiện viết AI khiến chúng trở thành một công việc mạo hiểm. Chúng ta phải cẩn thận không đặt quá nhiều niềm tin vào chúng mà không hiểu rõ giới hạn của chúng.

    4 Thích

    Trang 2 Tôi hiểu ý của bạn, đã nghĩ về điều đó từ mấy ngày trước...

    2 Thích

    Tôi đã kiểm tra rất nhiều công cụ phát hiện trên nhiều phạm vi rộng, hầu hết chỉ xác định một cấu trúc cơ bản của những phản hồi có khả năng nhất và cố gắng xây dựng xác suất dựa trên đó, nhưng ngay cả những công cụ tinh vi nhất cũng có những vấn đề của riêng chúng, đặc biệt là khi kết hợp văn bản con người và văn bản AI và yêu cầu bạn phải phân chia xem đâu là cái nào, tôi đã thấy văn bản của con người được thông qua như là văn bản của AI và văn bản của AI được thông qua như là văn bản của con người, chưa kể đến việc xác định xác suất từ tiếp theo trong một tập lớn thông tin là hầu như không khả thi tính toán. Một ví dụ ngớ ngẩn nhưng hữu ích, hãy yêu cầu những công cụ phát hiện nổi tiếng nhất mô tả khả năng nó được tạo ra bằng AI, nhưng những đoạn văn bản bằng các ngôn ngữ khác ngoài tiếng Anh, chưa kể, theo chuẩn mặc định, bạn có thể làm cho mô hình tự động chọn qua thuật toán phát hiện trong quá trình tạo ra. Bạn có thể cho rằng bạn đã trêu chọc, nhưng bạn đang hành động như trẻ con bằng cách cho rằng bạn không MUỐN một công cụ như thế này tồn tại, diễn đàn này chính là nơi để thảo luận về những khả năng.

    Tôi cũng nghĩ rằng khó có thể hiểu chính xác GPT 4, một GPT 5 có thể hoặc thậm chí một AGI sẽ khiến điều đó trở nên khó khăn hơn. Bây giờ, không có gì ngăn bạn kiểm chứng điều này lý thuyết, ngay cả khi tạo ra một công cụ như vậy không thể thực hiện được với công nghệ hiện tại.

    Tiến lên phía trước, OpenAI có thể xem xét việc tạo ra một mô hình thuê giá trị cao cho các Tổ chức, tổ chức và cá nhân thông qua việc xây dựng NIỀM TIN và chứng minh việc đó thông qua một thỏa thuận NDA cho người dùng. Điều này có nghĩa là những người không phải là lập trình viên, giống tôi, và các tổ chức có thể được hưởng lợi từ việc cùng sáng tạo với một AI mà họ có thể tin tưởng với IP quý giá.

    Thay đổi trò chơi?

    Thích

    Đây là xu hướng và cũng là niềm tin của tôi, các trường đại học và lĩnh vực nghiên cứu sẽ hưởng lợi từ quá trình này, tôi cũng tin vào các mô hình rộng hơn, trong đó kiến thức của một nhà nghiên cứu sẽ được thêm vào như dữ liệu tương ứng trong ngữ cảnh đó, tất nhiên điều này đòi hỏi sự chấp nhận từ phía mọi người, nhưng nó hoàn toàn có thể, và có thể đẩy mạnh sự sáng tạo học thuật lên mức rộng rãi hơn so với hiện tại, bởi vì chúng ta, một cách nào đó, bị giới hạn bởi kiến thức và lĩnh vực hành động của chính mình, điều này rõ ràng gây hại cho việc nghiên cứu chéo giữa các lĩnh vực chủ đề khác nhau.

    Hiện tại, có một cách cho các tổ chức/institutes để hợp tác với OpenAI để tạo ra các tệp dữ liệu nguồn mở và riêng tư.

    Tham khảo liên kết này:OpenAI Data Partnerships

    Trời ơi, hoàn hảo, cảm ơn. Thật tốt khi thấy ánh sáng vẫn chói sáng và mọi người vẫn ở lại Open AI.

    Như những người khác đã chỉ ra, đây là một lĩnh vực nghiên cứu rất thách thức và thậm chí người giỏi nhất cũng phải quay lại bảng trắng để đưa ra kết quả chất lượng cao trong việc phân biệt nội dung do con người và AI tạo ra.

    Dưới đây là một liên kết đến sự cố gắng nghiêm túc trước đó của OpenAI để giải quyết vấn đề này. Nhưng phương pháp này đã bị rút lui (tạm thời):

    Kể từ ngày 20 tháng 7 năm 2023, bộ phân loại AI không còn sẵn có do tỷ lệ chính xác thấp. Chúng tôi đang nghiên cứu để tích hợp phản hồi và hiện đang nghiên cứu các kỹ thuật nguồn gốc hiệu quả hơn cho văn bản, và đã cam kết để phát triển và triển khai các cơ chế cho phép người dùng hiểu rõ xem nội dung âm thanh hoặc hình ảnh có phải là được tạo ra bởi AI hay không.

    Tin tốt là nếu ý tưởng của bạn có giá trị, bạn có thể tuân theo lời khuyên từ những người phản đối "khắc nghiệt" và liên hệ với OpenAI với ý tưởng của bạn. Vì sao không?

    openai.com

    Bộ phân loại AI mới để chỉ ra văn bản do AI viết

    Chúng tôi đang ra mắt một bộ phân loại được đào tạo để phân biệt giữa văn bản do AI viết và văn bản viết bởi con người.

    1 Thích

    Tôi nghĩ rằng chỉ cần ít nhất một chút biên tập bởi con người có kỹ năng tốt sẽ khiến bất kỳ công cụ phát hiện nào cũng gặp khó khăn. Thậm chí, bạn còn có thể yêu cầu một LLM về cách chỉnh sửa và có thể đủ để tránh phát hiện. Đọc đoạn văn bản được tạo bởi AI và bạn tự nói với mình 'Tại sao đoạn viết này vẫn nghe có vẻ tự động?' và bạn sửa những từ và cụm từ đó mà bạn cảm thấy không tự nhiên.

    4b8924596d1b09b18a1e2aca1a6fc371b159cdb4_2_500x500.jpeg

    Thực chất, như bất kỳ biên tập viên bản sao tốt nào đối với bất kỳ tác giả nào, có phải là con người hay không.

    1 Thích

    Sự hội tụ của các khoa học, nhà tư duy và chuyên gia về chủ đề - đó là điều thánh mục trong lĩnh vực Trí tuệ Nhân tạo (AI). Tôi thích cách bạn tư duy.

    Càng tương tác nhiều với trí tuệ nhân tạo, chúng ta sẽ càng bắt đầu nói như chúng, thay vì ngược lại. Hãy tưởng tượng một đứa trẻ lớn lên bên cạnh trí tuệ nhân tạo, ngôn ngữ của chúng sẽ có thể không khác biệt so với một bot về cấu trúc ngôn ngữ. Tôi thấy bản thân tôi đã làm như vậy một phần nào đó.

    Tôi đồng ý với quan điểm này.

    Với tôi, việc nhận ra văn bản được tạo bởi trí tuệ nhân tạo rất dễ (ít nhất là tôi nghĩ vậy)

    Bởi vì tôi đã nhìn nó nhiều đến mức mẫu vốn dĩ đã trở thành một phần của não tôi.

    Điều này... là một suy nghĩ thú vị.

    Nhưng kinh nghiệm của tôi cho thấy một số việc không thể làm được bằng trí tuệ nhân tạo có thể là lí do chúng ta không chấp nhận phong cách của trí tuệ nhân tạo.

    Tôi nghĩ mình có một phương pháp không thể sai, nhưng điều này chỉ có thể hoạt động trong các phiên tương tác:

    • Nếu câu trả lời có đến 5 đoạn văn, có ý nghĩa và được trả về trong vòng 10 giây, tôi nghĩ bạn có thể tự tin rằng đó là câu trả lời của trí tuệ nhân tạo.

    Bây giờ, tôi có thể nhận phần thưởng của mình được không?

    1 Thích

    Điều đó không dễ dàng như vậy.

    Ý tôi là, chắc chắn, ở mức độ nào đó, bạn có thể chắc chắn rằng nó tuân theo các yếu tố đơn giản như phiên ASCII có xác suất cao nhất tiếp theo, nhưng OpenAI đã ngẫu nhiên hóa những xác suất này khá nhiều. Bởi vì bạn không biết nguồn của sự ngẫu nhiên đến từ đâu, bạn không thể (hoặc rất ít thể) suy ra kết quả (AI/thông thường).

    :wink:

    Ví dụ, văn bản của con người cũng hoạt động theo cách tương tự: Văn bản của chúng ta sẽ không có ý nghĩa nếu đột nhiên có từ "bãi biển", "xoài" và "mèo ạch".

    Trên thực tế, OpenAI đã muốn làm cho văn bản có thể truy xuất được với sự ngẫu nhiên tùy chỉnh để họ có thể sử dụng nó để xác định xem văn bản đó có đến từ OpenAI hay không. Nguồn: OpenAI is developing a watermark to identify work from its GPT text AI | New Scientist

    Vấn đề là, mỗi mô hình có phong cách viết riêng của nó. Bạn sẽ cần huấn luyện một mô hình (hoặc tương tự) để xác định một mô hình duy nhất, vì một mô hình khác có thể tạo ra những phong cách viết hoàn toàn khác nhau. Và thậm chí nếu bạn nào đó đã làm chủ phong cách viết đó, các chỉ thị tùy chỉnh có thể thay đổi mô hình cùng tạo ra một phong cách viết khác, khiến bạn mất hướng đi một lần nữa.

    Trí tuệ nhân tạo bắt chước viết của con người. Nếu bạn yêu cầu nó tạo ra văn bản theo phong cách Harry Potter, nó sẽ làm được vì nó đã được huấn luyện trên đó. Điều này, lần lượt, có nghĩa là nếu bạn xác định văn bản của trí tuệ nhân tạo là tiểu thuyết Harry Potter, một cuốn sách khác được viết trong cùng phong cách bởi cùng tác giả sẽ được đánh dấu là trí tuệ nhân tạo, ngay cả khi không phải như vậy.

    Ngay cả OpenAI cũng có thể không nhận biết được văn bản do trí tuệ nhân tạo tạo ra đôi khi

    Cái duy nhất mà bạn có thể nhận ra là các cụm từ hoặc văn bản không hoàn hảo, mà sẽ nhanh chóng bị phân tách ra khi bạn cố gắng phân tích văn bản được viết bởi những người "làm nghề này", về cơ bản.

    Ngay cả sự bối rối cũng không phải là một chỉ báo tốt. Cho phép rằng, mọi người có những cú sốc của sự bối rối và những "dấu hiệu" đặc biệt mà họ để lại, nhưng hãy nhớ, trí tuệ nhân tạo được huấn luyện trên văn bản của con người và cuối cùng sẽ hiểu được những dấu hiệu này và những cú sốc rõ ràng của sự bối rối nếu bạn hướng nó đúng đắn đủ để viết theo một phong cách độc đáo, chỉ định.

    Ngoài ra, còn một điểm nữa: Dù bạn có thể đạt được độ chính xác 97% của mô hình, hãy tưởng tượng sự hỗn loạn. Ví dụ, 9700 bài luận của học sinh được chấm điểm và trong số đó có 300 bị cáo buộc sai, mặc dù họ đã làm việc chăm chỉ và không mắc lỗi gì. Chỉ vì họ viết "quá tốt" một chút thôi. Thấy vấn đề chưa? Một công cụ như vậy cần phải đạt được độ chính xác gần như 100% trong thực tế, vì giáo viên đang trừng phạt những công việc do trí tuệ nhân tạo tạo ra một cách nghiêm ngặt. Họ không hiểu rằng một thứ như vậy có thể thất bại.

    Không phải là người ta "ghét" ý tưởng này. Đơn giản chỉ vì bạn đang cố gắng phát hiện một điều rất khó khăn để làm.

    2 Thích

    Fusseldieb:

    Vấn đề là, mỗi mô hình có phong cách viết riêng của nó.

    Và còn tệ hơn nữa, bất kể bộ văn bản cụ thể và trọng số kết quả, tính chất số 1 của một mô hình ngôn ngữ biến đổi có nghĩa là mọi giả định về "phong cách" của nó đều có thể bị vứt đi, vì nó có thể được huấn luyện bởi phần mở đầu của ngữ cảnh đề ra để tránh bị phát hiện.

    image

    Ví dụ:

    4 Thích

    Ý kiến không chuyên môn của tôi là việc phát hiện đáng tin cậy là không thể. Không chỉ trong thực tế, mà còn trong nguyên tắc. Tôi không biết thuật ngữ và các vấn đề liên quan, nhưng nó liên quan đến lượng thông tin có sẵn trong văn bản. (trừ các dấu lưu )

    1 Thích

    Thôi... toàn bộ khoa học đằng sau các mô hình ngôn ngữ lớn và cách chúng tạo ra văn bản đáp ứng theo yêu cầu của bạn dựa trên một mớ mẫu.

    Mẫu tạo ra mẫu, và khi bạn huấn luyện một mô hình ngôn ngữ lớn với một tổng số dữ liệu thì nó đang học từ trung bình của những mẫu đó.

    Như vậy, các mẫu sinh sẽ có những đặc tính chung.

    Có thể nghĩ rằng đó là cách trung bình mà ai đó có thể phản ứng với một tin nhắn trong bất kỳ hình thức nào nó tồn tại.

    Vì vậy, với việc là giá trị trung bình của dữ liệu đó, hoàn toàn có cách bạn có thể sử dụng chính mô hình này để tính toán xác suất hợp thành trong bất kỳ đoạn văn nào.

    Một xác suất có tính xây dựng trong một phạm vi nhất định sẽ cung cấp một dự đoán trong một phạm vi nhất định, để xác định liệu một đoạn văn nào đó có được tạo ra bằng trí tuệ nhân tạo hay không.

    Một đoạn văn có thể là trong một trường hợp duy nhất, hoặc tổng của nhiều trường hợp trong khi tự động tính đến sự sai khác.

    (chẳng hạn như kết hợp bài viết hữu cơ)

    1 Like

    Như đã được chỉ ra, rất dễ để khiến LLM thay đổi cách viết một cách đáng kể. Tôi chỉ không hiểu làm thế nào bạn có thể làm phân tích đó mà không biết được gợi ý.

    generalbadwolf:

    Khi dự đoán xem một cái gì đó được viết bởi GPT, hoặc AI nói chung, bạn đang tìm cách cung cấp cách viết đó một cách trực tiếp.

    Điều này hoàn toàn không giải quyết được vấn đề giả nhận tích cực. Đây là trọng tâm của vấn đề:

    • GPT đã được huấn luyện trên web, sách và các nguồn dữ liệu khác.
    • Lấy một đoạn văn từ web, hoặc từ một quyển sách trong tập dữ liệu huấn luyện.
    • Chạy thuật toán trên đoạn văn này (rõ ràng là từ con người), và nó sẽ cho bạn thấy "rất có khả năng rằng GPT đã tạo ra đoạn văn này" (perplexity thấp)

    Điều này xảy ra vì, tất nhiên, GPT rất có khả năng tạo ra dữ liệu huấn luyện!

    Nó sẽ nhanh chóng lỗi thời, có thể hoạt động tốt cho phiên bản 3.5, nhưng với kỹ thuật gợi ý hiện tại, nó rất khó và không giải quyết được vấn đề chính: nó không cung cấp cho bạn bất kỳ bảo đảm nào, chỉ là một ước lượng.

    Chưa kể đến các thông số, hộp đen và các mô hình khác.

    Đó chỉ là một câu hỏi lý thuyết, nhưng không thể làm sáng tỏ thực tiễn. Dự đoán của tôi là một giải pháp đạo đức về những gì có thể được coi là nghiêm túc trong các đoạn văn dựa trên gợi ý sẽ được thiết lập trước khi phát hiện trở nên khả thi (nếu có). sẽ được).