Thobey Campion, từng làm việc hơn 15 năm tại Vice làm trưởng phòng xuất bản, sau đó trở thành một nhà văn độc lập và có được một hợp đồng làm phim cho một trong những câu chuyện của mình. Anh ta nhận thấy một thách thức lặp đi lặp lại trong truyền thông: chuyển đổi văn bản thành hình ảnh là 'rất không hiệu quả và rất chậm.'
Khi trí tuệ nhân tạo không thể sinh sản trở nên phổ biến vào năm 2022, và các công cụ tạo hình ảnh như Midjourney và Stable Diffusion được phổ biến, Campion nhìn thấy một cơ hội để giải quyết thách thức hình ảnh câu chuyện mà anh đã trải qua.
Anh bắt đầu Lore Machine cùng Moises Sanabria, cố vấn chính của công ty, và Kutlu Mizrak, người đảm nhiệm xử lý ngôn ngữ tự nhiên.
Lore Machine chuyển đổi câu chuyện văn bản thành hình ảnh, đảm bảo tính nhất quán về phong cách cho các nhân vật, địa điểm và yếu tố lặp lại.
"Việc tạo nhiều hình ảnh mà có cảm giác như chúng đều thuộc một câu chuyện giống như một cuộc chiến giữa con người và máy móc đang hướng tới mục tiêu riêng của nó," Campion nói về các công cụ tạo hình ảnh AI khác. "Thách thức về tính nhất quán này đã trở thành mục tiêu cao cả của tôi."
Người dùng có thể tải lên câu chuyện của mình lên nền tảng bằng bất kỳ định dạng nào, bao gồm thơ, truyện ngắn và kịch bản. Sau đó, bộ xử lý ngôn ngữ tự nhiên của Lore Machine tổng hợp văn bản để xác định nhân vật và thuộc tính của họ, địa điểm, ánh sáng, đạo cụ và tạo ra các bản tóm tắt của các cảnh khác nhau.
Sau khi xử lý, trí tuệ nhân tạo chuyển đổi công việc văn bản thành một bộ sưu tập hình ảnh, hoặc "storyboard," với phương pháp kép kết hợp các mô hình ngôn ngữ lớn như ChatGPT và transformer như Stable Diffusion.
Người dùng hiện tại có thể lựa chọn giữa tám "phong cách" cho storyboard của họ, như tranh màu nước, manga hoặc nét vẽ đường.
Campion nói rằng công ty dự định bắt đầu hợp tác với các nghệ sĩ để tạo ra các cài đặt phong cách tùy chỉnh cho người dùng mua trên thị trường. Người nghệ sĩ sẽ nhận 100% lợi nhuận từ việc bán các cài đặt này.
"Dưới đây là một ví dụ về các phong cách câu chuyện khác nhau mà Lore Machine cung cấp." Công cụ sử dụng OpenAI và Stable Diffusion, nhưng mục tiêu cuối cùng của nó là trở thành "không kén chọn generator," cho phép người dùng lựa chọn giữa các công cụ tạo văn bản và hình ảnh khác nhau (ví dụ: Stable Diffusion so với Midjourney) tùy thuộc vào sở thích và giá trị của họ.
Hiện tại, nền tảng chỉ giới hạn việc tạo hình ảnh, nhưng Campion cho biết công ty đang phát triển khả năng cho phép tạo nội dung hoạt hình, cũng như "âm thanh sinh sinh," để người dùng có thể tạo ra một bản nhạc phim kèm theo câu chuyện của mình.
Sau khi storyboard đã được tạo ra, người dùng có thể nhấp vào từng hình ảnh và tạo lại nó hoặc chỉnh sửa cho đến khi đạt được kết quả phù hợp với nhu cầu của họ.
Hiện tại, Lore Machine đang ở phiên bản beta và được sử dụng bởi các nhà biên kịch, nghệ sĩ, nhà văn, nhà vẽ truyện tranh và hoạt họa, với hơn 12.000 người đang đợi, công ty cho biết.
Cho đến nay, Lore Machine đã có những hợp tác thành công với phân vùng chơi game Omen của HP, hãng sản xuất phim Anonymous Content và nhà văn khoa học viễn tưởng Phil Gelatt để sản xuất một manga bằng cách sử dụng nền tảng này.
Nhóm của Lore Machine muốn giúp các nhà văn tạo ra hình ảnh bổ sung cho câu chuyện của họ, nhằm mở rộng đối tượng độc giả và tham gia nhiều hơn vào sự phát triển của tác phẩm.
"Cùng với Hollywood, các nhà văn tạo nên nền tảng cho toàn bộ ngành giải trí và sau đó lại bị bỏ lại sau lưng," Campion nói. "Tầm nhìn của chúng tôi là nếu nhà văn có thể giúp hình thành trải nghiệm hình ảnh cho câu chuyện của mình với Lore Machine, họ có thể đóng vai trò lớn hơn trong quá trình sản xuất phim và trải nghiệm song hành."
Campion cho biết ông dự kiến Lore Machine sẽ được công khai sử dụng vào đầu năm 2024.
Dưới đây là một video của "người phát ngôn" của Lore Machine trình bày một cách chi tiết về cách hoạt động của trí tuệ nhân tạo:
Và đây là một ví dụ về một truyện tranh dựa trên tác phẩm Rime of the Ancient Mariner của Samuel T. Coleridge được tạo ra bằng cách sử dụng Lore Machine.