MidJourney đã trở thành một trong những trình tạo ảnh AI ấn tượng nhất hiện nay, và với phiên bản 5.1 mới phát hành, nó đã trở nên mạnh mẽ hơn nhiều. Cập nhật giải thuật có nghĩa là để cho cả người mới bắt đầu, việc tạo ra những tác phẩm nghệ thuật tuyệt đẹp chỉ với ít công sức, và có rất nhiều hình ảnh giả trên hệ thống.
Trình tạo hình ảnh AI đã trở nên phổ biến hơn vào tháng trước sau khi những hình ảnh giả có liên quan đến Đức Giáo Hoàng Francis đang mặc áo khoác phồng trắng của MidJourney được lan truyền rộng rãi. Sự tranh luận về đạo đức của các trình tạo như MidJourney đã diễn ra sau đó ngay lập tức.
Việc sử dụng từ “giáo hoàng” trên MidJourney bây giờ đã bị cấm, nhưng việc tạo ra các hình ảnh giả của những người khác, như Tổng thống Joe Biden, vẫn được phép - có lẽ cho đến khi chúng ta nhìn thấy một bức ảnh virus của Biden đang mặc jumpsuit spandex hồng neon làm yoga tại Phòng Ovan.
MidJourney cũng cho phép người dùng tạo ra những hình ảnh giả chất lượng cao bằng cách sử dụng ảnh làm gợi ý. Tính năng này đã giúp MidJourney trở nên phổ biến hơn do các kết quả ấn tượng mà nó cung cấp và độ dốc học thấp. Hiện tại, nó là mô hình tạo hình ảnh AI phổ biến nhất về lĩnh vực quan tâm của người dùng, vượt qua Dall-e và Stable Diffusion.
Phiên bản nâng cấp mới nhất của MidJourney hứa hẹn cải tiến cách giải thích gợi ý của người dùng. Phiên bản 5.0 được phát hành chỉ cách đó ba tháng và đánh dấu một bước tiến đáng kể từ phiên bản 4.
V5.1 hiện đã có sẵn! Hình ảnh sẽ được tăng khả năng liên kết, sắc nét và tuyệt đẹp hơn. Nó dễ sử dụng hơn và nên phản ứng đáp ứng chính xác hơn theo hướng dẫn. Chúng tôi cũng đã thêm chế độ "RAW" cho người dùng chuyên nghiệp để giảm độ "tự cho" của mô hình của chúng tôi và mang lại cho bạn nhiều kiểm soát sáng tạo hơn.
— Midjourney (@midjourney) ngày 3 tháng 5 năm 2023
Mô hình mới này cung cấp tính liên kết cao hơn, độ chính xác cao hơn cho các gợi ý văn bản, ít hơn các đường biên hoặc hiện tượng văn bản không mong muốn (những thứ kỳ quặc ngẫu nhiên xuất hiện trên ảnh đôi khi), và cho kết quả sắc nét hơn nói chung, theo MidJourney. Điểm nhấn trên bánh kem là phiên bản mới được đào tạo để trở nên "tự cho" hơn.
Tự cho nghĩa là mô hình có sự tự do để sáng tạo hơn khi diễn giải gợi ý của người dùng. Điều này dẫn đến hình ảnh tốt hơn với các gợi ý cơ bản - ngay cả với các lệnh vô lý chỉ bằng một vài từ.
Ví dụ, chỉ đơn giản là so sánh kết quả với các gợi ý "Ví Bitcoin" sử dụng phiên bản 5.1 và 5.0 cho thấy sự khác biệt và cải tiến. Phiên bản 5.1 nghĩ ra một chiếc ví da, với một logo bitcoin thêu và đặt trên một cái bàn. Phiên bản 5 chỉ đơn giản là hiển thị một chiếc ví với một Bitcoin trên một bề mặt trơn.
Phiên bản mới này nhấn mạnh thêm các điểm mạnh đã dẫn đến sự phát triển không ngừng của MidJourney, không quên các người dùng kinh nghiệm hiện có một chế độ RAW nếu họ muốn đạt được kết quả chính xác hơn và ít "tự cho" hơn.
Và những bàn tay với nhiều ngón tay thì sao? Phiên bản MidJourney v5.1 đã cải tiến rất nhiều. Hiển thị tay hiện tại thành công trong hầu hết các trường hợp, mặc dù trình tạo vẫn sản xuất một số lỗi.
Đội MidJourney cho biết chúng ta có thể nhìn thấy phiên bản 5.2 trong tương lai, nâng cao khả năng của công cụ này. Nếu lần thứ ba là duy nhất, thì ngày trong trích dẫn của chúng ta đang sử dụng trình tạo AI, thuật ngữ "tự cho" hơn có thể sẽ không còn nữa.