Gemini cho tạo hình ảnh AI miễn phí, bạn đã thử chưa?
Từ ngày 10/10, người dùng Gemini (AI tạo sinh của Google) đã có thể tạo hình ảnh miễn phí từ các câu lệnh, không phải mất tiền như GPT-4 hay Midjourney.
Trình tạo hình ảnh AI Imagen 3 của Google hiện đã có sẵn miễn phí cho tất cả người dùng Gemini trên thiết bị di động hoặc máy tính để bàn. Imagen 3 cho hình ảnh tạo sinh chân thực, tuy nhiên vẫn có một hạn chế lớn đối với người dùng miễn phí.
Google gọi Imagen 3 là mô hình tạo ảnh chất lượng cao nhất từ trước đến nay và tuyên bố rằng nó làm theo hướng dẫn của bạn tốt hơn và tạo ra ít dấu vết giả trên ảnh hơn so với các mô hình trước đó. Hạn chế nằm ở chỗ, nếu bạn muốn tạo hình ảnh của con người, bạn cần phải đăng ký Gemini Advanced. Gemini Advanced có giá 19,99 USD (khoảng 500.000 đồng) một tháng.
Không giống như một số trình tạo hình ảnh AI khác, Imagen hoạt động bằng cách chỉ tạo một hình ảnh từ mỗi câu lệnh. Bạn có thể tinh chỉnh hình ảnh bằng cách yêu cầu thay đổi, vì ghi nhớ những gì bạn đã yêu cầu trước đó, nhưng một hình ảnh mới được tạo ra cho mỗi câu lệnh bạn nhập.
Nếu bạn thích bản xem trước, bạn có thể tải xuống hình ảnh với định dạng JPEG có độ phân giải 2048 x 2048. Bạn có thể tải xuống bao nhiêu hình ảnh tùy thích vì không có giới hạn cụ thể hàng ngày cho việc tạo hình ảnh, ngay cả ở cấp miễn phí.
Google cũng cho biết Imagen 3 có thể tạo hình ảnh theo nhiều phong cách khác nhau, từ chân thực, đến tranh vẽ sơn dầu, tranh phong cảnh, động vật, tĩnh vật, thậm chí truyện tranh. Kết quả nhìn chung chấp nhận được ở mức minh họa.
Người viết đã thử nghiệm vài tính năng của trình tạo ảnh này, và nhận ra ngoài việc không tạo được hình người, thì có một số vấn đề như sau:
Đầu tiên, Gemini rất "bướng bỉnh" và mặc dù bạn có thể tùy chỉnh hình ảnh ban đầu bao nhiêu lần tùy thích, việc tùy chỉnh này rất giới hạn. Lấy ví dụ, khi yêu cầu Gemini tạo hình ảnh một chú chó trông buồn rầu bên cạnh một chiếc hồ, hình ảnh đầu tiên đã khá ổn định về chất lượng hiển thị.
Tuy nhiên, khi muốn thay đổi góc chụp (nói đúng hơn là góc vẽ) và màu sắc, như cho hình ảnh rộng hơn, có hình toàn bộ chú chó và phông nền đằng sau vẫn đủ nét, màu sắc ấm hơn, thì kết quả khá thất vọng. Dù yêu cầu bằng cách nào đi nữa, nói rõ ý định nhưng Gemini vẫn chỉ giữ nguyên góc ảnh đó, không thể thay đổi hay làm rộng ra.
Kể cả khi tạo một trang yêu cầu khác, lần này mô tả rõ hình ảnh ngay từ đầu (một chú chó trông buồn bã bên hồ, sử dụng ống kính góc rộng, với độ sâu trường ảnh rộng và chụp toàn bộ chú chó), thì kết quả vẫn như vậy, thậm chí vẫn là cùng một giống chó labrador, chỉ khác màu lông.
Không chó nữa thì sao? Thử yêu cầu Gemini tạo hình ảnh một chú mèo chụp từ xa, ở trên cây, kết quả đầu tiên cho ra khá giống tranh vẽ. Sau khi điều chỉnh, hình ảnh có thật hơn, nhưng dễ dàng nhận ra mặt chú mèo rất giả, không còn chân thực như góc cận. Sau khi thử thêm lần nữa, đến lượt thân cây và lá có chi tiết rất giả.
Động vật như vậy có lẽ đã đủ, thử chuyển sang tạo ảnh phong cảnh xem sao. Khi yêu cầu Gemini tạo hình ảnh bắc cực quang, với mức độ chân thực cao nhất có thể, và ảnh mặt hồ mùa thu thật đẹp ở Canada, thì vẫn khá dễ nhận ra đây là ảnh AI vì chi tiết tái tạo quá mịn, cũng như màu sắc rực rỡ bất thường.
Ngoài hình ảnh phong cách chân thực, Gemini cũng có thể tạo ra hình ảnh theo phong cách mỹ thuật khác như tranh sơn dầu phong cách Phục Hưng, hay thậm chí là tranh Ai Cập cổ đại, truyện tranh phong cách manga (Gemini từ chối tạo tranh không màu). Bạn có thể tự đánh giá kết quả.
Nhìn chung, trình tạo ảnh Gemini của Google không có gì quá xuất sắc hơn các AI khác, trừ việc miễn phí không giới hạn và linh hoạt với nhiều phong cách khác nhau. Bạn đã trải nghiệm với AI này chưa? Hãy chia sẻ với chúng tôi cảm nghĩ bên dưới phần bình luận.
Ý kiến ()