OpenAI ra mắt Sora, công cụ AI tạo video ngắn ấn tượng

OpenAI, công ty phát triển trí tuệ nhân tạo nổi tiếng với ChatGPT và DALL-E, vừa công bố một mô hình video AI mới có tên là Sora. Đây được xem là bước tiến lớn trong lĩnh vực chuyển văn bản sang video, với khả năng tạo ra các video chi tiết, chất lượng cao chỉ dựa trên mô tả văn bản ngắn.

 

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

OpenAI ra mắt Sora, công cụ AI tạo video ngắn

Nhà Khoa học Tim Brooks tại OpenA cho biết: “Chúng tôi nghĩ rằng việc xây dựng các mô hình có thể hiểu video và hiểu tất cả những tương tác phức tạp của thế giới của chúng ta là một bước quan trọng cho tất cả các hệ thống AI trong tương lai”.

Các mẫu video mà OpenAI chia sẻ trong bài công bố đã cho thấy Sora đã vượt xa các giải pháp khác về chất lượng, kết cấu và chiều sâu. Trong những video đó, Sora đã hoàn toàn “vẽ” ra cả một cảnh tượng nhất quán từ góc nhìn, sinh động đến màu sắc, không chỉ tái tạo mà còn thêm thắt những chi tiết riêng để tăng sự hấp dẫn cho video. 

Đặc biệt, Sora dường như đã nắm bắt được mối liên hệ không gian giữa các vật thể, bằng cách di chuyển camera, zoom hình ảnh mà không lo bị vật thể nhảy mất, biến mất. Điều này thể hiện sự thông minh và khả năng “ hiểu” video của mô hình.

Các video minh họa do Sora tạo ra cho thấy mô hình này áp dụng các công nghệ hiện đại nhất để mô phỏng cảnh vật, chuyển động nhân vật, hiệu ứng 3D và ánh sáng rất sống động.

Sora giữ các đối tượng trong video luôn nhất quán kể cả khi chúng tạm thời biến mất khỏi tầm nhìn, điều mà nhiều mô hình video AI trước đây gặp khó khăn.

>> Xem ngay bộ sưu tập video được tạo từ Sora cực kỳ sinh động có kèm theo Prompt tại mỗi video tại https://openai.com/sora 

Video Sora của OpenAI được giới thieeuk, có Prompt tham khảo - Nguồn OpenAI
Một ảnh từ video của công cụ Sora tạo ra, có kèm Prompt tham khảo - Nguồn OpenAI

Mặc dù vẫn còn một số hạn chế về khả năng nhớ dài hạn các vật thể hay duy trì sự logic của video, Sora cũng đã cho thấy tiềm năng rất lớn, có thể được ứng dụng rộng rãi trong các ngành sản xuất video, giải trí, truyền thông,... như một “nghệ sĩ hoạt họa” siêu nhanh và thông minh. 

Hiện mô hình đang được chia sẻ với các nhóm kiểm tra an toàn chuyên nghiệp để thử nghiệm các tình huống nguy cơ. OpenAI cũng mời các nhà làm phim, nghệ thuật đóng góp ý kiến giúp Sora hoàn thiện và nâng cao khả năng ứng dụng trong các ngành sáng tạo.

Sự cẩn trọng đó là dễ hiểu bởi sự lạm dụng sức mạnh công nghệ mạnh như Sora là rất lớn. Việc tạo ra video giả mạo chân thực có thể dùng để thao túng thông tin, xúc phạm danh dự cá nhân và có nhiều hậu quả nghiêm trọng. Do đó OpenAI muốn "thử nghiệm" kỹ càng trước khi quyết định đưa Sora “trình làng”.

Cụ thể, họ đang xây dựng các công cụ như bộ lọc ngăn chặn yêu cầu tạo video xấu, bạo lực; gắn nhãn metadata giúp xác định nguồn gốc đoạn video; phát triển thuật toán phân biệt thật giả. Các chính sách an toàn, điều khoản sử dụng cũng sẽ được thiết lập trước khi phát hành cho cộng đồng.

Về mặt công nghệ, Sora áp dụng cách tiếp cận mới pha trộn mô hình khuếch tán (diffusion model) và mạng nơ-ron transformer. Nhờ đó, mô hình có thể xử lý thông tin video đầu vào hiệu quả hơn, duy trì sự chân thực và nhất quán giữa các cảnh, phân đoạn đoạn phim.

OpenAI kỳ vọng Sora sẽ có thể được phát hành chính thức trong tương lai gần, mang lại một công cụ đầy tiềm năng cho những người làm nội dung sáng tạo, đồng thời thúc đẩy những tiến bộ mới trong lĩnh vực AI.

Về chúng ta là người dùng, bạn cần tỉnh táo đối mặt với thực tế rằng hầu hết những gì công nghệ mang lại đều có thể có hai mặt tích cực và tiêu cực. Do đó, bên cạnh khía cạnh nghiên cứu, sự cân nhắc kỹ lưỡng về đạo đức và an toàn là vô cùng cần thiết.

Hy vọng những bài học kinh nghiệm từ việc phát triển và ra mắt ChatGPT, DALL-E sẽ giúp OpenAI kiểm soát tốt hơn những rủi ro, tìm ra phương thức tiếp cận phù hợp nhất để công nghệ Sora thực sự trở thành một công cụ thiết thực và an toàn cho cộng đồng.

Hoàng Taba

Kỹ thuật viên

Tác giả Hoàng Taba là kỹ thuật viên sửa chữa điện thoại và SmartWatch với hơn 5 năm kinh nghiệm. Tốt nghiệp Công nghệ Kỹ thuật Điện - Điện Tử tại ĐH HUTECH, HCM

Hỏi đáp (0 lượt hỏi và trả lời)

Đánh giá của bạn :

Thông tin bình luận