Đăng ký nhận báo giá



AI mới của Alibaba: biến một bức ảnh thành Video sinh động

(3.3/5) (6 lượt đánh giá)
Cập nhật nội dung: 14/03/2024
VR360
Cập nhật nội dung: 14/03/2024 VR360
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse

Sự tiến triển nhanh chóng của công nghệ AI tạo sinh đã gây ấn tượng mạnh mẽ và đồng thời khiến người ta cảm thấy lo ngại về những hậu quả tiềm ẩn trong tương lai nếu không được sử dụng một cách đúng đắn.

Công nghệ AI tạo sinh đang tiến bộ nhanh chóng hơn cả những gì chúng ta từng tưởng. Trong khi chỉ cách đây không lâu, ChatGPT đã khiến mọi người ngạc nhiên bởi khả năng tạo ra văn bản theo yêu cầu, nhưng hiện nay, các mô hình AI đã vượt xa hơn với sự phức tạp và sự tinh xảo trong tạo ra nội dung.

AI mới của Alibaba: biến một bức ảnh thành Video sinh động

Một thời gian ngắn trước đây, OpenAI đã giới thiệu mô hình Sora, có khả năng tạo ra các video ngắn từ văn bản một cách chân thực, tương tự như các đoạn clip chuyên nghiệp. Và giờ đây, hãng Alibaba của Trung Quốc đã tạo ra một giải pháp tương tự: một mô hình AI có khả năng biến bất kỳ nhân vật nào trong một hình ảnh tĩnh thành một ca sĩ chuyên nghiệp.

Công cụ tạo video AI này được gọi là EMO, viết tắt của Emotive Portrait Alive, đại diện cho một bước tiến mới mẻ trong lĩnh vực này, với khả năng vượt qua mô hình Sora của OpenAI. Trong khi Sora xuất sắc trong việc tái tạo cảnh quan và phong cảnh đẹp mắt, các nhân vật của nó thường trở nên lặng lẽ và không di chuyển. Ngược lại, EMO cho phép nhân vật nói và hát, thể hiện các biểu cảm khuôn mặt một cách chân thực và đồng bộ - ngay cả khi đó là một nhân vật ảo không tồn tại như cô gái trong video giới thiệu của Sora.

Trong khi kỹ thuật deepfake cách đây vài năm chỉ là việc đổi gương mặt bằng AI mà không tái hiện được biểu cảm cũng như yêu cầu sự hỗ trợ từ các clip sẵn có, EMO chỉ cần một hình ảnh tĩnh duy nhất. Đáng chú ý, mô hình AI này cũng có khả năng tạo ra nhân vật với các ngôn ngữ và giọng điệu khác nhau, bao gồm cả tiếng Hàn.

Công cụ Tạo Video AI của Alibaba hoạt động như thế nào

Theo tài liệu nghiên cứu của Alibaba, EMO khai thác một kho dữ liệu lớn về âm thanh và video để học cách tái tạo biểu cảm khuôn mặt một cách tự nhiên. Nó áp dụng một phương pháp khuếch tán, tức là từ từ chuyển đổi hình ảnh tĩnh thành video từng khung hình một, không thông qua bất kỳ quá trình trung gian nào.

Đồng thời, EMO cũng sử dụng hai cơ chế tập trung, một cho hình ảnh tham chiếu và một cho âm thanh, để đảm bảo rằng hoạt ảnh khuôn mặt phản ánh đúng về cả ngoại hình và lời nói của đối tượng. Kết quả là một video trôi chảy và đầy biểu cảm, với sự xuất hiện giống hệt như một người thực sự đang nói chuyện hoặc hát.

AI mới của Alibaba: biến một bức ảnh thành Video sinh động

Trong thời kỳ công nghệ AI phát triển với tốc độ chóng mặt, nhiều cơ hội mới mở ra trong các lĩnh vực như giải trí, giáo dục và giao tiếp. Công cụ tạo video AI như EMO cho phép tái tạo các nhân vật nổi tiếng hoặc lịch sử nói hoặc hát bất cứ điều gì bạn muốn, và tạo ra các hình đại diện ảo không chỉ giống bạn mà còn nghe như bạn. Tuy nhiên, sự tiến bộ này cũng đồng nghĩa với những lo ngại về quyền riêng tư và đạo đức.

EMO có thể dẫn đến việc tạo ra video giả mạo hoặc gây hiểu lầm, ảnh hưởng đến uy tín và độ tin cậy của cá nhân, hoặc thao túng cảm xúc và quan điểm của người xem. Đây là một lưỡi hai lưỡi có thể mang lại kết quả tích cực hoặc tiêu cực, phụ thuộc vào cách sử dụng của nó, tương tự như deepfake hiện nay đang gây lo ngại trong xã hội.

Tiếp tục theo dõi bài viết từ VR360 để được cập nhật liên tục những vấn đề xoay quanh lĩnh vực cô ng nghệ mỗi ngày. Cảm ơn bạn đã quan tâm bài viết lần này của mình.

Bài viết liên quan:

 


LIÊN HỆ HỢP TÁC CÙNG VR360 
VR360 – ĐỔI MỚI ĐỂ KHÁC BIỆT 

- Facebook: https://www.facebook.com/vr360vnvirtualtour/
- Hotline:  0935 690 369  
- Email: infor@vr360.com.vn 
- Địa chỉ:

  • 123 Phạm Huy Thông, Sơn Trà, Đà Nẵng
  • Toà nhà Citilight, số 45 Võ Thị Sáu, Đakao, Quận 1, TP Hồ Chí Minh
  • 3B Đặng Thái Thân, Phan Chu Trinh, Hoàn Kiếm, Hà Nội

Tin tức mới nhất

Sam Altman tiết lộ lý do OpenAI quay xe từ mở sang đóng mã nguồn

Sam Altman tiết lộ lý do OpenAI quay xe từ mở sang đóng mã nguồn

OpenAI đã nhận phải một số chỉ trích vì không "mở" như tên gọi ban đầu. Sam Altman đã giải...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 05/11/2024
Google kết nối quảng cáo với tóm tắt AI

Google kết nối quảng cáo với tóm tắt AI qua tính năng mới

Google vừa giới thiệu một tính năng quảng cáo mới trong AI Overviews, mở ra cơ hội hấp dẫn cho...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 23/10/2024
Google cải tiến công cụ tìm kiếm: AI đang thay đổi mọi thứ

Google cải tiến công cụ tìm kiếm: AI đang thay đổi mọi thứ

Google đang tiến hành cuộc cách mạng đưa AI vào hầu hết mọi phần của quy trình tìm kiếm thông...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 16/10/2024
Google ra mắt mô hình AI LearnLM tập trung vào giáo dục

Google ra mắt mô hình AI LearnLM tập trung vào giáo dục

Google vừa công bố mô hình AI mới mang tên LearnLM, được thiết kế đặc biệt để hỗ trợ việc...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 11/10/2024
Giao diện Symphony Assistant

Tiktok ra mắt Symphony Assistant, trợ lý ảo AI tạo sinh

Tại sự kiện "TikTok Unboxed: Vietnam", TikTok đã giới thiệu bộ công cụ AI có tên Symphony nhằm nâng...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 30/09/2024
OpenAI ra mắt Strawberry: Siêu AI có khả năng gì mới?

OpenAI ra mắt Strawberry: Siêu AI có khả năng gì mới?

OpenAI vừa ra mắt mô hình mới với tên gọi Strawberry, giải quyết các vấn đề mà các mô hình...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/09/2024

Bài viết cùng chủ đề

Sam Altman tiết lộ lý do OpenAI quay xe từ mở sang đóng mã nguồn

Sam Altman tiết lộ lý do OpenAI quay xe từ mở sang đóng mã nguồn

OpenAI đã nhận phải một số chỉ trích vì không "mở" như tên gọi ban đầu. Sam Altman đã giải...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 05/11/2024
Google kết nối quảng cáo với tóm tắt AI

Google kết nối quảng cáo với tóm tắt AI qua tính năng mới

Google vừa giới thiệu một tính năng quảng cáo mới trong AI Overviews, mở ra cơ hội hấp dẫn cho...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 23/10/2024
Google cải tiến công cụ tìm kiếm: AI đang thay đổi mọi thứ

Google cải tiến công cụ tìm kiếm: AI đang thay đổi mọi thứ

Google đang tiến hành cuộc cách mạng đưa AI vào hầu hết mọi phần của quy trình tìm kiếm thông...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 16/10/2024
Google ra mắt mô hình AI LearnLM tập trung vào giáo dục

Google ra mắt mô hình AI LearnLM tập trung vào giáo dục

Google vừa công bố mô hình AI mới mang tên LearnLM, được thiết kế đặc biệt để hỗ trợ việc...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 11/10/2024
Giao diện Symphony Assistant

Tiktok ra mắt Symphony Assistant, trợ lý ảo AI tạo sinh

Tại sự kiện "TikTok Unboxed: Vietnam", TikTok đã giới thiệu bộ công cụ AI có tên Symphony nhằm nâng...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 30/09/2024
OpenAI ra mắt Strawberry: Siêu AI có khả năng gì mới?

OpenAI ra mắt Strawberry: Siêu AI có khả năng gì mới?

OpenAI vừa ra mắt mô hình mới với tên gọi Strawberry, giải quyết các vấn đề mà các mô hình...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/09/2024
Gemini trong Gmail: Trợ thủ đắc lực cho soạn thảo văn bản!

Gemini trong Gmail: Trợ thủ đắc lực cho soạn thảo văn bản!

Google đã nâng cấp công cụ viết Gemini với tính năng "Polish". Nhờ vào các công cụ này, bạn có...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 22/08/2024
AI và Môi Trường: Những thách thức, trách nhiệm xã hội của doanh nghiệp

AI và Môi Trường: Những thách thức, trách nhiệm xã hội của doanh nghiệp

Trí tuệ nhân tạo (AI) đang làm thay đổi nhiều lĩnh vực nhưng cũng đặt ra những thách thức lớn...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 12/08/2024
OpenAI cân nhắc thêm Watermark vào văn bản ChatGPT?

OpenAI cân nhắc thêm Watermark vào văn bản ChatGPT?

OpenAI đang cân nhắc có nên phát hành công cụ phát hiện văn bản do ChatGPT tạo ra với tên...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 07/08/2024
Pencil! Công cụ giáo dục thực tế hỗn hợp nâng cao kỹ năng vẽ

Pencil! Công cụ giáo dục thực tế hỗn hợp nâng cao kỹ năng vẽ

Học vẽ có thể là một nhiệm vụ khó khăn đối với nhiều người, nhưng Quest 3 sẽ giúp bạn...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 04/07/2024

Khách Hàng Tiêu Biểu

Liên hệ