Đăng ký nhận báo giá



AI mới của Alibaba: biến một bức ảnh thành Video sinh động

(3.3/5) (6 lượt đánh giá)
Cập nhật nội dung: 14/03/2024
VR360
Cập nhật nội dung: 14/03/2024 VR360
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse

Sự tiến triển nhanh chóng của công nghệ AI tạo sinh đã gây ấn tượng mạnh mẽ và đồng thời khiến người ta cảm thấy lo ngại về những hậu quả tiềm ẩn trong tương lai nếu không được sử dụng một cách đúng đắn.

Công nghệ AI tạo sinh đang tiến bộ nhanh chóng hơn cả những gì chúng ta từng tưởng. Trong khi chỉ cách đây không lâu, ChatGPT đã khiến mọi người ngạc nhiên bởi khả năng tạo ra văn bản theo yêu cầu, nhưng hiện nay, các mô hình AI đã vượt xa hơn với sự phức tạp và sự tinh xảo trong tạo ra nội dung.

AI mới của Alibaba: biến một bức ảnh thành Video sinh động

Một thời gian ngắn trước đây, OpenAI đã giới thiệu mô hình Sora, có khả năng tạo ra các video ngắn từ văn bản một cách chân thực, tương tự như các đoạn clip chuyên nghiệp. Và giờ đây, hãng Alibaba của Trung Quốc đã tạo ra một giải pháp tương tự: một mô hình AI có khả năng biến bất kỳ nhân vật nào trong một hình ảnh tĩnh thành một ca sĩ chuyên nghiệp.

Công cụ tạo video AI này được gọi là EMO, viết tắt của Emotive Portrait Alive, đại diện cho một bước tiến mới mẻ trong lĩnh vực này, với khả năng vượt qua mô hình Sora của OpenAI. Trong khi Sora xuất sắc trong việc tái tạo cảnh quan và phong cảnh đẹp mắt, các nhân vật của nó thường trở nên lặng lẽ và không di chuyển. Ngược lại, EMO cho phép nhân vật nói và hát, thể hiện các biểu cảm khuôn mặt một cách chân thực và đồng bộ - ngay cả khi đó là một nhân vật ảo không tồn tại như cô gái trong video giới thiệu của Sora.

Trong khi kỹ thuật deepfake cách đây vài năm chỉ là việc đổi gương mặt bằng AI mà không tái hiện được biểu cảm cũng như yêu cầu sự hỗ trợ từ các clip sẵn có, EMO chỉ cần một hình ảnh tĩnh duy nhất. Đáng chú ý, mô hình AI này cũng có khả năng tạo ra nhân vật với các ngôn ngữ và giọng điệu khác nhau, bao gồm cả tiếng Hàn.

Công cụ Tạo Video AI của Alibaba hoạt động như thế nào

Theo tài liệu nghiên cứu của Alibaba, EMO khai thác một kho dữ liệu lớn về âm thanh và video để học cách tái tạo biểu cảm khuôn mặt một cách tự nhiên. Nó áp dụng một phương pháp khuếch tán, tức là từ từ chuyển đổi hình ảnh tĩnh thành video từng khung hình một, không thông qua bất kỳ quá trình trung gian nào.

Đồng thời, EMO cũng sử dụng hai cơ chế tập trung, một cho hình ảnh tham chiếu và một cho âm thanh, để đảm bảo rằng hoạt ảnh khuôn mặt phản ánh đúng về cả ngoại hình và lời nói của đối tượng. Kết quả là một video trôi chảy và đầy biểu cảm, với sự xuất hiện giống hệt như một người thực sự đang nói chuyện hoặc hát.

AI mới của Alibaba: biến một bức ảnh thành Video sinh động

Trong thời kỳ công nghệ AI phát triển với tốc độ chóng mặt, nhiều cơ hội mới mở ra trong các lĩnh vực như giải trí, giáo dục và giao tiếp. Công cụ tạo video AI như EMO cho phép tái tạo các nhân vật nổi tiếng hoặc lịch sử nói hoặc hát bất cứ điều gì bạn muốn, và tạo ra các hình đại diện ảo không chỉ giống bạn mà còn nghe như bạn. Tuy nhiên, sự tiến bộ này cũng đồng nghĩa với những lo ngại về quyền riêng tư và đạo đức.

EMO có thể dẫn đến việc tạo ra video giả mạo hoặc gây hiểu lầm, ảnh hưởng đến uy tín và độ tin cậy của cá nhân, hoặc thao túng cảm xúc và quan điểm của người xem. Đây là một lưỡi hai lưỡi có thể mang lại kết quả tích cực hoặc tiêu cực, phụ thuộc vào cách sử dụng của nó, tương tự như deepfake hiện nay đang gây lo ngại trong xã hội.

Tiếp tục theo dõi bài viết từ VR360 để được cập nhật liên tục những vấn đề xoay quanh lĩnh vực cô ng nghệ mỗi ngày. Cảm ơn bạn đã quan tâm bài viết lần này của mình.

Bài viết liên quan:

 


LIÊN HỆ HỢP TÁC CÙNG VR360 
VR360 – ĐỔI MỚI ĐỂ KHÁC BIỆT 

- Facebook: https://www.facebook.com/vr360vnvirtualtour/
- Hotline:  0935 690 369  
- Email: infor@vr360.com.vn 
- Địa chỉ:

  • 123 Phạm Huy Thông, Sơn Trà, Đà Nẵng
  • Toà nhà Citilight, số 45 Võ Thị Sáu, Đakao, Quận 1, TP Hồ Chí Minh
  • 3B Đặng Thái Thân, Phan Chu Trinh, Hoàn Kiếm, Hà Nội

Tin tức mới nhất

Meta: Các nhà cung cấp theo đuổi sản xuất

Meta: Theo đuổi sản xuất "Vật liệu kỳ diệu" cho phép kính Orion AR có trường nhìn

Meta cho biết các nhà cung cấp trên toàn thế giới hiện đang tích cực theo đuổi việc sản xuất...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 14/03/2025
Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Theo báo cáo mới từ Business Post của Hàn Quốc, Samsung dự kiến sẽ ra tai nghe mới vào quý...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 12/03/2025
Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Mùa pháo hoa dài nhất, lớn nhất đang trở lại, hứa hẹn kịch tính nhất trong Lễ hội Pháo hoa...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google vừa công bố bản cập nhật Gemini 2.0 với tính năng Flash Thinking và mẫu Flagship mới, Gemini 2.0...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

ghiên cứu của BBC gần đây lại cảnh báo rằng AI đang mắc phải những lỗi nghiêm trọng và thậm...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/02/2025
Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Elon Musk và công ty xAI đã chính thức trình làng Grok-3, một chatbot AI tiên tiến được thiết kế...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 18/02/2025

Bài viết cùng chủ đề

Meta: Các nhà cung cấp theo đuổi sản xuất

Meta: Theo đuổi sản xuất "Vật liệu kỳ diệu" cho phép kính Orion AR có trường nhìn

Meta cho biết các nhà cung cấp trên toàn thế giới hiện đang tích cực theo đuổi việc sản xuất...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 14/03/2025
Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Theo báo cáo mới từ Business Post của Hàn Quốc, Samsung dự kiến sẽ ra tai nghe mới vào quý...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 12/03/2025
Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Mùa pháo hoa dài nhất, lớn nhất đang trở lại, hứa hẹn kịch tính nhất trong Lễ hội Pháo hoa...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google vừa công bố bản cập nhật Gemini 2.0 với tính năng Flash Thinking và mẫu Flagship mới, Gemini 2.0...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

ghiên cứu của BBC gần đây lại cảnh báo rằng AI đang mắc phải những lỗi nghiêm trọng và thậm...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/02/2025
Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Elon Musk và công ty xAI đã chính thức trình làng Grok-3, một chatbot AI tiên tiến được thiết kế...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 18/02/2025
Nhìn lại những đột phá của AI trong năm 2024

Nhìn lại những đột phá của AI trong năm 2024

Năm 2024, trí tuệ nhân tạo (AI) đã trở thành một phần không thể thiếu trong cuộc sống hàng ngày....
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 03/01/2025
OpenAI chính thức ra mắt tính năng tìm kiếm cho người dùng ChatGPT

OpenAI chính thức ra mắt tính năng tìm kiếm cho người dùng ChatGPT

OpenAI vừa công bố tin tức về công cụ tìm kiếm AI của ChatGPT (ChatGPT Search) sẽ được triển khai...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 17/12/2024
Ra mắt Gemini 2.0: Bước đột phá AI mới nhất của Google

Ra mắt Gemini 2.0: Bước đột phá AI mới nhất của Google

Google ngày 11/12 đã công bố ra mắt Gemini 2.0, mô hình trí tuệ nhân tạo (AI) tiên tiến nhất...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 13/12/2024
CEO OpenAI Sam Altman cố gắng hạ thấp kỳ vọng cho AGI

CEO OpenAI Sam Altman cố gắng hạ thấp kỳ vọng cho AGI

“Tôi đoán chúng ta sẽ đạt được AGI sớm hơn những gì mà mọi người đã nghĩ, nhưng điều đó...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 06/12/2024

Khách Hàng Tiêu Biểu

Liên hệ