Đăng ký nhận báo giá



Thị trường ngầm với cuộc đua mua dữ liệu đào tạo AI

(5/5) (1 lượt đánh giá)
Cập nhật nội dung: 10/04/2024
VR360
Cập nhật nội dung: 10/04/2024 VR360
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse

Những gã khổng lồ công nghệ hiện nay đang khai thác một lượng lớn dữ liệu miễn phí từ Internet để huấn luyện các mô hình AI tổng hợp. Đồng thời, họ cũng đang mua lại một cách im lặng các dữ liệu bị khóa như ảnh cá nhân, nhật ký, và tin nhắn từ các trang mạng xã hội cũ.

AI đe đoạ

Vào những năm đỉnh cao vào đầu thập kỷ 2000, Photobucket là trang web hàng đầu về lưu trữ ảnh trực tuyến trên thế giới. Nó được coi là "cột mốc truyền thông" cho các dịch vụ mạng xã hội như Myspace và Friendster, và có 70 triệu người dùng, chiếm gần một nửa thị trường ảnh trực tuyến tại Mỹ.

Theo dữ liệu từ công cụ phân tích Sameweb, hiện chỉ còn khoảng 2 triệu người sử dụng Photobucket. Tuy nhiên, với sự phát triển mạnh mẽ của trí tuệ nhân tạo (AI), Photobucket có cơ hội mới để tái sinh.

SỨC MẠNH CỦA DỮ LIỆU

Theo Reuters, giám đốc điều hành Ted Leonard của Photobucket cho biết họ đang tiến hành thương lượng với nhiều công ty công nghệ để cấp phép 13 tỷ hình ảnh và video từ dữ liệu của trang web để huấn luyện các mô hình AI sáng tạo.

Ông Leonard đã đề cập đến mức giá từ 5 cent đến 1 USD cho mỗi ảnh và trên 1 USD cho mỗi video, với biểu giá khác nhau tùy thuộc vào người mua và loại hình ảnh.

Photobucket không tiết lộ danh tính của các nhà mua tiềm năng vì lý do bảo mật, nhưng cuộc thương lượng này làm nổi bật giá trị lớn của tài sản dữ liệu của Photobucket và tiềm năng phát triển trong thị trường dữ liệu sôi động với sự bùng nổ của AI.

SỨC MẠNH CỦA DỮ LIỆU

Các công ty công nghệ như Google, MetaOpenAI đang sử dụng dữ liệu miễn phí từ Internet để huấn luyện các mô hình AI sáng tạo như ChatGPT. Đồng thời, họ cũng đã bắt đầu trả tiền cho các dữ liệu độc quyền từ các ứng dụng mạng xã hội cũ, bao gồm nhật ký trực tuyến, ảnh cá nhân và tin nhắn.

Thực tế là việc huấn luyện AI có chi phí đáng kể nếu không có quyền truy cập vào dữ liệu miễn phí như kho lưu trữ công cộng Common Crawl. Tuy nhiên, việc này thường đi kèm với các vấn đề về bản quyền và áp lực pháp lý, đẩy các nhà xuất bản phải tăng cường bảo vệ thông tin của họ.

Để giải quyết những thách thức này, các nhà huấn luyện mô hình AI đang phải tìm kiếm các thoả thuận với chủ sở hữu nội dung và tận dụng các dịch vụ môi giới dữ liệu mới nổi để đáp ứng nhu cầu ngày càng tăng.

Ví dụ, sau khi ChatGPT được ra mắt vào cuối năm 2022, các công ty như Meta, Google, Amazon và Apple đã ký thoả thuận với nhà cung cấp hình ảnh Shutterstock để sử dụng hàng trăm triệu hình ảnh, video và tệp nhạc.

Giám đốc tài chính của Shutterstock, Jarrod Yahes, tiết lộ rằng các thoả thuận ban đầu dao động từ 25 triệu đến 50 triệu USD mỗi công ty, nhưng sau đó đã tăng lên đáng kể. Các công ty nhỏ cũng đã bắt đầu tiếp cận để hợp tác với Shutterstock.

Những thỏa thuận tương tự cũng đã xuất hiện với các công ty như Freepik, cho thấy sự phát triển của ngành công nghiệp dữ liệu AI và nhu cầu ngày càng tăng về các nguồn cung cấp dữ liệu chất lượng và độc quyền.

MỞ RA NGÀNH CÔNG NGHIỆP MỚI

Trong ngành công nghiệp mới này, dù phần lớn các công ty nghiên cứu thị trường lớn vẫn chưa thể đưa ra ước tính chính xác về quy mô thị trường dữ liệu AI do thiếu sự minh bạch, nhưng một số đơn vị như Business Research Insights đã dự đoán rằng thị trường đang ở mức khoảng 2,5 tỷ USD và có thể tăng lên gần 30 tỷ USD trong vòng một thập kỷ tới.

Các doanh nghiệp trong ngành này đang tập trung vào việc cung cấp thông tin nội dung từ thế giới thực, bao gồm podcast, video ngắn và tương tác với trợ lý kỹ thuật số, đồng thời xây dựng mạng lưới nhân viên hợp đồng ngắn hạn để tạo ra các mẫu hình ảnh và giọng nói nguyên bản tuỳ chỉnh.

Trong số những công ty nổi bật, Defined.ai, có trụ sở tại Seattle, đã thu hút sự quan tâm từ các "ông lớn" công nghệ như Google, Meta, Apple, Amazon và Microsoft. Theo Giám đốc điều hành Daniela Braga, giá của các sản phẩm/dịch vụ này có thể dao động tùy thuộc vào người mua và loại nội dung, với mức giá trung bình khoảng từ 1-2 USD/hình ảnh, 2-4 USD/video ngắn và 100-300 USD/giờ cho video dài. Ngoài ra, giá cho các nguồn dữ liệu văn bản có thể dao động từ 0,001 USD mỗi từ.

Defined.ai chia sẻ các khoản thu nhập này với các nhà cung cấp nội dung gốc sau khi đã loại bỏ thông tin nhận dạng cá nhân. Một nhà cung cấp tại Brazil đã tiết lộ rằng họ trả cho chủ sở hữu khoảng 20% đến 30% tổng số tiền giao dịch cho các bức ảnh, podcast và dữ liệu y tế.

Trong số các nội dung có giá trị cao nhất là những hình ảnh được sử dụng để đào tạo hệ thống AI nhận biết nội dung phản cảm như khiêu dâm hoặc bạo lực. Để thu thập những hình ảnh này, Defined.ai đã phải tìm kiếm thông tin từ các cơ quan như cảnh sát, phóng viên ảnh tự do và sinh viên y khoa ở Nam Mỹ và Châu Phi.

Reuters đã phỏng vấn hơn 30 chuyên gia về dữ liệu AI, bao gồm giám đốc điều hành, luật sư và nhà tư vấn để hiểu rõ hơn về thị trường này. Mặc dù hợp tác cấp phép có thể giải quyết áp lực pháp lý, việc sử dụng dữ liệu từ Photobucket có nguy cơ tiềm ẩn về quyền riêng tư. Giám đốc điều hành Photobucket cho biết công ty có cơ sở pháp lý vững chắc và coi dữ liệu cấp phép là giải pháp thay thế cho quảng cáo để duy trì các tài khoản miễn phí.

Tiếp tục theo dõi bài viết từ VR360 để được cập nhật liên tục những vấn đề xoay quanh lĩnh vực cô ng nghệ mỗi ngày. Cảm ơn bạn đã quan tâm bài viết lần này của mình.

 


LIÊN HỆ HỢP TÁC CÙNG VR360 
VR360 – ĐỔI MỚI ĐỂ KHÁC BIỆT 

- Facebook: https://www.facebook.com/vr360vnvirtualtour/
- Hotline:  0935 690 369  
- Email: infor@vr360.com.vn 
- Địa chỉ:

  • 123 Phạm Huy Thông, Sơn Trà, Đà Nẵng
  • Toà nhà Citilight, số 45 Võ Thị Sáu, Đakao, Quận 1, TP Hồ Chí Minh
  • 3B Đặng Thái Thân, Phan Chu Trinh, Hoàn Kiếm, Hà Nội

Tin tức mới nhất

Meta: Các nhà cung cấp theo đuổi sản xuất

Meta: Theo đuổi sản xuất "Vật liệu kỳ diệu" cho phép kính Orion AR có trường nhìn

Meta cho biết các nhà cung cấp trên toàn thế giới hiện đang tích cực theo đuổi việc sản xuất...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 14/03/2025
Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Theo báo cáo mới từ Business Post của Hàn Quốc, Samsung dự kiến sẽ ra tai nghe mới vào quý...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 12/03/2025
Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Mùa pháo hoa dài nhất, lớn nhất đang trở lại, hứa hẹn kịch tính nhất trong Lễ hội Pháo hoa...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google vừa công bố bản cập nhật Gemini 2.0 với tính năng Flash Thinking và mẫu Flagship mới, Gemini 2.0...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

ghiên cứu của BBC gần đây lại cảnh báo rằng AI đang mắc phải những lỗi nghiêm trọng và thậm...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/02/2025
Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Elon Musk và công ty xAI đã chính thức trình làng Grok-3, một chatbot AI tiên tiến được thiết kế...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 18/02/2025

Bài viết cùng chủ đề

Meta: Các nhà cung cấp theo đuổi sản xuất

Meta: Theo đuổi sản xuất "Vật liệu kỳ diệu" cho phép kính Orion AR có trường nhìn

Meta cho biết các nhà cung cấp trên toàn thế giới hiện đang tích cực theo đuổi việc sản xuất...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 14/03/2025
Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Samsung sắp ra mắt tai nghe số lượng hạn chế và mức giá cao?

Theo báo cáo mới từ Business Post của Hàn Quốc, Samsung dự kiến sẽ ra tai nghe mới vào quý...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 12/03/2025
Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Lịch thi đấu Lễ hội pháo hoa Quốc tế Đà Nẵng DIFF 2025

Mùa pháo hoa dài nhất, lớn nhất đang trở lại, hứa hẹn kịch tính nhất trong Lễ hội Pháo hoa...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google cập nhật Gemini 2.0: Trí tuệ nhân tạo 'lý luận' mới thách thức các đối thủ

Google vừa công bố bản cập nhật Gemini 2.0 với tính năng Flash Thinking và mẫu Flagship mới, Gemini 2.0...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 20/02/2025
BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

BBC phát hiện chatbot AI đang bóp méo các câu chuyện tin tức

ghiên cứu của BBC gần đây lại cảnh báo rằng AI đang mắc phải những lỗi nghiêm trọng và thậm...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/02/2025
Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Đánh bại DeepSeek V3, Elon Musk ra mắt chatbot AI thông minh nhất Trái Đất

Elon Musk và công ty xAI đã chính thức trình làng Grok-3, một chatbot AI tiên tiến được thiết kế...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 18/02/2025
Nhìn lại những đột phá của AI trong năm 2024

Nhìn lại những đột phá của AI trong năm 2024

Năm 2024, trí tuệ nhân tạo (AI) đã trở thành một phần không thể thiếu trong cuộc sống hàng ngày....
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 03/01/2025
OpenAI chính thức ra mắt tính năng tìm kiếm cho người dùng ChatGPT

OpenAI chính thức ra mắt tính năng tìm kiếm cho người dùng ChatGPT

OpenAI vừa công bố tin tức về công cụ tìm kiếm AI của ChatGPT (ChatGPT Search) sẽ được triển khai...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 17/12/2024
Ra mắt Gemini 2.0: Bước đột phá AI mới nhất của Google

Ra mắt Gemini 2.0: Bước đột phá AI mới nhất của Google

Google ngày 11/12 đã công bố ra mắt Gemini 2.0, mô hình trí tuệ nhân tạo (AI) tiên tiến nhất...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 13/12/2024
CEO OpenAI Sam Altman cố gắng hạ thấp kỳ vọng cho AGI

CEO OpenAI Sam Altman cố gắng hạ thấp kỳ vọng cho AGI

“Tôi đoán chúng ta sẽ đạt được AGI sớm hơn những gì mà mọi người đã nghĩ, nhưng điều đó...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 06/12/2024

Khách Hàng Tiêu Biểu

Liên hệ