Đăng ký nhận báo giá



Thị trường ngầm với cuộc đua mua dữ liệu đào tạo AI

(5/5) (1 lượt đánh giá)
Cập nhật nội dung: 10/04/2024
VR360
Cập nhật nội dung: 10/04/2024 VR360
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse

Những gã khổng lồ công nghệ hiện nay đang khai thác một lượng lớn dữ liệu miễn phí từ Internet để huấn luyện các mô hình AI tổng hợp. Đồng thời, họ cũng đang mua lại một cách im lặng các dữ liệu bị khóa như ảnh cá nhân, nhật ký, và tin nhắn từ các trang mạng xã hội cũ.

AI đe đoạ

Vào những năm đỉnh cao vào đầu thập kỷ 2000, Photobucket là trang web hàng đầu về lưu trữ ảnh trực tuyến trên thế giới. Nó được coi là "cột mốc truyền thông" cho các dịch vụ mạng xã hội như Myspace và Friendster, và có 70 triệu người dùng, chiếm gần một nửa thị trường ảnh trực tuyến tại Mỹ.

Theo dữ liệu từ công cụ phân tích Sameweb, hiện chỉ còn khoảng 2 triệu người sử dụng Photobucket. Tuy nhiên, với sự phát triển mạnh mẽ của trí tuệ nhân tạo (AI), Photobucket có cơ hội mới để tái sinh.

SỨC MẠNH CỦA DỮ LIỆU

Theo Reuters, giám đốc điều hành Ted Leonard của Photobucket cho biết họ đang tiến hành thương lượng với nhiều công ty công nghệ để cấp phép 13 tỷ hình ảnh và video từ dữ liệu của trang web để huấn luyện các mô hình AI sáng tạo.

Ông Leonard đã đề cập đến mức giá từ 5 cent đến 1 USD cho mỗi ảnh và trên 1 USD cho mỗi video, với biểu giá khác nhau tùy thuộc vào người mua và loại hình ảnh.

Photobucket không tiết lộ danh tính của các nhà mua tiềm năng vì lý do bảo mật, nhưng cuộc thương lượng này làm nổi bật giá trị lớn của tài sản dữ liệu của Photobucket và tiềm năng phát triển trong thị trường dữ liệu sôi động với sự bùng nổ của AI.

SỨC MẠNH CỦA DỮ LIỆU

Các công ty công nghệ như Google, MetaOpenAI đang sử dụng dữ liệu miễn phí từ Internet để huấn luyện các mô hình AI sáng tạo như ChatGPT. Đồng thời, họ cũng đã bắt đầu trả tiền cho các dữ liệu độc quyền từ các ứng dụng mạng xã hội cũ, bao gồm nhật ký trực tuyến, ảnh cá nhân và tin nhắn.

Thực tế là việc huấn luyện AI có chi phí đáng kể nếu không có quyền truy cập vào dữ liệu miễn phí như kho lưu trữ công cộng Common Crawl. Tuy nhiên, việc này thường đi kèm với các vấn đề về bản quyền và áp lực pháp lý, đẩy các nhà xuất bản phải tăng cường bảo vệ thông tin của họ.

Để giải quyết những thách thức này, các nhà huấn luyện mô hình AI đang phải tìm kiếm các thoả thuận với chủ sở hữu nội dung và tận dụng các dịch vụ môi giới dữ liệu mới nổi để đáp ứng nhu cầu ngày càng tăng.

Ví dụ, sau khi ChatGPT được ra mắt vào cuối năm 2022, các công ty như Meta, Google, Amazon và Apple đã ký thoả thuận với nhà cung cấp hình ảnh Shutterstock để sử dụng hàng trăm triệu hình ảnh, video và tệp nhạc.

Giám đốc tài chính của Shutterstock, Jarrod Yahes, tiết lộ rằng các thoả thuận ban đầu dao động từ 25 triệu đến 50 triệu USD mỗi công ty, nhưng sau đó đã tăng lên đáng kể. Các công ty nhỏ cũng đã bắt đầu tiếp cận để hợp tác với Shutterstock.

Những thỏa thuận tương tự cũng đã xuất hiện với các công ty như Freepik, cho thấy sự phát triển của ngành công nghiệp dữ liệu AI và nhu cầu ngày càng tăng về các nguồn cung cấp dữ liệu chất lượng và độc quyền.

MỞ RA NGÀNH CÔNG NGHIỆP MỚI

Trong ngành công nghiệp mới này, dù phần lớn các công ty nghiên cứu thị trường lớn vẫn chưa thể đưa ra ước tính chính xác về quy mô thị trường dữ liệu AI do thiếu sự minh bạch, nhưng một số đơn vị như Business Research Insights đã dự đoán rằng thị trường đang ở mức khoảng 2,5 tỷ USD và có thể tăng lên gần 30 tỷ USD trong vòng một thập kỷ tới.

Các doanh nghiệp trong ngành này đang tập trung vào việc cung cấp thông tin nội dung từ thế giới thực, bao gồm podcast, video ngắn và tương tác với trợ lý kỹ thuật số, đồng thời xây dựng mạng lưới nhân viên hợp đồng ngắn hạn để tạo ra các mẫu hình ảnh và giọng nói nguyên bản tuỳ chỉnh.

Trong số những công ty nổi bật, Defined.ai, có trụ sở tại Seattle, đã thu hút sự quan tâm từ các "ông lớn" công nghệ như Google, Meta, Apple, Amazon và Microsoft. Theo Giám đốc điều hành Daniela Braga, giá của các sản phẩm/dịch vụ này có thể dao động tùy thuộc vào người mua và loại nội dung, với mức giá trung bình khoảng từ 1-2 USD/hình ảnh, 2-4 USD/video ngắn và 100-300 USD/giờ cho video dài. Ngoài ra, giá cho các nguồn dữ liệu văn bản có thể dao động từ 0,001 USD mỗi từ.

Defined.ai chia sẻ các khoản thu nhập này với các nhà cung cấp nội dung gốc sau khi đã loại bỏ thông tin nhận dạng cá nhân. Một nhà cung cấp tại Brazil đã tiết lộ rằng họ trả cho chủ sở hữu khoảng 20% đến 30% tổng số tiền giao dịch cho các bức ảnh, podcast và dữ liệu y tế.

Trong số các nội dung có giá trị cao nhất là những hình ảnh được sử dụng để đào tạo hệ thống AI nhận biết nội dung phản cảm như khiêu dâm hoặc bạo lực. Để thu thập những hình ảnh này, Defined.ai đã phải tìm kiếm thông tin từ các cơ quan như cảnh sát, phóng viên ảnh tự do và sinh viên y khoa ở Nam Mỹ và Châu Phi.

Reuters đã phỏng vấn hơn 30 chuyên gia về dữ liệu AI, bao gồm giám đốc điều hành, luật sư và nhà tư vấn để hiểu rõ hơn về thị trường này. Mặc dù hợp tác cấp phép có thể giải quyết áp lực pháp lý, việc sử dụng dữ liệu từ Photobucket có nguy cơ tiềm ẩn về quyền riêng tư. Giám đốc điều hành Photobucket cho biết công ty có cơ sở pháp lý vững chắc và coi dữ liệu cấp phép là giải pháp thay thế cho quảng cáo để duy trì các tài khoản miễn phí.

Tiếp tục theo dõi bài viết từ VR360 để được cập nhật liên tục những vấn đề xoay quanh lĩnh vực cô ng nghệ mỗi ngày. Cảm ơn bạn đã quan tâm bài viết lần này của mình.

 


LIÊN HỆ HỢP TÁC CÙNG VR360 
VR360 – ĐỔI MỚI ĐỂ KHÁC BIỆT 

- Facebook: https://www.facebook.com/vr360vnvirtualtour/
- Hotline:  0935 690 369  
- Email: infor@vr360.com.vn 
- Địa chỉ:

  • 123 Phạm Huy Thông, Sơn Trà, Đà Nẵng
  • Toà nhà Citilight, số 45 Võ Thị Sáu, Đakao, Quận 1, TP Hồ Chí Minh
  • 3B Đặng Thái Thân, Phan Chu Trinh, Hoàn Kiếm, Hà Nội

Tin tức mới nhất

Người dùng Facebook sẽ được dùng miễn phí 'trợ lý AI thông minh nhất'

Người dùng Facebook sẽ được dùng miễn phí 'trợ lý AI thông minh nhất'

'Trợ lý AI đỉnh cao miễn phí' của Meta AI sẽ có mặt trên các nền tảng Facebook, Instagram, WhatsApp...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/04/2024
MediaTek Tạo Ra Bản Thử Nghiệm 6G, Video AI, và Băng Thông Rộng Vệ Tinh

MediaTek Tạo Ra Bản Thử Nghiệm 6G, Video AI, và Băng Thông Rộng Vệ Tinh

Tại MWC 2024, MediaTek Đem Lại Sự Đột Phá Với Công Nghệ 5G RedCap, Dimensity Auto và Pre-6G Ambient Computing
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 16/04/2024
CEO Apple Tim Cook đến Việt Nam

CEO Apple Tim Cook đến Việt Nam

Trong ngày hôm nay, CEO của Apple Tim Cook đã đặt chân đến Hà Nội trong một chuyến bay riêng...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 15/04/2024
Những lưu ý để bảo đảm an toàn thông tin cá nhân

Những lưu ý để bảo đảm an toàn thông tin cá nhân trên không gian mạng

Trong thời đại Công nghiệp 4.0 ngày nay, mạng internet đang lan rộng và phổ biến hơn bao giờ hết,...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 11/04/2024
Huawei tạo ra một hệ điều hành mới khiến đối thủ Apple, Google sợ hãi

Huawei tạo ra một hệ điều hành mới khiến đối thủ Apple, Google sợ hãi

Hệ điều hành tiếp theo của Huawei, HarmonyOS Next, đang đứng trước cơ hội đặc biệt để cạnh tranh ngang...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 09/04/2024
Cẩm nang phòng, chống mã hóa tống tiền trên mạng - 7 hình thức lừa đảo phổ biến

Cẩm nang phòng, chống mã hóa tống tiền trên mạng - 7 hình thức lừa đảo phổ biến

Cẩm nang phòng, chống mã hóa tống tiền trên mạng - 7 hình thức lừa đảo phổ biến
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 08/04/2024

Bài viết cùng chủ đề

Người dùng Facebook sẽ được dùng miễn phí 'trợ lý AI thông minh nhất'

Người dùng Facebook sẽ được dùng miễn phí 'trợ lý AI thông minh nhất'

'Trợ lý AI đỉnh cao miễn phí' của Meta AI sẽ có mặt trên các nền tảng Facebook, Instagram, WhatsApp...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 19/04/2024
MediaTek Tạo Ra Bản Thử Nghiệm 6G, Video AI, và Băng Thông Rộng Vệ Tinh

MediaTek Tạo Ra Bản Thử Nghiệm 6G, Video AI, và Băng Thông Rộng Vệ Tinh

Tại MWC 2024, MediaTek Đem Lại Sự Đột Phá Với Công Nghệ 5G RedCap, Dimensity Auto và Pre-6G Ambient Computing
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 16/04/2024
CEO Apple Tim Cook đến Việt Nam

CEO Apple Tim Cook đến Việt Nam

Trong ngày hôm nay, CEO của Apple Tim Cook đã đặt chân đến Hà Nội trong một chuyến bay riêng...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 15/04/2024
Những lưu ý để bảo đảm an toàn thông tin cá nhân

Những lưu ý để bảo đảm an toàn thông tin cá nhân trên không gian mạng

Trong thời đại Công nghiệp 4.0 ngày nay, mạng internet đang lan rộng và phổ biến hơn bao giờ hết,...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 11/04/2024
Huawei tạo ra một hệ điều hành mới khiến đối thủ Apple, Google sợ hãi

Huawei tạo ra một hệ điều hành mới khiến đối thủ Apple, Google sợ hãi

Hệ điều hành tiếp theo của Huawei, HarmonyOS Next, đang đứng trước cơ hội đặc biệt để cạnh tranh ngang...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 09/04/2024
Cẩm nang phòng, chống mã hóa tống tiền trên mạng - 7 hình thức lừa đảo phổ biến

Cẩm nang phòng, chống mã hóa tống tiền trên mạng - 7 hình thức lừa đảo phổ biến

Cẩm nang phòng, chống mã hóa tống tiền trên mạng - 7 hình thức lừa đảo phổ biến
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 08/04/2024
Xu hướng tìm kiếm của người Việt trong 3 tháng đầu năm 2024

Xu hướng tìm kiếm của người Việt trong 3 tháng đầu năm 2024

“Đào, Phở và Piano,” “vé máy bay giá rẻ,” “mức phạt nồng độ cồn,” “giá vàng” và “việc làm online”...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 05/04/2024
Apple khẳng định mô hình AI của mình nhanh hơn GPT-4

Apple khẳng định mô hình AI của mình nhanh hơn GPT-4

Apple tự tin khẳng định rằng mô hình AI ReALM mới của họ sẽ vượt trội hơn cả GPT-4 của...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 04/04/2024
Sử dụng ChatGPT miễn phí không cần đăng ký tài khoản

Sử dụng ChatGPT miễn phí không cần đăng ký tài khoản

OpenAI đã khởi đầu việc cho phép người dùng truy cập miễn phí vào chatbot ChatGPT mà không yêu cầu...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 03/04/2024
Samsung đẩy mạnh nâng cấp trợ lý ảo Bixby

Samsung đẩy mạnh nâng cấp trợ lý ảo Bixby

Hệ sinh thái của Samsung đang tìm kiếm một phiên bản cải tiến của trợ lý ảo Bixby để đối...
VR360 Giải pháp Thực tế ảo VR, AR, 3D, 360, Map3D, Metaverse 02/04/2024

Khách Hàng Tiêu Biểu

Liên hệ