Facebook đang sử dụng hàng tỷ hình ảnh Instagram để đào tạo các thuật toán cho trí thông minh nhân tạo (AI)

- Tháng Năm 3, 2018

Facebook đang sử dụng hàng tỷ hình ảnh Instagram để đào tạo các thuật toán cho trí thông minh nhân tạo (AI)

Ít ai biết rằng kho ảnh trên Instagram chính là nguồn dữ liệu giúp Facebook đào tạo AI của họ.

Ảnh Instagram của bạn về một chiếc bánh kếp hoàn hảo hay một khung cảnh hoàn hôn chính là dữ liệu giúp Facebook đào tạo cho các thuật toán của trí thông minh nhân tạo do công ty phát triển với mục tiêu giúp AI có thể nhận thức được các đối tượng trong ảnh một cách tốt hơn.

Thông tin này vừa được Facebook công bố tại Hội nghị F8. Facebook nói rằng những hình ảnh từ các hashtags công cộng có sẵn là một cách để tích lũy và đào tạo phần mềm với hàng tỷ hình ảnh mà không cần các nhân viên làm việc chăm chỉ để chú thích các ảnh. Kết quả là cuối cùng Facebook có thể tạo ra một hệ thống các thuật toán cho AI mà có thể đánh bại các tiêu chuẩn hàng đầu trong lĩnh vực này.

Mike Schroepfer, giám đốc công nghệ của Facebook nói trên sân khấu của Hội nghị F8 rằng: “Chúng tôi dựa gần như hoàn toàn vào các bộ dữ liệu được dán nhãn bằng tay. Nếu một người không dành thời gian để gắn nhãn cụ thể vào các bức ảnh thì ngay cả những hệ thống quét máy tính tiên tiến nhất cũng sẽ không nhận dạng được nó. Nhưng bằng cách sử dụng hình ảnh Instagram đã được gắn nhãn qua hashtags, Facebook đã có thể thu thập dữ liệu có liên quan và sử dụng nó để đào tạo cho AI nhận biết được các đối tượng. Chúng tôi đã tạo ra các kết quả tốt hơn từ 1 đến 2 phần trăm so với bất kỳ hệ thống nào khác trên bài test ImageNet benchmark”.

Đó là một cách tiếp cận thực tế, nhưng nó cũng là một trong những câu hỏi thú vị về quyền riêng tư và lợi thế cạnh tranh của Facebook. Bởi vì sở hữu và vận hành một nền tảng lớn bao gồm hàng tỷ người dùng trên các ứng dụng như Instagram, WhatsApp và Messenger nên Facebook có quyền truy cập vào dữ liệu văn bản và hình ảnh cực kỳ có giá trị để đào tạo cho các AI của mình miễn là văn bản hay hình ảnh đó được người dùng đăng ở chế độ công khai. Nhưng người dùng có thể không nhận thức được rằng dữ liệu mà họ đã chia sẻ đang được khai thác để xây dựng hệ thống AI (chứ không chỉ cho mục đích quảng cáo).

Việc Facebook xây dựng những hệ thống AI này chủ yếu để giúp họ mở rộng nỗ lực kiểm duyệt của mình. Ngoài 20.000 người điều hành mới cho nền tảng mạng xã hội này, Facebook ngày càng tìm cách tự động hóa các quá trình của mình sau hàng loạt vụ bê bối, đặc biệt là vụ Cambridge Analytica mới đây.

Schroepfer nói: “Cho đến gần đây chúng tôi thường phải dựa vào các báo cáo phản ứng. Chúng tôi đã phải bị động chờ người ta phát hiện ra điều gì đó và báo cáo trở lại. Đây là lý do tại sao chúng tôi tập trung vào nghiên cứu AI. Chúng tôi yêu cầu những đột phá và công nghệ mới để giải quyết tất cả những vấn đề của mình”.

Nguồn genk.vn