Cục diện mới trong lĩnh vực gán nhãn dữ liệu AI: Sự va chạm giữa đầu tư của các ông lớn và đổi mới Web3
Gần đây, ngành AI đã nổi lên một làn sóng dữ liệu gán nhãn. Một công ty công nghệ khổng lồ đã mua gần một nửa cổ phần của một công ty gán nhãn dữ liệu với mức giá gây chấn động là 14,8 tỷ USD, gây ra nhiều cuộc thảo luận trong toàn ngành công nghệ. Trong khi đó, một dự án Web3 AI sắp phát hành token lại đang phải đối mặt với sự nghi ngờ về "ăn theo khái niệm, không thể tự chứng minh". Sự tương phản rõ rệt này phản ánh sự thay đổi nào trên thị trường?
Đầu tiên, việc gán nhãn dữ liệu có giá trị và triển vọng hơn so với việc tập hợp sức mạnh tính toán phân tán. Mặc dù câu chuyện về việc sử dụng GPU nhàn rỗi để thách thức các ông lớn trong lĩnh vực điện toán đám mây nghe có vẻ hấp dẫn, nhưng sức mạnh tính toán về bản chất là một hàng hóa tiêu chuẩn hóa, sự khác biệt chủ yếu nằm ở giá cả và tính khả dụng. Lợi thế về giá có vẻ như có thể tìm thấy cơ hội trong sự độc quyền của các ông lớn, nhưng do bị hạn chế bởi vị trí địa lý, độ trễ mạng và sự tích cực của người dùng, một khi các ông lớn giảm giá hoặc tăng cung, lợi thế này rất dễ dàng biến mất.
So với đó, gán nhãn dữ liệu là một lĩnh vực khác biệt cần trí tuệ và phán đoán chuyên môn của con người. Mỗi gán nhãn chất lượng cao đều kết tinh kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, không thể sao chép một cách đơn giản như sức mạnh tính toán của GPU. Ví dụ, một gán nhãn chẩn đoán hình ảnh ung thư chính xác cần trực giác chuyên môn của bác sĩ ung thư dày dạn kinh nghiệm, một phân tích tâm lý thị trường tài chính sâu sắc không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch dày dạn. Sự khan hiếm và tính không thể thay thế tự nhiên này tạo ra lợi thế cạnh tranh mà gán nhãn dữ liệu có được, không thể so sánh với sức mạnh tính toán.
Gần đây, một ông lớn công nghệ đã chính thức công bố việc mua lại 49% cổ phần của một công ty gán nhãn dữ liệu với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI năm nay. Điều đáng chú ý hơn nữa là người sáng lập và CEO của công ty gán nhãn dữ liệu này sẽ đảm nhận vị trí lãnh đạo của phòng thí nghiệm nghiên cứu "Siêu trí tuệ" mới thành lập của ông lớn công nghệ này.
Doanh nhân gốc Hoa 25 tuổi này đã thành lập công ty vào năm 2016 khi còn là một sinh viên bỏ học, hiện nay công ty của anh đã được định giá lên đến 30 tỷ USD. Danh sách khách hàng của công ty được coi là "dàn sao toàn cầu" trong lĩnh vực AI: bao gồm nhiều tổ chức nghiên cứu AI nổi tiếng, nhà sản xuất ô tô, tập đoàn công nghệ lớn và các cơ quan chính phủ. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo mô hình AI, có hơn 300.000 nhân viên gán nhãn được đào tạo chuyên nghiệp.
Rõ ràng, khi mọi người còn đang tranh cãi về mô hình của công ty nào có hiệu suất mạnh hơn, thì những người chơi thực sự trong ngành đã lặng lẽ chuyển chiến trường sang nguồn dữ liệu. Điều này thực sự là một cuộc "chiến tranh ngầm" về quyền kiểm soát tương lai của AI.
Sự thành công của công ty gán nhãn dữ liệu này tiết lộ một sự thật bị bỏ qua: sức mạnh tính toán không còn khan hiếm, cấu trúc mô hình có xu hướng đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được "huấn luyện" một cách cẩn thận. Một ông lớn công nghệ không chỉ mua lại một công ty gia công với giá cao, mà còn là "quyền khai thác dầu" của thời đại AI.
Tuy nhiên, sự độc quyền luôn gây ra sự phản kháng. Cũng như các nền tảng điện toán phân tán cố gắng lật đổ dịch vụ điện toán đám mây tập trung, một dự án AI Web3 nào đó đang cố gắng sử dụng công nghệ blockchain để hoàn toàn viết lại các quy tắc phân phối giá trị của việc gán nhãn dữ liệu. Vấn đề cốt lõi của mô hình gán nhãn dữ liệu truyền thống không nằm ở công nghệ, mà nằm ở thiết kế cơ chế khuyến khích không hợp lý.
Chẳng hạn, một bác sĩ có thể tiêu tốn hàng giờ để gán nhãn hình ảnh y tế, nhưng chỉ nhận được vài chục đô la tiền công, trong khi giá trị của mô hình AI được đào tạo từ những dữ liệu này có thể lên đến hàng tỷ đô la, nhưng bác sĩ lại không thể chia sẻ những lợi nhuận này. Sự phân bổ giá trị cực kỳ bất công này đã ảnh hưởng nghiêm trọng đến động lực cung cấp dữ liệu chất lượng cao.
Với sự thúc đẩy của cơ chế khuyến khích token Web3, những người đóng góp này sẽ không còn là "lao động" dữ liệu giá rẻ, mà là những "cổ đông" thực sự của mạng lưới mô hình ngôn ngữ lớn AI. Rõ ràng, lợi thế của Web3 trong việc cải cách quan hệ sản xuất thể hiện rõ hơn trong các tình huống gán nhãn dữ liệu.
Thú vị thay, dự án Web3 AI này ra mắt token đúng vào thời điểm một gã khổng lồ công nghệ công bố mua lại với giá cao, đây có phải là sự trùng hợp hay là sắp đặt một cách khéo léo? Theo tác giả, điều này thực sự phản ánh một điểm chuyển mình của thị trường: bất kể là Web3 AI hay AI truyền thống, tất cả đã chuyển từ giai đoạn "so tài sức mạnh tính toán" sang giai đoạn "so tài chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng vốn, Web3 đang xây dựng một thử nghiệm "dân chủ hóa dữ liệu" quy mô lớn hơn bằng kinh tế token. Trận chiến về tương lai của AI mới chỉ bắt đầu.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Lĩnh vực mới của AI trong việc gán nhãn dữ liệu: Cuộc chiến giữa các ông lớn mua lại và đổi mới Web3
Cục diện mới trong lĩnh vực gán nhãn dữ liệu AI: Sự va chạm giữa đầu tư của các ông lớn và đổi mới Web3
Gần đây, ngành AI đã nổi lên một làn sóng dữ liệu gán nhãn. Một công ty công nghệ khổng lồ đã mua gần một nửa cổ phần của một công ty gán nhãn dữ liệu với mức giá gây chấn động là 14,8 tỷ USD, gây ra nhiều cuộc thảo luận trong toàn ngành công nghệ. Trong khi đó, một dự án Web3 AI sắp phát hành token lại đang phải đối mặt với sự nghi ngờ về "ăn theo khái niệm, không thể tự chứng minh". Sự tương phản rõ rệt này phản ánh sự thay đổi nào trên thị trường?
Đầu tiên, việc gán nhãn dữ liệu có giá trị và triển vọng hơn so với việc tập hợp sức mạnh tính toán phân tán. Mặc dù câu chuyện về việc sử dụng GPU nhàn rỗi để thách thức các ông lớn trong lĩnh vực điện toán đám mây nghe có vẻ hấp dẫn, nhưng sức mạnh tính toán về bản chất là một hàng hóa tiêu chuẩn hóa, sự khác biệt chủ yếu nằm ở giá cả và tính khả dụng. Lợi thế về giá có vẻ như có thể tìm thấy cơ hội trong sự độc quyền của các ông lớn, nhưng do bị hạn chế bởi vị trí địa lý, độ trễ mạng và sự tích cực của người dùng, một khi các ông lớn giảm giá hoặc tăng cung, lợi thế này rất dễ dàng biến mất.
So với đó, gán nhãn dữ liệu là một lĩnh vực khác biệt cần trí tuệ và phán đoán chuyên môn của con người. Mỗi gán nhãn chất lượng cao đều kết tinh kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, không thể sao chép một cách đơn giản như sức mạnh tính toán của GPU. Ví dụ, một gán nhãn chẩn đoán hình ảnh ung thư chính xác cần trực giác chuyên môn của bác sĩ ung thư dày dạn kinh nghiệm, một phân tích tâm lý thị trường tài chính sâu sắc không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch dày dạn. Sự khan hiếm và tính không thể thay thế tự nhiên này tạo ra lợi thế cạnh tranh mà gán nhãn dữ liệu có được, không thể so sánh với sức mạnh tính toán.
Gần đây, một ông lớn công nghệ đã chính thức công bố việc mua lại 49% cổ phần của một công ty gán nhãn dữ liệu với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI năm nay. Điều đáng chú ý hơn nữa là người sáng lập và CEO của công ty gán nhãn dữ liệu này sẽ đảm nhận vị trí lãnh đạo của phòng thí nghiệm nghiên cứu "Siêu trí tuệ" mới thành lập của ông lớn công nghệ này.
Doanh nhân gốc Hoa 25 tuổi này đã thành lập công ty vào năm 2016 khi còn là một sinh viên bỏ học, hiện nay công ty của anh đã được định giá lên đến 30 tỷ USD. Danh sách khách hàng của công ty được coi là "dàn sao toàn cầu" trong lĩnh vực AI: bao gồm nhiều tổ chức nghiên cứu AI nổi tiếng, nhà sản xuất ô tô, tập đoàn công nghệ lớn và các cơ quan chính phủ. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo mô hình AI, có hơn 300.000 nhân viên gán nhãn được đào tạo chuyên nghiệp.
Rõ ràng, khi mọi người còn đang tranh cãi về mô hình của công ty nào có hiệu suất mạnh hơn, thì những người chơi thực sự trong ngành đã lặng lẽ chuyển chiến trường sang nguồn dữ liệu. Điều này thực sự là một cuộc "chiến tranh ngầm" về quyền kiểm soát tương lai của AI.
Sự thành công của công ty gán nhãn dữ liệu này tiết lộ một sự thật bị bỏ qua: sức mạnh tính toán không còn khan hiếm, cấu trúc mô hình có xu hướng đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được "huấn luyện" một cách cẩn thận. Một ông lớn công nghệ không chỉ mua lại một công ty gia công với giá cao, mà còn là "quyền khai thác dầu" của thời đại AI.
Tuy nhiên, sự độc quyền luôn gây ra sự phản kháng. Cũng như các nền tảng điện toán phân tán cố gắng lật đổ dịch vụ điện toán đám mây tập trung, một dự án AI Web3 nào đó đang cố gắng sử dụng công nghệ blockchain để hoàn toàn viết lại các quy tắc phân phối giá trị của việc gán nhãn dữ liệu. Vấn đề cốt lõi của mô hình gán nhãn dữ liệu truyền thống không nằm ở công nghệ, mà nằm ở thiết kế cơ chế khuyến khích không hợp lý.
Chẳng hạn, một bác sĩ có thể tiêu tốn hàng giờ để gán nhãn hình ảnh y tế, nhưng chỉ nhận được vài chục đô la tiền công, trong khi giá trị của mô hình AI được đào tạo từ những dữ liệu này có thể lên đến hàng tỷ đô la, nhưng bác sĩ lại không thể chia sẻ những lợi nhuận này. Sự phân bổ giá trị cực kỳ bất công này đã ảnh hưởng nghiêm trọng đến động lực cung cấp dữ liệu chất lượng cao.
Với sự thúc đẩy của cơ chế khuyến khích token Web3, những người đóng góp này sẽ không còn là "lao động" dữ liệu giá rẻ, mà là những "cổ đông" thực sự của mạng lưới mô hình ngôn ngữ lớn AI. Rõ ràng, lợi thế của Web3 trong việc cải cách quan hệ sản xuất thể hiện rõ hơn trong các tình huống gán nhãn dữ liệu.
Thú vị thay, dự án Web3 AI này ra mắt token đúng vào thời điểm một gã khổng lồ công nghệ công bố mua lại với giá cao, đây có phải là sự trùng hợp hay là sắp đặt một cách khéo léo? Theo tác giả, điều này thực sự phản ánh một điểm chuyển mình của thị trường: bất kể là Web3 AI hay AI truyền thống, tất cả đã chuyển từ giai đoạn "so tài sức mạnh tính toán" sang giai đoạn "so tài chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng vốn, Web3 đang xây dựng một thử nghiệm "dân chủ hóa dữ liệu" quy mô lớn hơn bằng kinh tế token. Trận chiến về tương lai của AI mới chỉ bắt đầu.