Viện nghiên cứu Tân Hoa Xã đã công bố một báo cáo về các mô hình quy mô lớn trong nước: Xunfei Xinghuo số 1, Baidu Wenxin số 2

2023-08-14 07:19:23

Tác giả: Bốc Thư Thanh

Kể từ khi ChatGPT gây ra làn sóng đầu tư vào trí tuệ nhân tạo, các mô hình quy mô lớn trong nước mọc lên như nấm, tính đến đầu tháng 7 đã có hơn 80 mô hình trí tuệ nhân tạo quy mô lớn với quy mô tham số hơn 1 tỷ trong Trung Quốc. Trước xu hướng mới này, các mô hình quy mô lớn trong nước nên được lựa chọn như thế nào? Mô hình lớn nào mạnh nhất?

Vào ngày 12 tháng 8, Trung tâm Nghiên cứu Phát triển Doanh nghiệp Trung Quốc thuộc Viện Nghiên cứu của Tân Hoa Xã đã công bố "Báo cáo Trải nghiệm Mô hình Lớn Trí tuệ Nhân tạo 2.0" (sau đây gọi là "Báo cáo"), là doanh nghiệp sản xuất trong nước phổ biến nhất như như Baidu Wenxin Yiyan và Ali Tongyi Qianwen. Các ứng dụng mô hình lớn nói chung được đánh giá.

Tổng cộng có 500 câu hỏi ngẫu nhiên được thiết kế để đánh giá này, so sánh với trình độ con người đã được giáo dục đại học, nhấn mạnh giá trị thực tế đối với ngành và cuộc sống, và tuân thủ nghiêm ngặt bốn chỉ số năng lực cơ bản, chỉ số IQ, chỉ số EQ và công cụ. chỉ số hiệu quả Các chiều đánh giá được tính trọng số để đảm bảo tính chặt chẽ của toàn bộ quá trình đánh giá.

Kết quả cuối cùng hơi bất ngờ ** Xunfei Xinghuo xếp thứ nhất trong cuộc đánh giá này với tổng số điểm là 1013 điểm, và đứng đầu ở hai khía cạnh chỉ số IQ và chỉ số hiệu quả công cụ trong bốn khía cạnh đánh giá; Baidu Wenxin Yiyan Nó xếp hạng thứ hai và thứ ba tương ứng với SenseTime. **

Theo "Báo cáo", Xunfei Xinghuo có bảy khả năng cốt lõi, đó là tạo văn bản, hiểu ngôn ngữ, hỏi và trả lời kiến thức, suy luận logic, khả năng toán học, khả năng viết mã và khả năng đa phương thức. Có kiến thức đa miền và khả năng hiểu ngôn ngữ, đồng thời có thể hiểu và thực hiện các nhiệm vụ dựa trên đối thoại tự nhiên.

** Ở phần năng lực cơ bản, khoảng cách giữa con người và AI là không đáng kể. ** Hiệu suất của Baidu Wenxin là bắt mắt nhất trong số các mô hình; SenseTime, Zhipu AI hatGLM, 360 Smart Brain hoạt động tốt, Xunfei Xinghuo, Ali Tongyi Qianwen, Lanzhou Technology Mchat, Kunlun Wanwei Tiangong hoạt động tốt Vẫn tốt.

Xét về đánh giá IQ,** con người vẫn có lợi thế rõ ràng và điểm số là cao nhất. **Trong số tất cả các mô hình được đánh giá, Xunfei Xinghuo và Zhipu A-ChatGLM xếp hạng đầu; Baidu Wenxin Yiyan và Kunlun Wanwei Tiangong hoạt động tốt.

Khoảng cách giữa AI và con người rõ ràng nhất khi nói đến trí tuệ cảm xúc. ** "Báo cáo" nói rằng không có dấu hiệu rõ ràng nào về khả năng nhận thức cảm xúc của AI đã được quan sát. Mặc dù vậy, SenseTime cho thấy chỉ số EQ cao vượt qua các đồng nghiệp của nó, đứng đầu với số điểm 346, Baidu Wenxin Yiyan và Lanzhou Technology · Mchat lần lượt xếp thứ hai và thứ ba.

Cuối cùng, về mặt nâng cao hiệu quả công việc, "Báo cáo" cho rằng AI hỗ trợ đắc lực cho con người và tốc độ xử lý của AI vượt xa con người. Tuy nhiên, bất chấp những ưu điểm về tốc độ và hiệu quả cao của AI, trí tuệ và trí tưởng tượng của con người vẫn đóng vai trò không thể thay thế trong một số nhiệm vụ phức tạp và sáng tạo. Kết quả đánh giá cho thấy Xunfei Xinghuo đứng đầu với số điểm 350 và bỏ xa phía trước, trong khi Baidu Wenxin Yiyan và Shangtang Shangdi lần lượt xếp thứ hai và thứ ba.

"Báo cáo" tin rằng so với tháng 6 năm 2023, các sản phẩm mô hình quy mô lớn hiện tại ở Trung Quốc đã có những tiến bộ đáng kể. Tuy nhiên, so với những người có trình độ học vấn cao, vẫn có một khoảng cách nhất định giữa những người mẫu lớn về chỉ số IQ và EQ. Mặc dù ở các lĩnh vực khác nhau, AI và con người cho thấy những ưu nhược điểm khác nhau, nhưng nhìn chung, sự phát triển của các mô hình quy mô lớn AI đã mang lại những tác động tích cực quan trọng đến chất lượng và hiệu quả công việc và cuộc sống của con người, và các mô hình quy mô lớn đang tăng tốc vào Sống và vào ngành.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
#Gate Square Qixi Celebration
570 Phổ biến
#Crypto Market Pullback
269k Phổ biến
#Trump Removes Fed Governor Cook
444 Phổ biến
#Companies Expand Crypto Reserves
66 Phổ biến
#Gate Alpha DORA Points Airdrop
63 Phổ biến

Ghim

sơ đồ trang web