Tuesday, March 25, 2025
spot_img

DeepSeek là gì và tại sao nó đang làm rung chuyển ngành AI?

BẮC KINH, ngày 27 tháng 1 (Reuters) – Công ty khởi nghiệp DeepSeek của Trung Quốc đã ra mắt các mô hình AI mới nhất của mình, được cho là ngang bằng hoặc vượt trội so với các mô hình hàng đầu của Mỹ với chi phí chỉ bằng một phần nhỏ. Điều này đang đe dọa thay đổi trật tự công nghệ toàn cầu.
Công ty đã thu hút sự chú ý trong giới AI quốc tế sau khi công bố trong một bài báo tháng trước rằng việc đào tạo DeepSeek-V3 chỉ tốn chưa đến 6 triệu USD chi phí tính toán từ các chip Nvidia H800.
Trợ lý AI của DeepSeek, được vận hành bởi DeepSeek-V3, đã vượt qua đối thủ ChatGPT để trở thành ứng dụng miễn phí được đánh giá cao nhất trên App Store của Apple tại Mỹ.
Điều này đã làm dấy lên nghi ngờ về lý do đằng sau quyết định của một số công ty công nghệ Mỹ đầu tư hàng tỷ đô la vào AI. Cổ phiếu của một số gã khổng lồ công nghệ, bao gồm Nvidia, cũng bị ảnh hưởng.

Dưới đây là một số thông tin về công ty đang làm rung chuyển ngành AI toàn cầu.

TẠI SAO DEEPSEEK GÂY XÁO ĐỘNG?

Việc phát hành ChatGPT của OpenAI vào cuối năm 2022 đã khiến các công ty công nghệ Trung Quốc lao vào phát triển chatbot AI của riêng mình.
Tuy nhiên, sau khi Baidu, gã khổng lồ tìm kiếm (9888.HK), phát hành chatbot tương tự ChatGPT đầu tiên của Trung Quốc, nhiều người thất vọng về khoảng cách năng lực AI giữa Mỹ và Trung Quốc.
Chất lượng và hiệu quả chi phí của các mô hình DeepSeek đã thay đổi hoàn toàn câu chuyện này. Hai mô hình được khen ngợi bởi các giám đốc điều hành Thung lũng Silicon và kỹ sư công nghệ Mỹ, DeepSeek-V3 và DeepSeek-R1, được cho là ngang tầm với các mô hình tiên tiến nhất của OpenAI và Meta.

Hơn nữa, các mô hình này còn rẻ hơn để sử dụng. Theo bài đăng trên tài khoản chính thức của DeepSeek trên WeChat, mô hình DeepSeek-R1, ra mắt tuần trước, rẻ hơn từ 20 đến 50 lần so với mô hình o1 của OpenAI, tùy thuộc vào tác vụ.
Tuy nhiên, một số người đã công khai bày tỏ hoài nghi về câu chuyện thành công của DeepSeek.

CEO của Scale AI, Alexandr Wang, trong một cuộc phỏng vấn với CNBC hôm thứ Năm, không đưa ra bằng chứng nhưng tuyên bố rằng DeepSeek sở hữu 50.000 chip Nvidia H100. Ông cho rằng việc tiết lộ điều này có thể vi phạm các kiểm soát xuất khẩu của Washington, vốn cấm bán các chip AI tiên tiến như vậy cho các công ty Trung Quốc. DeepSeek chưa phản hồi ngay lập tức yêu cầu bình luận về cáo buộc này.
Các nhà phân tích của Bernstein hôm thứ Hai nhấn mạnh trong một ghi chú nghiên cứu rằng tổng chi phí đào tạo mô hình V3 của DeepSeek chưa được tiết lộ nhưng cao hơn nhiều so với con số 5,58 triệu USD mà công ty tuyên bố. Các chi phí đào tạo của mô hình R1 cũng không được công bố.

AI ĐỨNG SAU DEEPSEEK LÀ AI?

DeepSeek là một công ty khởi nghiệp có trụ sở tại Hàng Châu, với cổ đông kiểm soát là Lương Văn Phong, đồng sáng lập quỹ đầu cơ định lượng High-Flyer, theo hồ sơ doanh nghiệp Trung Quốc.
Quỹ của Lương đã công bố vào tháng 3 năm 2023 trên tài khoản chính thức WeChat rằng họ đang “khởi động lại”, vượt ra ngoài giao dịch để tập trung nguồn lực vào việc tạo ra một “nhóm nghiên cứu mới và độc lập để khám phá bản chất của AGI” (Trí tuệ Nhân tạo Chung). DeepSeek được thành lập vào cuối năm đó.
OpenAI định nghĩa AGI là các hệ thống tự động vượt trội hơn con người trong hầu hết các nhiệm vụ có giá trị kinh tế.
Hiện không rõ High-Flyer đã đầu tư bao nhiêu vào DeepSeek. High-Flyer có văn phòng đặt trong cùng tòa nhà với DeepSeek và cũng sở hữu các bằng sáng chế liên quan đến cụm chip được sử dụng để đào tạo các mô hình AI, theo hồ sơ doanh nghiệp Trung Quốc.
Đơn vị AI của High-Flyer cho biết vào tháng 7 năm 2022 trên tài khoản chính thức WeChat rằng họ sở hữu và vận hành cụm 10.000 chip A100.

BẮC KINH NHÌN NHẬN DEEPSEEK NHƯ THẾ NÀO?

Thành công của DeepSeek đã được chú ý trong các tầng lớp chính trị hàng đầu của Trung Quốc. Vào ngày 20 tháng 1, ngày DeepSeek-R1 được công bố, nhà sáng lập Lương đã tham dự một hội nghị kín dành cho doanh nhân và chuyên gia, do Thủ tướng Trung Quốc Lý Cường chủ trì, theo Tân Hoa Xã.
Sự hiện diện của Lương tại hội nghị có thể là dấu hiệu cho thấy thành công của DeepSeek có thể đóng vai trò quan trọng trong mục tiêu chính sách của Bắc Kinh nhằm vượt qua kiểm soát xuất khẩu của Washington và đạt được sự tự chủ trong các ngành chiến lược như AI.
Hội nghị tương tự vào năm ngoái cũng có sự tham dự của CEO Baidu, Robin Li.

Nguồn reuters

BÀI VIẾT LIÊN QUAN

MỚI CẬP NHẬT

spot_img