
DeepSeek-R2: Rò rỉ thông tin về bản nâng cấp AI khủng, từng hoãn ra mắt vì CEO chưa duyệt
DeepSeek-R2 – Bước tiến mới trong cuộc đua AI toàn cầu
DeepSeek, công ty AI Trung Quốc từng gây sốc với mô hình DeepSeek-R1 có hiệu suất ngang GPT-4 nhưng chi phí thấp hơn tới 40 lần, đang chuẩn bị ra mắt phiên bản kế nhiệm DeepSeek-R2.
Theo các nguồn tin rò rỉ, R2 sẽ là cú nhảy vọt về khả năng lập trình, suy luận đa ngôn ngữ và hỗ trợ đa phương thức, hướng tới mục tiêu cạnh tranh trực diện với những mô hình hàng đầu của OpenAI, Google và Anthropic.
Những nâng cấp nổi bật của DeepSeek-R2

Khả năng lập trình mạnh mẽ hơn
R2 hứa hẹn cải thiện khả năng viết, sửa và tối ưu mã nguồn.
Hỗ trợ tốt hơn cho kiến trúc phần mềm phức tạp, tối ưu hoá luồng công việc của lập trình viên.
Suy luận đa ngôn ngữ cấp cao
Mở rộng hỗ trợ từ tiếng Anh và tiếng Trung sang nhiều ngôn ngữ quốc tế.
Khả năng xử lý câu hỏi – trả lời mang tính suy luận phức tạp hơn.
Tối ưu chi phí vận hành
Sử dụng kiến trúc MoE (Mixture-of-Experts) 3.0 và MLA (Multihead Latent Attention).
Theo một số nguồn tin, mô hình có thể đạt 1,2 nghìn tỷ tham số, giảm chi phí dự đoán tới 97,3% so với GPT-4.
Hỗ trợ đa phương thức (Multimodal)
Xử lý văn bản, hình ảnh, âm thanh, video trong một mô hình duy nhất.
Tích hợp kỹ thuật GRM (Generative Reward Modeling) và Self-Principled Critique Tuning để cải thiện độ chính xác.
Tối ưu phần cứng nội địa
Sử dụng chip Huawei Ascend 910B, giảm phụ thuộc vào GPU Nvidia trong bối cảnh Mỹ hạn chế xuất khẩu.
Thời điểm ra mắt và lý do hoãn

Kế hoạch ban đầu: DeepSeek-R2 dự kiến ra mắt đầu tháng 5/2025 để duy trì lợi thế cạnh tranh sau thành công của R1.
Thông tin rò rỉ mới nhất:
CEO Liang Wenfeng chưa duyệt bản phát hành vì hiệu năng chưa đạt kỳ vọng.
Nguồn cung GPU Nvidia H20 tại Trung Quốc khan hiếm, ảnh hưởng tới khả năng huấn luyện và triển khai mô hình.
Hiện trạng: Ngày ra mắt vẫn chưa được ấn định nhưng dự kiến là cuối Quý 3.2025 hoặc dầu Quý 4.2025, nhưng DeepSeek đã gửi thông số kỹ thuật R2 cho các nhà cung cấp dịch vụ đám mây để chuẩn bị hạ tầng.
Ý nghĩa của việc ra mắt DeepSeek-R2
Nếu ra mắt đúng kỳ vọng, DeepSeek-R2 sẽ Đưa Trung Quốc tiến gần hơn trong cuộc đua AI toàn cầu. Đồng thời tạo áp lực cạnh tranh lớn lên OpenAI, Google và các hãng AI phương Tây và mở ra cơ hội tiếp cận mô hình AI mạnh mẽ với chi phí thấp hơn cho doanh nghiệp và lập trình viên.