deepseek已经发表论文的有哪些？网址是什么？

技术文章 February 09, 2025

以下是 DeepSeek 已发表的主要论文及其对应的论文地址（截至2025年2月9日）：

---

### **一、核心语言模型与架构创新**
1. **《DeepSeek LLM: Scaling Open-Source Language Models with Longtermism》**
- **发布时间**：2024年1月5日
- **主要内容**：提出基于长期主义的开源语言模型扩展策略，优化分组查询注意力（GQA）与多步学习率调度器，性能超越 LLaMA-2 70B。
- **论文地址**：[arXiv:2401.02954](https://arxiv.org/abs/2401.02954)

2. **《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》**
- **发布时间**：2024年1月11日
- **主要内容**：提出细粒度专家分割与共享专家隔离策略，提升混合专家模型（MoE）的专业化水平，降低计算成本。
- **论文地址**：[arXiv:2401.06066](https://arxiv.org/abs/2401.06066)

3. **《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》**
- **发布时间**：2024年5月
- **主要内容**：结合多头潜在注意力（MLA）与改进的 MoE 架构，显著优化推理效率与训练成本。
- **论文地址**：[arXiv:2405.04434](https://arxiv.org/abs/2405.04434)

4. **《DeepSeek-V3 Technical Report》**
- **发布时间**：2024年12月27日
- **主要内容**：总参数量达671B，支持多令牌预测（MTP）与FP8混合精度训练，显著降低训练成本至557.6万美元。
- **论文地址**：[arXiv:2412.19437](https://arxiv.org/abs/2412.19437)

---

### **二、推理与强化学习突破**
5. **《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》**
- **发布时间**：2025年1月
- **主要内容**：通过纯强化学习（RL）提升模型推理能力，无需监督微调，并在数学与编程任务中达到与 OpenAI o1 相当的水平。
- **论文地址**：[arXiv:2501.12948](https://arxiv.org/abs/2501.12948)

6. **《Distilling Reasoning Capabilities from DeepSeek-R1 to Smaller Models》**
- **发布时间**：2025年1月
- **主要内容**：将 DeepSeek-R1 的推理能力蒸馏至 Qwen 和 Llama 系列小模型，显著提升其性能。
- **论文地址**：[GitHub](https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf)

---

### **三、多领域与多模态扩展**
7. **《深度求索代码模型V2：打破代码智能领域中闭源模型的壁垒》**
- **发布时间**：2024年6月17日
- **主要内容**：对标 GitHub Copilot，开源代码模型在生成与理解任务中表现优异。
- **论文地址**：未提供公开链接，需通过 CSDN 下载合集

8. **《深度求索视觉语言模型：迈向真实世界的视觉-语言理解》**
- **发布时间**：2024年3月11日
- **主要内容**：探索视觉-语言联合建模，支持机器人、AR/VR等真实场景应用。
- **论文地址**：未提供公开链接，需通过 CSDN 下载合集

---

### **四、其他关键技术报告**
9. **《深度求索证明器V1.5：利用证明助手反馈进行强化学习和蒙特卡洛树搜索》**
- **发布时间**：2024年8月15日
- **主要内容**：结合形式化验证与强化学习，优化数学与逻辑推理能力。
- **论文地址**：未提供公开链接，需通过 CSDN 下载合集

---

### **论文合集下载**
- **CSDN 下载链接**：[DeepSeek论文合集](https://download.csdn.net/download/admans/90345790)

---

### **补充说明**
- 部分论文（如代码模型V2、视觉语言模型）未直接提供公开链接，建议通过 CSDN 合集或 GitHub 仓库获取完整技术文档。
- 最新论文动态可关注 DeepSeek 官方 GitHub 页面：[DeepSeek-ai](https://github.com/deepseek-ai) 。

Shop By Categories

deepseek已经发表论文的有哪些？网址是什么？

No comments

About Us

Contact Us

Links

Featured Articles

Follow us