Wishlist 0 ¥0.00

deepseek已经发表论文的有哪些?网址是什么?

以下是 DeepSeek 已发表的主要论文及其对应的论文地址(截至2025年2月9日):

---

### **一、核心语言模型与架构创新**
1. **《DeepSeek LLM: Scaling Open-Source Language Models with Longtermism》**  
   - **发布时间**:2024年1月5日  
   - **主要内容**:提出基于长期主义的开源语言模型扩展策略,优化分组查询注意力(GQA)与多步学习率调度器,性能超越 LLaMA-2 70B。  
   - **论文地址**:[arXiv:2401.02954](https://arxiv.org/abs/2401.02954)   

2. **《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》**  
   - **发布时间**:2024年1月11日  
   - **主要内容**:提出细粒度专家分割与共享专家隔离策略,提升混合专家模型(MoE)的专业化水平,降低计算成本。  
   - **论文地址**:[arXiv:2401.06066](https://arxiv.org/abs/2401.06066)   

3. **《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》**  
   - **发布时间**:2024年5月  
   - **主要内容**:结合多头潜在注意力(MLA)与改进的 MoE 架构,显著优化推理效率与训练成本。  
   - **论文地址**:[arXiv:2405.04434](https://arxiv.org/abs/2405.04434)   

4. **《DeepSeek-V3 Technical Report》**  
   - **发布时间**:2024年12月27日  
   - **主要内容**:总参数量达671B,支持多令牌预测(MTP)与FP8混合精度训练,显著降低训练成本至557.6万美元。  
   - **论文地址**:[arXiv:2412.19437](https://arxiv.org/abs/2412.19437)   

---

### **二、推理与强化学习突破**
5. **《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》**  
   - **发布时间**:2025年1月  
   - **主要内容**:通过纯强化学习(RL)提升模型推理能力,无需监督微调,并在数学与编程任务中达到与 OpenAI o1 相当的水平。  
   - **论文地址**:[arXiv:2501.12948](https://arxiv.org/abs/2501.12948)   

6. **《Distilling Reasoning Capabilities from DeepSeek-R1 to Smaller Models》**  
   - **发布时间**:2025年1月  
   - **主要内容**:将 DeepSeek-R1 的推理能力蒸馏至 Qwen 和 Llama 系列小模型,显著提升其性能。  
   - **论文地址**:[GitHub](https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf)   

---

### **三、多领域与多模态扩展**
7. **《深度求索代码模型V2:打破代码智能领域中闭源模型的壁垒》**  
   - **发布时间**:2024年6月17日  
   - **主要内容**:对标 GitHub Copilot,开源代码模型在生成与理解任务中表现优异。  
   - **论文地址**:未提供公开链接,需通过 CSDN 下载合集   

8. **《深度求索视觉语言模型:迈向真实世界的视觉-语言理解》**  
   - **发布时间**:2024年3月11日  
   - **主要内容**:探索视觉-语言联合建模,支持机器人、AR/VR等真实场景应用。  
   - **论文地址**:未提供公开链接,需通过 CSDN 下载合集   

---

### **四、其他关键技术报告**
9. **《深度求索证明器V1.5:利用证明助手反馈进行强化学习和蒙特卡洛树搜索》**  
   - **发布时间**:2024年8月15日  
   - **主要内容**:结合形式化验证与强化学习,优化数学与逻辑推理能力。  
   - **论文地址**:未提供公开链接,需通过 CSDN 下载合集   

---

### **论文合集下载**
- **CSDN 下载链接**:[DeepSeek论文合集](https://download.csdn.net/download/admans/90345790)   

---

### **补充说明**
- 部分论文(如代码模型V2、视觉语言模型)未直接提供公开链接,建议通过 CSDN 合集或 GitHub 仓库获取完整技术文档。  
- 最新论文动态可关注 DeepSeek 官方 GitHub 页面:[DeepSeek-ai](https://github.com/deepseek-ai) 。

About Us

Since 1996, our company has been focusing on domain name registration, web hosting, server hosting, website construction, e-commerce and other Internet services, and constantly practicing the concept of "providing enterprise-level solutions and providing personalized service support". As a Dell Authorized Solution Provider, we also provide hardware product solutions associated with the company's services.
 

Contact Us

Address: No. 2, Jingwu Road, Zhengzhou City, Henan Province

Phone: 0086-371-63520088 

QQ:76257322

Website: 800188.com

E-mail: This email address is being protected from spambots. You need JavaScript enabled to view it.