• 2025-05-22

JK-DeepSeek-R1与DeepResearch复现之旅,直击微调复现技术核心,开源复现项目解读课程

课程介绍

DeepSeek-R1 的成功不仅为大模型的发展提供了新的方向,也为未来人工智能的研究和应用奠定了坚实基础。近期围绕 DeepSeek-R1 的讨论也越来越多,于是我们开设了这门前沿课程,希望能帮你拨开迷雾,更深入地了解大模型前沿知识,学习到 DeepSeek-R1 的核心技术,以及众多 DeepSeek-R1 开源项目的复现思路。

课程涵盖以下话题:

  • 推理类模型是如何炼成的?
  • DeepSeek-R1 类模型擅长做哪些事?
  • 蒸馏 DeepSeek-R1 进行微调复现的思路是怎样的?
  • 如何理解 DeepSeek-R1-zero 中的核心技术(GRPO、奖励策略)?
  • OpenAI 推出的 Deep Research 如何应用?
  • DeepSeek-R1、Deep Research 有哪些值得关注学习的开源项目?
  • 课程目录

    01|课程概览
    时长 03:03
    02|DeepSeek R1等推理类大模型回顾
    时长 08:57
    03|目前复现o1的常规思路
    时长 06:58
    04|增强模型推理能力的四种范式
    时长 19:57
    05|落地角度看推理类模型和GPT模型
    时长 06:12
    06|如何用好推理模型?
    时长 13:11
    07|蒸馏DeepSeek R1的微调复现思路(上)
    时长 29:09
    08|蒸馏DeepSeek R1的微调复现思路(下)
    时长 34:08
    09|Deepseek R1-zero核心思路
    时长 24:04
    10|DeepSeek R1开源复现项目解读(上)
    时长 16:19
    11|Deepseek R1开源复现项目解读(中)
    时长 15:07
    12|Deepseek R1开源复现项目解读(下)
    时长 10:42
    13|什么是Deep Research,如何使用?
    时长 10:14
    14|Deep Research六大复现项目
    时长 31:04
    15|总结
    时长 03:50




正文到此结束