本周四晚20:00,与Datawhale长琴、Cherry Studio联合创始人Yinsen探讨DeepSeek R1技术解析与应用趋势!
扫描上方二维码即可报名
2025年开年,DeepSeek R1横空出世,真正开启了大模型推理的新时代。它的出现提升了LLM的整体能力,让模型在推理时进行自我思考和验证,让AI更加像人。同时,其开源的举措为业界和学界做出了巨大的技术贡献,“复刻DeepSeek”在全球掀起热潮,各大模型厂商和研究院也纷纷基于其提出的训练模式、技术突破优化各自模型性能。如近期,来自荷兰阿姆斯特丹的研究人员打破之前UC伯克利博士纪录,采用轻量级的RL算法Reinforce-Lite,只用不到10美元就复刻出DeepSeek顿悟时刻;微软亚研院也在一项工作中,受DeepSeek启发,让7B模型涌现出了高级推理技能。
在DeepSeek此前发布的论文中,我们看到R1带来的创新,几乎影响到了LLM的每一个阶段。R1-Zero 通过 Pretrain(DeepSeek-V3-Base)和 RL(GRPO)实现,证明了 Pure Rule 的 RL 有效,且模型具备自我验证、反思及生成长 COT 的能力,但存在可读性差和语言混合问题;R1 通过 Pretrain、Cold-Start(SFT)、RL 提升推理能力、生成数据并对 Base 进行 SFT 监督数据微调、再经 RL 对齐,实现了先提升推理能力生成数据,再提升LLM的整体能力的过程;蒸馏是使用 R1 数据对学生模型进行 SFT,且蒸馏效果优于 RL,经 R1 数据 SFT 的小模型能力提升,效果好于强化学习结合小模型。
更重要的是,R1以不到OpenAI O1模型1/10的推理价格,达到了类似的效果,这一价格优势直接降低了企业及开发者的门槛。据不完全统计,自2025年2月以来,国内已有超过160家组织宣布在业务中接入R1,包括政府机关、事业单位、互联网公司等。此前坚持自研大模型的部分公司,也积极拥抱R1模型。究其原因,根本在于大模型3至6个月迭代一次,用户迁移成本低,本身没有粘性。DeepSeek做到了模型性能领先一代的同时,还拥有极具竞争力的使用成本。
在应用方面,模型能力对于应用的影响是决定性的。R1更擅长的是长逻辑链推理的深度分析、多步骤规划和不确定性管理的动态问题。从场景来看,R1最适合的场景是推理性文本创作,通过自我思考的推理能力,处理复杂问题,进行创新性创作。例如推理小说剧本创作、互动游戏剧情编写、还有目前最受欢迎的学术论文撰写等;此外在一些低延时强事实的场景下也同样适用,简单来说就是对内容质量要求高,任务难度大,但对价格和时间不敏感的场景,例如工程、金融风险建模、医疗数据分析等。
2月27日,本周四晚20:00,热爱创新的嘉程资本携手Datawhale开启嘉程创业流水席第251席!我们邀请了Datawhale长琴、Cherry Studio联合创始人Yinsen一起深度探讨DeepSeek R1技术解析与应用趋势!欢迎各位关注DeepSeek领域上下游的研发人员、创业者、投资人和行业专家一起参加!
再次邀请上车!
嘉程资本Next Capital是一家专注科技领域的早期投资基金,作为创新者的第一笔钱,我们极度信仰科技驱动的行业创新,与极具潜力的未来科技领袖共同开启未来。
我们的投资涵盖人工智能、硬科技、数字医疗与健康、
科技全球化、生物科技与生命科学、企业服务、云原生、专精特新、机器人等领域。投资案例包括元气森林、熊猫速汇、寻找独角兽、店匠、士泽生物、芯宿科技、未名拾光、橄榄枝健康、硅基仿生等多家创新公司。
嘉程资本旗下的创投服务平台包括「嘉程创业流水席」,「NEXT创新营」、「未来联盟」等产品线,面向不同定位的华人科技创新者,构建了大中华区及北美、欧洲和新加坡等国家地区活跃的华人科技创新生态,超过3000位科技行业企业家与巨头公司高管在嘉程的平台上分享真知灼见和最新趋势。
嘉程资本投资团队来自知名基金和科技领域巨头,在早期投资阶段富有经验,曾主导投资过乐信(NASDAQ:LX)、老虎证券(NASDAQ:TIGR)、团车(NASDAQ:TC)、美柚、牛股王、易快报、PingCAP、彩贝壳、云丁智能等创新公司的天使轮,并创办过国内知名创投服务平台小饭桌。
嘉程资本是创新者思考的伙伴,成长的伙伴。