巧用三种模式;
DeepSeek 提供基础模型、深度思考(R1)和联网搜索三种模式,分别适用于不同场景:;
基础模型:适用于大多数日常需求,性能比肩全球顶尖模型。;
深度思考(R1):擅长处理数理逻辑、代码和复杂问题,适合深度推理任务;
联网搜索:结合网络搜索结果回答问题,适用于知识库截止日期之后的问题,;
2.模型性能对比;
V3 模型:采用 Moe 架构,671B 参数,擅长百科知识,回答速度快,;
R1 模型:采用后训练+RL 强化学习,660B 参数,擅长逻辑推理,回答速度较慢。;
联网搜索:通常不与深度思考同时使用,以免影响智能表现。;
3.知识更新至 2024 年 7月;
DeepSeek 的预训练数据更新至 2024年7月,对于此日期之前的问题,通常无需开启联网功能;对于之后的问题,建议开启联网功能以获得更佳效果。;
4.提示词核心:准确表达;
DeepSeek 对提示词要求不高,关键在于准确表达需求。通用提示词模板包括“你是谁+你的目标”,并可根据需要补充背景信息。;
5.与 DS 沟通,尽量说人话;
与 DeepSeek 沟通时,使用直白、俗气的语言更能激发其潜能,例如模仿特定人物风格写作;
6.我是一名小学生;
为避免 AI 生成内容过于结构化和死板,可提示 DeepSeek 使用适合特定年龄段的语言,如“请用小学生能听懂的话解释”;
7.活用联网搜索;
DeepSeek 支持推理+联网搜索,可处理知识库截止日期之后的问题,例如根据最新事件创作故事;
8.活用上传附件;
DeepSeek 支持上传附件(最多 50 个,每个不超过 100MB),可基于自有知识库进行推理和思考,适用于本地化、私密化需求。;
9.活用 V3+R1;
可将 V3 模型和 R1 模型结合使用,先用 V3 获取细节和提示词,再用 R1进行深度推理和输出,提升模型能力。;
10.R1的三个开放;
DeepSeek 对 R1 模型实现了三个开放:;
思维链全开放:可查看完整、透明的思考过程,;