给 Deepseek 发 <think> 之后，它就串台了？

网上很多人发现给 Deepseek 发 <think> 之后会展示出 Deepseek 与别人的对话内容，真的吗？

近期在网上冲浪时，发现很多人在说，给 Deepseek 发送 <think> 之后，它看起来像别人的对话片段，就像这样：

deepseek 胡说

真是如此吗？于是我上网查了一些资料。

当然不是泄露

Deepseek 怎么会犯这么低级的错误呢？只靠一个简单的 <think> 就能让它串台，泄露其他用户的对话内容？

`<think>` 是特殊 token

Deepseek 在训练时使用 <think> 和 </think> 标记思维链推理过程。<think> 被识别成了特殊 token，当用户单独发送时，模型会误以为自己进入了思考模式。

你发了空指令

当你只发送了一个 <think>，大模型把它当成了开始思考的信号，却没有收到明确的问题，于是它只能根据训练时学到的语言模式继续生成内容。这些内容看似像真实对话，实际上是模型凭概率"编"出来的，只是触发了大模型的幻觉罢了。

icon

设想一下

default

一个领导只对你说”想一想”，没有其他信息，你只好开始胡编了...

如何安装 Windows 的包管理器 scoop 并配置国内镜像May 15

如何处理 PowerShell 中文乱码问题May 11

评论区

评论加载中...