词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
[📎 Image #1] 徽章形式显示在输入框上方Ctrl+C 可清除所有已附加图像。~/.hermes/images/。/paste 命令/paste/paste 并按 Enter。Hermes 会检查剪贴板中是否有图像并附加。当你的终端重写了 Cmd+V/Ctrl+V,或剪贴板中只有图像而没有 bracketed-paste(括号粘贴)文本载荷可供检查时,这是最安全的选项。file://... 图像 URI 可以立即附加,而不是以原始文本形式留在编辑器中。/paste 作为显式图像附加的备用方案。/terminal-setup(适用于 VS Code / Cursor / Windsurf)workbench.action.terminal.sendSequence 绑定,以获得更好的多行输入及撤销/重做一致性:/terminal-setupCmd+Enter、Cmd+Z 或 Shift+Cmd+Z 被 IDE 拦截时,此命令尤为有用。仅在本地机器上运行——不要在 SSH 会话中使用。| 环境 | /paste | Cmd/Ctrl+V | /terminal-setup | 备注 |
|---|---|---|---|---|
| macOS Terminal / iTerm2 | ✅ | ✅ | n/a | 最佳体验——原生剪贴板 + 截图路径恢复 |
| Apple Terminal | ✅ | ✅ | n/a | 若 Cmd+←/→/⌫ 被重写,使用 Ctrl+A / Ctrl+E / Ctrl+U 备用方案 |
| Linux X11 桌面 | ✅ | ✅ | n/a | 需要 xclip(apt install xclip) |
| Linux Wayland 桌面 | ✅ | ✅ | n/a | 需要 wl-paste(apt install wl-clipboard) |
| WSL2(Windows Terminal) | ✅ | ✅ | n/a | 使用 powershell.exe——无需额外安装 |
| VS Code / Cursor / Windsurf(本地) | ✅ | ✅ | ✅ | 推荐,以获得更好的 Cmd+Enter / 撤销 / 重做一致性 |
| VS Code / Cursor / Windsurf(SSH) | ❌² | ❌² | ❌³ | 请在本地机器上运行 /terminal-setup |
| SSH 终端(任意) | ❌² | ❌² | n/a | 无法访问远程剪贴板 |
osascript(macOS 内置)读取剪贴板。如需更快的性能,可选择安装 pngpaste:xclip:wl-clipboard:/proc/version 自动检测 WSL2,并使用 powershell.exe 通过 .NET 的 System.Windows.Forms.Clipboard 访问 Windows 剪贴板。这是 WSL2 Windows 互操作的内置功能——powershell.exe 默认可用。wl-paste。WSLg 的剪贴板桥接仅支持 BMP 格式的图像——Hermes 会使用 Pillow(如已安装)或 ImageMagick 的 convert 命令自动将 BMP 转换为 PNG。xclip、wl-paste、powershell.exe、osascript)读取的是其所在机器的剪贴板——即远程服务器,而非你的本地机器。因此,本地剪贴板中的图像在远程端无法访问。scp、VSCode 文件浏览器(拖放)或任何文件传输方式上传到远程服务器,然后通过路径引用。(计划在未来版本中提供 /attach <filepath> 命令。)vision_analyze 直接查看任意图像 URL。ssh -X 连接以转发 X11。这允许远程机器上的 xclip 访问你本地的 X11 剪贴板。需要本地运行 X 服务器(macOS 上为 XQuartz,Linux X11 桌面内置)。大图像传输较慢。osascript、powershell.exe、xclip、wl-paste)独立读取剪贴板。{
"type": "image_url",
"image_url": {
"url": "data:image/png;base64,..."
}
}| 你的模型 | 图像处理方式 |
|---|---|
| 支持视觉的模型(GPT-4V、Claude with vision、Gemini、Qwen-VL、MiMo-VL 等) | 使用上述提供商原生图像内容格式,以真实像素发送。无文本 摘要层。 |
| 纯文本模型(DeepSeek V3、较小的开源模型、旧版纯对话端点) | 通过 vision_analyze 辅助工具路由——辅助视觉模型描述图像,文本描述注入对话。 |
auxiliary.vision 下配置——参见辅助模型。vision_analyze 具有相同的双重行为vision_analyze 工具本身遵循相同的路由逻辑。当当前主模型支持视觉,且其提供商支持在工具结果中包含图像内容(目前为 Anthropic、OpenAI、Azure-OpenAI 和 Gemini 3.x 技术栈),vision_analyze 会跳过辅助描述器,直接将原始图像像素作为多模态工具结果信封返回。主模型在下一轮会原生看到图像——无辅助调用、无文本摘要信息损失、无额外延迟。vision_analyze 回退到旧路径:请求已配置的辅助视觉模型描述图像,并以纯文本形式返回描述。无论哪种情况,调用工具的签名相同——工具在运行时根据当前模型决定采用哪条路径。