文章 · 豆逗子的小黑屋

GEMINI-CLI settings 参数详情

2025-12-09·4980 字·10 分钟

Gemini CLI Configuration AI Agent LLM A2A-Server DevTools

深入解析 Gemini CLI 核心配置参数，涵盖 Checkpointing、Model Aliases、Context 及 Tools 等关键模块。本文详细对比了 CLI 模式与 A2A-Server 模式下的参数支持差异，帮助开发者精准配置并优化 AI Agent 工作流。

使用 sing-box Tun 模式实现 V2rayU 的透明代理

2025-11-09·2609 字·6 分钟

MacOS Sing-Box V2rayU TUN 透明代理 Gemini CLI 排错

记录一次在 macOS 上解决 gemini-cli OAuth 登录失败的排错过程。由于 V2rayU 本身缺少 Tun 模式，无法代理 gemini-cli 的随机端口回调。本文介绍了一种巧妙的方案：使用 sing-box 开启 Tun 模式实现透明代理，拦截所有系统流量，并将其转发回 V2rayU 的 SOCKS 端口，从而完美解决了 CLI 工具的代理难题。

浅析 Claude Code 的执行与提示词

2025-10-12·13949 字·28 分钟

Claude Code Agent 提示词工程逆向工程 LLM 工具使用 Anthropic Agentic

通过逆向工程，深入揭秘 Anthropic AI 编程助手 Claude Code 的内部架构与工作原理。本文拆解了其主 Agent 与子 Agent 的协同机制、系统提示词、工具集定义以及上下文管理策略，助你全面理解这款强大 AI 工具的自主执行流程。

多模态模型是如何处理和理解图片的？

2025-06-15·6721 字·14 分钟

AI 多模态机器学习 ViT CLIP 视觉编码

从Vision Transformer到图文对齐，探索多模态模型背后的核心技术原理与实现方法，包括CLIP、SigLIP以及主流多模态大模型的视觉编码策略。

从配料表出发：便秘的猫应该怎么选主食

2025-06-08·3496 字·7 分钟

猫咪健康便秘猫粮推荐高纤维主食罐头配料表分析宠物营养

结合实际养猫经验，梳理适合便秘及肠胃敏感猫咪的主食猫粮和罐头选择标准，重点分析市售易消化、高膳食纤维产品的配料表和成分，帮助科学挑选有助于猫咪肠道健康的主食。

盘点开源的 DeepResearch 实现方案

2025-03-06·6702 字·14 分钟

DeepResearch DeepSearch Agent LLM Dify LangChain HuggingFace Zilliz 智能体大模型应用

基于源码分析开源的 DeepResearch 实现，包括 Dify、LangChain、HuggingFace 和 Zilliz Cloud 等方案的工程架构、Agent 设计、提示词和核心流程。

浅谈 DeepSeek-R1 和 Kimi k1.5 论文中的思维链 + 强化学习

2025-02-01·2588 字·6 分钟

AI LLM CoT 强化学习 DeepSeek Kimi 模型蒸馏思维链

浅谈 DeepSeek-R1 和 Kimi k1.5 两个模型在推理能力上的技术特点：DeepSeek 采用 GRPO 算法和模型蒸馏提升推理表现，Kimi 则探索长文本思维链和强化学习的结合方案。

使用 TiDB Vector 构建 LightRAG 知识库

2024-12-22·2506 字·6 分钟

RAG LLM AI TiDB 工程实践

梳理了 LightRAG 之后，发现 LightRAG 对持久化支持的还不够多，缺少了最重要的 TiDB (不是)。故抽空贡献之，顺便写个软文。

从论文到源码：详解 RAG 算法

2024-11-30·11764 字·24 分钟

RAG LLM AI 论文笔记算法原理

本文旨在通过论文+源码的解读，探究 RAG 算法的架构设计和具体的代码实现。本文主要讨论了 GraphRAG、LightRAG 和 RAPTOR RAG，除此之外还提及了 Anthropic 提出的 Contextual Retrieval 上下文检索和 RAG 算法的评估方法。最后在实践中，建议还是根据知识库文档的规模来选择不同的方法。

云南之行——游在大理食在昆明

2024-11-03·3666 字·8 分钟

旅游随笔闲谈美食

十一和女友去了云南玩，梳理一些令人印象深刻的美食和风景。

浅入浅出 Rerank 模型

2024-10-20·4241 字·9 分钟

检索 AI RAG 论文笔记

随着 Transformer 架构的流行，目前很多 Embedding 和 Rerank 模型都逐渐基于这个架构。借此机会梳理一下研究的过程和历史，盘点一下目前几个知名的 Rerank 模型的组织和公司所采用的架构。最后回归正题浅谈目前 RAG 场景到底要不要用 Rerank。

一年同行：我的TiDB社区之旅

2024-07-31·1305 字·3 分钟

随笔闲谈

加入 TiDB 社区快一年了，回顾一下这一年和 TiDB 有关的经历 👀

读书笔记《大语言模型》

2024-06-30·19143 字·39 分钟

书籍阅读大模型 AI

本文是《大语言模型》的阅读笔记，详细介绍了大语言模型的发展历程、训练优化方法、数据处理技术、解码策略、模型量化、模型压缩、提示学习、评测指标和方法，以及知识图谱在大语言模型中的应用，特别关注了扩展法则、涌现能力、人类对齐和多智能体系统等关键概念和技术。

TiDB Vector + Dify 快速构建 AI Agent

2024-05-26·1996 字·4 分钟

向量库 LlmOps 大模型 AI

本文介绍了如何使用 Dify 和 TiDB Vector 快速构建 AI Agent，包括前期准备、部署 Dify、配置知识库和创建 Agent 的详细步骤，以及源码分析和表结构设计。文章提供了 Dify 接入 TiDB Vector 后的表结构设计和 SQL 查询语句，帮助开发者更好地理解和使用这一集成方案。