博客

Page 135

12 articles

数据库原生 AI：当你的 Postgres 学会了嵌入
PostgreSQL 扩展如 pgvector 和 pgai 现在可以在数据库内部处理嵌入生成、向量搜索和 LLM 调用——消除了大多数 RAG 架构所承载的同步管道，并保持向量与源数据的事务一致性。
postgresvector-search
4月12日8 min
胶水工程师之死：AI 正在吞噬连接系统的工作
AI 代理正在快速自动化集成工作——ETL 管道、API 适配器、Webhook 处理器——这些正是胶水工程师赖以为生的领域。本文分析哪些工作最先消失、哪些仍不可或缺，以及如何在实现层消失之前向上迁移。
ai-engineeringcareer
4月12日12 min
像调试分布式系统一样调试你的 AI 智能体，而非把它当作普通程序
打印语句和扁平日志无法应对多步骤 AI 智能体的调试需求。结构化追踪、确定性重放以及重放-分叉-对比方法论，将分布式系统的调试理念引入智能体工作流。
ai-agentsdebugging
4月12日11 min
边缘 LLM 推理：当延迟、隐私或成本迫使你离开云端
一个在单 GPU 上微调的 7B 模型可以在特定领域以零边际 token 成本击败 GPT-4。关于硬件选型、量化格式、混合本地-云端路由以及使边缘 LLM 推理达到生产级别的部署框架的实用指南。
edge-aillm-inference
4月12日10 min
推理网关模式：为什么每个生产环境 AI 团队都在构建同一套中间件
推理网关是一种新兴的架构模式——应用与 LLM 提供商之间的中间件层，整合了限流、故障转移、成本追踪和路由功能。本文详解为何每个生产环境 AI 团队都趋同于这一模式，以及如何构建或采购。
inference-gatewayllm
4月12日9 min
内部 AI 工具 vs. 外部 AI 产品：为什么安全标准的转变方式与大多数团队的认知恰恰相反
内部 AI 工具往往比面向客户的产品需要更多的安全工程——但是完全不同的类型。环境权限、静默故障以及跨分类边界的数据合成如何使内部部署成为更高风险的选择。
ai-safetyenterprise-ai
4月12日9 min
知识图谱回归：为什么 RAG 团队正在为检索添加结构化数据
基线 RAG 在多跳问题上仅能覆盖 22-32% 的答案，而 GraphRAG 可达到 72-83%。本文提供了一份实用指南，介绍如何在检索管道中添加知识图谱结构——包括构建模式、路由策略，以及何时不值得引入 schema 开销。
insiderknowledge-graphs
4月12日9 min
LLM 供应商锁定：真正有效的可移植性模式
大多数 LLM 锁定建议止步于 API 封装——但真正的锁定隐藏在提示词、工具调用假设和行为差异中。以下是抽象层无法解决的可移植性模式。
llmvendor-lock-in
4月12日10 min
MCP 可组合性陷阱：当「再加一个服务器」变成依赖地狱
MCP 生态在六十天内涌现了 10,000+ 服务器和 30 个 CVE。依赖蔓延、供应链攻击和工具冲突如何将可组合性变成负债——以及防止这些问题的运维模式。
insidermcp
4月12日11 min
开源权重模型的生产实践：自托管何时真正优于 API
一个关于自托管 Llama、Mistral 和 Qwen 等开源权重模型与使用前沿 API 的实用决策框架——涵盖真实成本分析、合规触发条件、运维负担，以及大多数生产团队实际需要的混合架构。
llmself-hosting
4月12日10 min
后框架时代：用 API 客户端和 While 循环构建智能体
为什么 80% 的生产环境 AI 智能体只需要一个提示词、一个工具列表和一个 while 循环——以及框架复杂性如何成为它承诺消除的瓶颈。
ai-agentsllm
4月12日8 min
10倍提示工程师的神话：为什么系统设计比提示词打磨更重要
生产数据显示，前5小时的提示词工作带来35%的提升，而接下来的40小时仅增加1%。LLM应用的真正杠杆在于检索质量、任务分解、输出验证和评估基础设施——而非提示词打磨。
insiderprompt-engineering
4月12日9 min

较新的博文

较旧的博文

Page 135

数据库原生 AI：当你的 Postgres 学会了嵌入

胶水工程师之死：AI 正在吞噬连接系统的工作

像调试分布式系统一样调试你的 AI 智能体，而非把它当作普通程序

边缘 LLM 推理：当延迟、隐私或成本迫使你离开云端

推理网关模式：为什么每个生产环境 AI 团队都在构建同一套中间件

内部 AI 工具 vs. 外部 AI 产品：为什么安全标准的转变方式与大多数团队的认知恰恰相反

知识图谱回归：为什么 RAG 团队正在为检索添加结构化数据

LLM 供应商锁定：真正有效的可移植性模式

MCP 可组合性陷阱：当「再加一个服务器」变成依赖地狱

开源权重模型的生产实践：自托管何时真正优于 API

后框架时代：用 API 客户端和 While 循环构建智能体

10倍提示工程师的神话：为什么系统设计比提示词打磨更重要

关于 Tian Pan