做 AI 竞品分析失败了：一次被 Bug 和需求膨胀拖垮的尝试

个人专栏

2026-04-15热度: 6013

作者复盘一次AI竞品分析工具开发失败经历，从简洁技术链路（爬虫、多模态识别、RAG增强生成、多Agent协同）起步，因过早引入伪需求（如问答交互、SaaS化、多租户系统）导致工程复杂度失控、成本激增且无法交付，最终反思应聚焦核心提效场景，避免早期过度产品化。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

AI竞品分析工具的探索之旅充满技术与成本的双重挑战。从多模态识别到RAG增强生成，开发者投入200多元却最终折戟于复杂的产品化陷阱。本文将深度复盘这场失败的实验，揭示从简洁技术栈到臃肿业务系统的致命转折，为AI产品落地提供血泪教训。

狂砸了 200 多块钱的 Claude API 调用费，结果最终还是失败了。非常心痛，于是写下这篇文章。总要有点收获，不能钱砸进去之后，什么都没剩下。

最初的设想与技术链路

刚开始我对 AI 竞品分析的设想非常简单：输入一个目标链接，系统自动分析页面内容，并按照固定的 Prompt 输出一篇结构化的竞品分析报告。

为了实现这个闭环，我设计了一条包含多节点的处理链路：

1）信息抓取（爬虫脚本）：拆分为两个独立的脚本执行。一个专门负责对网页进行全局截图；另一个负责把网页里的 HTML 源码和全量文本提取出来。

2）多模态识别（VLM Agent）：引入视觉模型，对第一步抓取到的网页截图进行识别，将图片中的视觉信息转化为文本描述。

3）数据清洗（Clean Agent）：负责处理乱序文本，将 HTML 源码里无用的标签和乱七八糟的冗余代码全部清洗掉，只保留干净的纯文本数据。

4）报告生成（Generator Agent）：将压缩后的截图与清洗后的纯文本，一并交给负责撰写分析报告的 Agent 进行归纳输出。

5）审查与兜底（Review Agent）：这是解决“AI 幻觉”和信任问题的核心机制。报告写完后，由审查 Agent 将生成的文字与原始图片及内容进行交叉验证，核实内容是否基于事实。如果不合格直接打回重写，设置重试上限为 3 次。如果 3 次后仍不达标，则在最终报告上明确标记“置信度较低”。

为了控制成本（省 Token）和提升效果，我在链路中应用了明确的工程策略：

1）图片压缩：截图直接丢给模型非常消耗 Token，必须在前端先进行压缩处理。

2）模型路由（大模型分发）：不同任务调用不同能力的大模型。多模态识别、报告生成和最终审查，调用能力强、价格高的模型以保证质量；而数据清洗这种机械工作，则分配给便宜的“小模型”处理。

3）结构化输出控制（Prompt Engineering）：为了保证不同 Agent 之间数据传递的稳定性，我放弃了让模型输出自然语言长文，而是通过 Few-Shot（少样本提示）和明确的 Prompt 约束，强制“报告生成 Agent”以严格的 JSON 格式（如包含核心功能、定价、目标客群等字段）输出。这使得下游的“审查 Agent”能够进行字段级的精准核对，而不是在长篇大论中迷失。

RAG