AI成本追踪表

AI成本追踪表 ​

AI成本追踪表

一、月度成本记录

二、模型路由记录

三、优化效果对比

使用方法

填写说明

一、月度成本记录 ​

二、模型路由记录 ​

三、优化效果对比 ​

使用方法 ​

填写说明 ​

一、月度成本记录

二、模型路由记录

三、优化效果对比

使用方法

填写说明

基本信息

1.1 API成本

1.2 工具订阅成本

1.3 云服务与基础设施

1.4 营销与获客成本

1.5 月度成本汇总

2.1 任务-模型映射表

2.2 模型切换决策树

2.3 模型成本速查

3.1 优化实验记录

3.2 优化前后对比总览

3.3 成本优化检查清单

基本信息 ​

1.1 API成本 ​

1.2 工具订阅成本 ​

1.3 云服务与基础设施 ​

1.4 营销与获客成本 ​

1.5 月度成本汇总 ​

2.1 任务-模型映射表 ​

2.2 模型切换决策树 ​

2.3 模型成本速查 ​

3.1 优化实验记录 ​

3.2 优化前后对比总览 ​

3.3 成本优化检查清单 ​

基本信息

1.1 API成本

1.2 工具订阅成本

1.3 云服务与基础设施

1.4 营销与获客成本

1.5 月度成本汇总

2.1 任务-模型映射表

2.2 模型切换决策树

2.3 模型成本速查

3.1 优化实验记录

3.2 优化前后对比总览

3.3 成本优化检查清单

⚠️ 免责声明：本页面内容仅供学习参考，不构成法律、财税、投资或专业建议。涉及具体业务决策时，请咨询律师、会计师或其他合格专业人士。查看完整声明

用途：追踪AI相关的各项成本，找到优化空间，确保投入产出比可控。

项目	内容
记录月份	____年____月
本月收入（元）	¥________
上月收入（元）	¥________

服务商	模型/服务	用途	费用（元）
OpenAI	GPT-4o
OpenAI	GPT-4o-mini
Anthropic	Claude 3.5 Sonnet
Anthropic	Claude 3 Haiku
Google	Gemini Pro
阿里云	通义千问
百度	文心一言
其他
API成本小计	—	—	¥________

工具名称	类别	套餐	费用（元/月）	使用频率
	内容生成			☐高频 ☐中频 ☐低频
	图像生成			☐高频 ☐中频 ☐低频
	代码辅助			☐高频 ☐中频 ☐低频
	数据分析			☐高频 ☐中频 ☐低频
	项目管理			☐高频 ☐中频 ☐低频
	其他			☐高频 ☐中频 ☐低频
工具订阅小计	—	—	¥________	—

服务商	服务类型	配置	费用（元/月）	利用率
	云服务器			☐高 ☐中 ☐低
	数据库			☐高 ☐中 ☐低
	CDN/存储			☐高 ☐中 ☐低
	域名/SSL			—
	其他
云服务小计	—	—	¥________	—

渠道	投放金额	获客数	单客成本	转化收入	ROI
小红书
公众号/微信
知乎
抖音
B站
付费社群
其他
营销小计	¥________

成本类别	本月金额	上月金额
API成本
工具订阅
云服务
营销推广
外包/协作
其他
月度总成本	¥________	¥________
月度利润
利润率

目的：记录不同任务使用什么模型，找到"够用就行"的最佳组合，降低API成本。

任务类型	任务示例	效果差异
简单问答	常见问题回复	☐更好 ☐持平 ☐略差
文案创作	小红书文案	☐更好 ☐持平 ☐略差
长文写作	公众号文章	☐更好 ☐持平 ☐略差
代码生成	功能实现	☐更好 ☐持平 ☐略差
代码审查	Bug查找	☐更好 ☐持平 ☐略差
数据分析	报表解读	☐更好 ☐持平 ☐略差
图像生成	封面/配图	☐更好 ☐持平 ☐略差
图像分析	OCR/理解	☐更好 ☐持平 ☐略差
翻译	中英互译	☐更好 ☐持平 ☐略差
摘要总结	长文摘要	☐更好 ☐持平 ☐略差

任务到来
│
├─ 是否需要创意/复杂推理？
│  ├─ 是 → GPT-4o / Claude 3.5 Sonnet（高质量）
│  └─ 否 → 继续判断
│
├─ 是否需要代码/技术？
│  ├─ 是 → Claude 3.5 Sonnet / GPT-4o（代码强）
│  └─ 否 → 继续判断
│
├─ 是否简单/重复性任务？
│  ├─ 是 → GPT-4o-mini / Claude 3 Haiku（低成本）
│  └─ 否 → 继续判断
│
└─ 是否需要中文优化？
   ├─ 是 → 通义千问 / 文心一言（中文场景）
   └─ 否 → 综合成本选择

模型	输入$/M tokens	输出$/M tokens	适用场景	成本等级
GPT-4o	2.50	10.00	复杂推理、创意	🔴高
GPT-4o-mini	0.15	0.60	简单任务、大批量	🟢低
Claude 3.5 Sonnet	3.00	15.00	代码、长上下文	🔴高
Claude 3 Haiku	0.25	1.25	快速响应、简单任务	🟢低
Gemini 1.5 Pro	3.50	10.50	长文档、多模态	🟡中
通义千问-Max	~¥0.02/1K	~¥0.06/1K	中文、国内合规	🟡中
文心4.0	~¥0.12/1K	~¥0.12/1K	中文、百度生态	🟡中

注：价格随时变动，以各平台官网为准。国内模型价格为人民币，国外为美元。

指标	优化前（____月）	优化后（____月）	变化
月度API成本	¥________	¥________	节约____%
月度工具订阅	¥________	¥________	节约____%
月度总AI成本	¥________	¥________	节约____%
收入	¥________	¥________
AI成本占收入比	____%	____%
利润率	____%	____%

#	优化措施	预计节约	实施难度	是否实施
1	建立模型路由策略，简单任务用小模型	20-40%	🟢低	☐
2	优化prompt，减少不必要的token	10-20%	🟢低	☐
3	引入响应缓存，避免重复调用	15-30%	🟡中	☐
4	批量处理而非单条调用	10-15%	🟡中	☐
5	评估并取消低频工具订阅	5-15%	🟢低	☐
6	国产模型替代国外模型（中文场景）	20-50%	🟢低	☐
7	云服务降配/按需切换	10-30%	🟡中	☐
8	谈判API批量折扣	5-15%	🟡中	☐

月初设定预算：根据上月数据，为本月各项成本设定预算上限。
实时记录：每次API调用/订阅续费后，更新对应表格。
月末汇总：月底计算总成本、占收入比、利润率。
季度优化：每季度审查模型路由表和工具订阅，寻找替代方案。
实验验证：对每项优化措施记录前后对比，用数据说话。

API成本要细分到模型：不同模型价差10倍以上，混合统计会掩盖问题。
不要只看绝对成本：关注"AI成本占收入比"，收入涨了成本同步涨是正常的。
缓存是最被低估的优化：很多重复查询可以通过缓存解决，成本接近为零。
订阅制要定期审查：每月问自己"上个月用了几次？"，低频的果断取消。
国产模型值得尝试：中文场景下，通义/文心在很多任务上已足够用，成本更低。

简单任务从GPT-4切换到4o-mini

引入缓存机制，减少重复调用

优化prompt长度，减少token消耗

切换至国产模型处理中文任务