Deployment answer

什么是 self-hosted AI API gateway

自托管不只是“把服务放到自己的机器上”。更重要的是,团队希望继续掌控密钥、出站链路、环境边界和部署节奏,同时又不想放弃统一接口和结果可见性。

展示托管与自托管边界的部署示意图
直接回答

self-hosted AI API gateway 是部署在自己环境里的模型接入层。它通常用于让团队掌控 API Key、网络出口、环境隔离和升级节奏,同时保留统一接口和对结果、价格、状态的可见性。

Control 密钥、网络出口和运行环境都由团队自己掌控
Parity 托管与自托管最好保持同一套接口形状
Fit 它更像运维和合规选择,而不是更酷的默认选项
展开说明

把这个问题拆成三个更容易判断的部分。

答案页不追求大而全,而是先给直接回答,再把为什么重要、为什么不能简化、35m.ai 怎么处理这件事拆开讲清楚。

为什么团队会走向自托管

最常见的原因不是“能不能自己搭”,而是希望把敏感信息、网络路径和上线节奏拉回自己的控制范围。

  • 管理 API Key 和供应商配置的生命周期。
  • 控制出站链路,尤其在受限网络环境里更重要。

托管和自托管不该是两套产品

更健康的做法是让托管版和自托管版尽量共用同一套接口和页面结构,只把运维责任和环境控制权区分开。

  • 业务代码不应该因为部署模式变化就重写一遍。
  • 营销页和帮助页最好仍然是静态优先,方便独立部署。

35m.ai 的自托管语境

35m.ai 并不是把“自托管”当作炫技,而是把它作为 hosted 之外的另一条真实落地路径,并继续照顾代理与国内网络环境。

  • 自托管与代理部署可以一起考虑,而不是二选一。
  • 部署页先帮助团队做模式判断,再进入更细的镜像和环境变量层。
常见问题

继续把常见误解讲清楚。

如果用户已经理解主答案,这一组问题通常就是他们下一步会继续确认的边界。

自托管以后接口会变吗?

理想情况不该变。更好的系统应该让部署模式变化尽量不影响业务调用方式。

自托管还需要托管版官网吗?

需要。营销和发现层静态化,产品与数据层动态化,仍然是更健康的拆法。

相关问题

继续看这些相关问题。

把主题做成彼此可连接的答案页,会比把所有解释塞回首页更利于理解和搜索发现。