聊天模型对比
下表对比了 Spring AI 支持的各类聊天模型,详细列出各项能力特性:
多模态(Multimodality):模型可处理的输入类型(文本、图片、音频、视频等)
工具/函数调用(Tools/Function Calling):是否支持函数调用与工具调用能力
流式输出(Streaming):是否支持流式响应返回
重试机制(Retry):是否内置重试机制支持
可观测性(Observability):是否具备监控、日志调试能力
原生JSON输出(Built-in JSON):是否原生支持结构化JSON输出
本地部署(Local deployment):是否支持本地私有化部署
OpenAI接口兼容(OpenAI API Compatibility):是否兼容OpenAI接口协议
| 服务商 | 多模态 | 工具/函数 | 流式输出 | 重试机制 | 可观测性 | 原生JSON | 本地部署 | OpenAI接口兼容 |
|---|---|---|---|---|---|---|---|---|
| Anthropic Claude | 文本、PDF、图片 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 不兼容 |
| Azure OpenAI | 文本、图片 | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 | 兼容 |
| DeepSeek(OpenAI代理) | 文本 | 支持 | 支持 | 支持 | 支持 | 支持 | 支持 | 兼容 |
| Google GenAI | 文本、PDF、图片、音频、视频 | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不兼容 |
| Google VertexAI Gemini | 文本、PDF、图片、音频、视频 | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 | 兼容 |
| Groq(OpenAI代理) | 文本、图片 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 兼容 |
| HuggingFace | 文本 | 不支持 | 不支持 | 不支持 | 不支持 | 不支持 | 不支持 | 不兼容 |
| Mistral AI | 文本、图片、音频 | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 | 兼容 |
| MiniMax | 文本 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 兼容 |
| Moonshot AI 月之暗面 | 文本 | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 | 兼容 |
| NVIDIA(OpenAI代理) | 文本、图片 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 兼容 |
| OCI GenAI/Cohere | 文本 | 不支持 | 不支持 | 不支持 | 支持 | 不支持 | 不支持 | 不兼容 |
| Ollama | 文本、图片 | 支持 | 支持 | 支持 | 支持 | 支持 | 支持 | 兼容 |
| OpenAI SDK(官方) | 输入:文本、图片、音频 输出:文本、音频 | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 | 兼容 |
| OpenAI | 输入:文本、图片、音频 输出:文本、音频 | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 | 兼容 |
| Perplexity(OpenAI代理) | 文本 | 不支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 兼容 |
| 千帆 QianFan | 文本 | 不支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 不兼容 |
| 智谱 AI ZhiPu AI | 文本、图片、文档 | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 不兼容 |
| Amazon Bedrock Converse | 文本、图片、视频、文档(PDF/HTML/MD/DOCX等) | 支持 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 不兼容 |