收藏本站,收获最前沿的人工智能与编程资讯!!
Spring AI 使用 Mistral AI 嵌入向量

Spring AI 使用 Mistral AI 嵌入向量

技术文档 13℃ 0
Spring AI 支持 Mistral AI 的文本嵌入向量模型。嵌入向量是文本的向量表示形式,通过其在高维向量空间中的位置来捕捉段落的语义含义。Mistral AI 嵌入向量 API 提供前沿、顶尖的文本嵌入向量,可用于多种自然语言处理任务。可用模型Mistral AI 提供两种嵌入向量模型,每种模型针对不同使用场景进行了优化:模型维度使用场景说明mistral-embed1024通用文本通用嵌入向量模型,适用于语义搜索、聚类和文本相似度任务,是处理自然语言内容的理想选择codestral-embed1536代码专用嵌入向量模型,针对代码相似度、代码搜索以及基于代码仓库的检索增强生成(RAG)优化,提供专为理解代码语义设计的高维...
Spring AI 使用 Google 生成式人工智能文本嵌入

Spring AI 使用 Google 生成式人工智能文本嵌入

技术文档 12℃ 0
Google 生成式人工智能嵌入 API 可通过 Gemini 开发者 API 或 Vertex AI,借助 Google 的嵌入模型生成文本嵌入向量。本文档介绍如何使用 Google 生成式人工智能文本嵌入 API 创建文本嵌入向量。Google 生成式人工智能文本嵌入 API 采用稠密向量表示形式。与稀疏向量(通常直接将单词映射为数字)不同,稠密向量旨在更好地表示文本片段的语义。在生成式人工智能中使用稠密向量嵌入的优势在于,无需搜索精确的单词或语法匹配项,即可更精准地查找与查询语义一致的段落,即便段落使用的语言不同也可实现。目前,Google 生成式人工智能 SDK 仅支持文本嵌入向量。多模态嵌入向量的支持功能正在开发中,将在...
Spring AI Amazon Bedrock API

Spring AI Amazon Bedrock API

技术文档 12℃ 0
遵循Bedrock的推荐规范,Spring AI已在所有聊天对话实现中全面切换为使用Amazon Bedrock的Converse API。Bedrock Converse API具备以下核心优势:统一接口:编写一次代码,即可适配Amazon Bedrock支持的任意模型模型灵活性:无需修改代码,即可在不同对话模型之间无缝切换扩展功能:通过专用结构支持模型专属参数配置工具支持:原生集成函数调用和工具使用能力多模态能力:内置支持视觉及其他多模态特性面向未来:与Amazon Bedrock官方推荐的最佳实践保持一致Converse API不支持嵌入操作,因此该功能将保留在现有API中,且基于InvokeModel API的嵌入模型功能会...
Spring AI 嵌入模型 API

Spring AI 嵌入模型 API

技术文档 13℃ 0
嵌入是文本、图像或视频的数值表示,能够捕捉输入数据之间的关联关系。嵌入的工作原理是将文本、图像和视频转换为浮点数组,该数组也被称为向量。这些向量的设计目标是捕捉文本、图像和视频的语义含义。嵌入数组的长度被称为向量的维度。通过计算两段文本向量表示之间的数值距离,应用程序可以判断生成嵌入向量的对象之间的相似度。EmbeddingModel 接口专为便捷集成人工智能与机器学习领域的嵌入模型而设计。它的核心功能是将文本转换为数值向量,这类向量通常被称为嵌入向量。嵌入向量对于语义分析、文本分类等多种任务至关重要。EmbeddingModel 接口的设计围绕两大核心目标:可移植性:该接口确保能够轻松适配各类嵌入模型。开发者只需极少的代码修改,即...
Spring AI 使用智谱 AI

Spring AI 使用智谱 AI

技术文档 11℃ 0
Spring AI 支持智谱 AI 提供的各类人工智能语言模型。你可以与智谱 AI 语言模型交互,并基于智谱 AI 模型创建多语种对话助手。如果你不使用中文,可以访问智谱 AI 的国际站点 Z.ai。前提条件你需要创建智谱 AI API 密钥才能访问智谱 AI 语言模型。在智谱 AI 注册页面(或 Z.ai 注册页面)创建账号,并在 API 密钥页面(或 Z.ai API 密钥页面)生成令牌。Spring AI 项目定义了一个名为 spring.ai.zhipuai.api-key 的配置属性,你需要将其设置为从 API 密钥页面获取的 API 密钥值。你可以在 application.properties 文件中设置该配置属性:s...
Spring AI 使用 OpenAI SDK

Spring AI 使用 OpenAI SDK

技术文档 28℃ 0
Spring AI 通过 OpenAI Java SDK 支持 OpenAI 的语言模型,提供与 OpenAI 服务(包括微软 Foundry 和 GitHub Models)的可靠、官方维护集成。本实现使用 OpenAI 官方提供的 Java SDK。如需替代的 Spring AI 实现,请参考 OpenAI Chat。OpenAI SDK 模块会根据你提供的基础 URL 自动检测服务提供商(OpenAI、微软 Foundry 或 GitHub Models)。身份验证身份验证通过基础 URL 和 API 密钥完成。该实现通过 Spring Boot 配置属性或环境变量提供灵活的配置选项。使用 OpenAI若直接使用 OpenAI...
Spring AI 使用 OCI GenAI Cohere

Spring AI 使用 OCI GenAI Cohere

技术文档 15℃ 0
OCI 生成式 AI 服务提供支持按需模型或专用 AI 集群的生成式 AI 对话能力。OCI 聊天模型页面和 OCI 生成式 AI 实验场提供了在 OCI 上使用和托管聊天模型的详细信息。前提条件使用 OCI GenAI Cohere 聊天客户端需要一个有效的甲骨文云基础设施(OCI)账户。客户端提供四种不同的连接方式,包括使用用户和私钥的简易认证、工作负载身份、实例主体或 OCI 配置文件认证。添加仓库与物料清单(BOM)Spring AI 构件发布在 Maven 中央仓库和 Spring 快照仓库。参考构件仓库章节将这些仓库添加到你的构建系统中。为了帮助进行依赖管理,Spring AI 提供了 BOM(物料清单),确保整个项目使...
Spring AI 使用 Perplexity

Spring AI 使用 Perplexity

技术文档 13℃ 0
Perplexity AI 提供独特的AI服务,将其语言模型与实时搜索能力相结合。它提供多种模型,并支持对话AI的流式响应。Spring AI 通过复用现有的 OpenAI 客户端与 Perplexity AI 集成。开始之前,你需要获取 Perplexity API 密钥、配置基础 URL 并选择支持的模型之一。Spring AI 与 Perplexity 集成说明Perplexity API 与 OpenAI API 并非完全兼容。Perplexity 将实时网络搜索结果与其语言模型响应相结合。与 OpenAI 不同,Perplexity 不暴露工具调用(函数调用)机制。此外,目前 Perplexity 不支持多模态消息。查看...
Spring AI 使用 Ollama

Spring AI 使用 Ollama

技术文档 14℃ 0
借助 Ollama,你可以在本地运行各类大语言模型(LLMs)并生成文本内容。Spring AI 通过 OllamaChatModel API 支持 Ollama 的聊天补全能力。Ollama 同时提供了兼容 OpenAI API 的接口。OpenAI API 兼容性章节会介绍如何使用 Spring AI OpenAI 连接到 Ollama 服务端。前提条件首先你需要能访问 Ollama 实例,可选方式如下:在本地设备下载并安装 Ollama通过 Testcontainers 配置并运行 Ollama通过 Kubernetes 服务绑定连接 Ollama 实例你可以从 Ollama 模型库拉取应用所需的模型:ollama ...
Spring AI 使用 NVIDIA LLM API

Spring AI 使用 NVIDIA LLM API

技术文档 16℃ 0
NVIDIA LLM API 是一个多模型托管推理服务**,聚合了来自不同厂商的主流大模型,并提供 OpenAI 兼容接口。    Spring AI 通过**复用 OpenAI 客户端**实现对 NVIDIA 服务的无缝集成。⚠️ 重要提醒:NVIDIA API 必须显式设置 maxTokens,否则会直接抛出服务器错误。前提条件注册 NVIDIA 账号并获取额度选择模型(如 meta/llama-3.1-70b-instruct)生成对应模型的 API Key核心配置(必看)spring.ai.openai.api-key=${NVIDIA_API_KEY} spring.ai.openai.base-...
Spring AI 使用 MiniMax 对话模型

Spring AI 使用 MiniMax 对话模型

技术文档 16℃ 0
Spring AI 支持 MiniMax 全系列大语言模型,可用于构建多语种对话交互系统,同时内置联网搜索(WebSearch)与函数调用能力。前提条件在 MiniMax 官网注册账号并创建 API Key配置密钥:spring.ai.minimax.api-key基础配置(application.properties)spring.ai.minimax.api-key=<your-minimax-api-key>环境变量安全配置(推荐)# application.yml spring:   ai:     minimax:  &nb...
Spring AI 使用 Mistral AI 对话模型

Spring AI 使用 Mistral AI 对话模型

技术文档 16℃ 0
Spring AI 全面支持 Mistral AI 旗下各类大语言模型,可用于构建多语种对话助手。Mistral AI 同时提供 OpenAI API 兼容接口,你也可以通过 Spring AI OpenAI 集成模块调用 Mistral 服务。前提条件在 Mistral AI 官网注册账号并创建 API Key将密钥配置到 Spring AI 配置项:spring.ai.mistralai.api-key基础配置(application.properties)spring.ai.mistralai.api-key=<your-mistralai-api-key>安全配置(环境变量)# application....
Spring AI 使用 Hugging Face 对话模型

Spring AI 使用 Hugging Face 对话模型

技术文档 13℃ 0
Hugging Face 文本生成推理引擎(TGI)是一款专门用于在云端部署大语言模型(LLM)的服务化解决方案,可通过 API 对外提供模型服务。TGI 通过持续批处理、令牌流式传输、高效内存管理等特性,为文本生成任务提供了极致的性能优化。文本生成推理引擎要求模型与其架构专属优化方案兼容。虽然支持许多主流大语言模型,但并非 Hugging Face Hub 上的所有模型都能使用 TGI 部署。如果你需要部署其他类型的模型,建议使用标准的 Hugging Face 推理端点。    如需查看完整且最新的支持模型与架构列表,参考文本生成推理引擎支持模型文档。前提条件你需要在 Hugging Face 上创建推理端点...
Spring AI 使用 Groq 对话模型

Spring AI 使用 Groq 对话模型

技术文档 16℃ 0
Groq 是一款基于 LPU™ 架构的**超高速 AI 推理引擎**,支持多种主流 AI 模型、工具/函数调用功能,并提供与 OpenAI API 兼容的服务端点。Spring AI 通过**复用现有的 OpenAI 客户端**实现与 Groq 的集成。你只需获取 Groq API 密钥,将基础地址设置为 api.groq.com/openai,并选择对应的 Groq 模型即可使用。注意:Groq API 与 OpenAI API 并非完全兼容,存在部分兼容性限制。此外,Groq 目前不支持多模态消息。    可查看 GroqWithOpenAiChatModelIT.java 测试文件,了解 Spring AI...
Spring AI 使用 Vertex AI Gemini 对话模型

Spring AI 使用 Vertex AI Gemini 对话模型

技术文档 15℃ 0
Vertex AI Gemini API 允许开发者使用 Gemini 模型构建生成式人工智能应用。Vertex AI Gemini API 支持多模态提示词作为输入,并输出文本或代码。多模态模型能够处理来自多种模态的信息,包括图像、视频和文本。例如,你可以向模型发送一盘饼干的照片,并让它为你提供这些饼干的配方。Gemini 是由谷歌 DeepMind 开发的生成式人工智能模型系列,专为多模态场景设计。通过 Gemini API,你可以使用 Gemini 2.0 Flash 和 Gemini 2.0 Flash-Lite 模型。有关 Vertex AI Gemini API 模型的规格说明,请参阅模型信息文档。前提条件安装适用于你操...
Spring AI 使用 Google GenAI 对话模型

Spring AI 使用 Google GenAI 对话模型

技术文档 17℃ 0
Google GenAI API 允许开发者通过 Gemini 开发者 API 或 Vertex AI,使用谷歌的 Gemini 模型构建生成式人工智能应用。Google GenAI API 支持多模态提示词作为输入,并输出文本或代码。多模态模型能够处理来自多种模态的信息,包括图像、视频和文本。例如,你可以向模型发送一盘饼干的照片,并让它为你提供这些饼干的配方。Gemini 是由谷歌 DeepMind 开发的生成式人工智能模型系列,专为多模态场景设计。通过 Gemini API,你可以使用 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite、所有 Gemini Pro 模型,以及最新的 Gemini 3 P...
Spring AI 使用 Docker Model Runner

Spring AI 使用 Docker Model Runner

技术文档 17℃ 0
Docker Model Runner 是一款人工智能推理引擎,提供来自各类服务商的丰富模型。Spring AI 通过复用已有的 OpenAI 对话客户端,实现了与 Docker Model Runner 的集成。使用时需将基础 URL 设置为 localhost:12434/engines,并选择提供的大语言模型之一。可查看 DockerModelRunnerWithOpenAiChatModelIT.java 测试文件,了解 Spring AI 结合 Docker Model Runner 的使用示例。前提条件下载适用于 Mac 的 Docker Desktop 4.40.0 版本。通过以下任一方式启用 Model Runner...
Spring AI 接入 DeepSeek

Spring AI 接入 DeepSeek

技术文档 18℃ 0
DeepSeek ChatSpring AI 支持来自深度求索(DeepSeek)的各类人工智能大语言模型。你可以与 DeepSeek 大语言模型进行交互,并基于 DeepSeek 模型创建多语种对话助手。前提条件你需要创建一个 DeepSeek API 密钥才能访问 DeepSeek 大语言模型。在 DeepSeek 注册页面创建账号,并在 API 密钥页面生成令牌。Spring AI 项目定义了一个名为 spring.ai.deepseek.api-key 的配置属性,你需要将其设置为从 API 密钥页面获取的 API 密钥值。你可以在 application.properties 文件中设置该配置属性:spring.ai.de...
Spring AI Azure OpenAI 的使用

Spring AI Azure OpenAI 的使用

技术文档 14℃ 0
由 ChatGPT 提供能力支撑的 Azure OpenAI 服务,超越了传统原生 OpenAI 的基础能力,可提供功能更强大的 AI 文本生成能力。Azure 还额外提供了 AI 安全管控与负责任 AI 相关特性,详情可参考官方最新更新文档。Azure 允许 Java 开发者将 AI 能力与各类 Azure 云服务无缝集成,充分释放人工智能的全部潜力,其中就包含 Azure 向量存储等 AI 相关资源。前置条件Azure OpenAI 客户端提供三种连接认证方式:使用 Azure API 密钥、使用原生 OpenAI API 密钥、使用 Microsoft Entra 身份认证。Azure API 密钥与访问端点若要通过 API...
Spring AI Anthropic API 的使用

Spring AI Anthropic API 的使用

技术文档 39℃ 0
Anthropic Claude 是一系列基础人工智能模型,可应用于各类场景。开发者与企业可借助 API 接入能力,直接基于 Anthropic 的 AI 基础设施进行二次开发。Spring AI 支持 Anthropic 消息 API,可实现同步与流式文本生成。Anthropic 的 Claude 模型也可通过 Amazon Bedrock 对话服务使用,Spring AI 同样提供了专属的 Amazon Bedrock 对接 Anthropic 的客户端实现。前置要求你需要在 Anthropic 官网控制台创建 API 密钥。前往 Anthropic API 控制台注册账号,并在「获取 API 密钥」页面生成密钥。Spring...