收藏本站,收获最前沿的人工智能与编程资讯!!
Spring AI 使用 PostgresML 嵌入模型

Spring AI 使用 PostgresML 嵌入模型

技术文档 14℃ 0
Spring AI 支持 PostgresML 文本嵌入模型。嵌入是文本的数值表示形式,用于将单词和句子表示为向量(数值数组)。嵌入可通过距离度量算法对比数值向量的相似度来查找相似文本片段,也可作为其他机器学习模型的输入特征(因为大多数算法无法直接处理文本)。在 PostgresML 中,你可以使用多种预训练大语言模型从文本生成嵌入向量。你可以在 Hugging Face 上浏览所有可用模型,找到最优解决方案。添加仓库和物料清单(BOM)Spring AI 构件发布在 Maven 中央仓库和 Spring 快照仓库中。参考构件仓库章节,将这些仓库添加到你的构建系统中。为了简化依赖管理,Spring AI 提供了物料清单(BOM),确...
Spring AI 使用 OpenAI 嵌入模型

Spring AI 使用 OpenAI 嵌入模型

技术文档 14℃ 0
Spring AI 支持 OpenAI 的文本嵌入模型。OpenAI 文本嵌入用于衡量文本字符串的相关性。嵌入是一个由浮点数组成的向量(列表)。两个向量之间的距离可衡量它们的相关性:距离越小,相关性越高;距离越大,相关性越低。前提条件你需要创建 OpenAI API 密钥才能访问 OpenAI 嵌入模型。在 OpenAI 注册页面创建账号,并在 API 密钥页面生成令牌。Spring AI 项目定义了一个名为 spring.ai.openai.api-key 的配置属性,你需要将其设置为从 openai.com 获取的 API 密钥值。你可以在 application.properties 文件中设置该配置属性:spring.ai....
Spring AI 使用 OpenAI SDK 嵌入向量(官方版)

Spring AI 使用 OpenAI SDK 嵌入向量(官方版)

技术文档 13℃ 0
Spring AI 通过官方 OpenAI Java SDK 支持 OpenAI 文本嵌入模型,提供与 OpenAI 服务(包括微软云服务和 GitHub 模型)的稳定、官方维护集成。OpenAI 文本嵌入用于衡量文本字符串的相关性。嵌入向量是一组浮点数,两个向量的距离越小,相关性越高;距离越大,相关性越低。该模块会根据你提供的基础 URL 自动识别服务提供商:OpenAI、微软 Foundry 或 GitHub Models。认证方式通过基础 URL 和 API 密钥完成认证,支持 Spring 配置或环境变量。使用 OpenAIspring.ai.openai-sdk.api-key=# 可选,默认 http...
Spring AI 使用 Transformers (ONNX) 嵌入向量

Spring AI 使用 Transformers (ONNX) 嵌入向量

技术文档 13℃ 0
TransformersEmbeddingModel 是一种 EmbeddingModel 实现,它可以在本地使用选定的句子转换器模型计算句子嵌入向量。你可以使用任意 HuggingFace 嵌入模型,它采用预训练的 Transformer 模型,并序列化为开放神经网络交换(ONNX)格式。该实现使用 Deep Java Library 和微软 ONNX Java 运行时库,在 Java 环境中运行 ONNX 模型并计算嵌入向量。前提条件要在 Java 中运行,需要将分词器(Tokenizer)和 Transformer 模型序列化为 ONNX 格式。最快捷的方式是使用 optimum-cli 命令行工具。以下脚本会创建 Pytho...
Spring AI 使用 Ollama 嵌入向量

Spring AI 使用 Ollama 嵌入向量

技术文档 13℃ 0
借助 Ollama,你可以在本地运行各类人工智能模型并生成对应的嵌入向量。嵌入向量是由浮点数组成的向量(列表),两个向量之间的距离可衡量二者的关联度:距离越小代表关联度越高,距离越大代表关联度越低。OllamaEmbeddingModel 实现类基于 Ollama 嵌入向量 API 接口实现功能。前提条件首先你需要连接到一个 Ollama 实例,支持以下几种方式:在本地设备下载并安装 Ollama通过 Testcontainers 配置并运行 Ollama通过 Kubernetes 服务绑定连接到 Ollama 实例你可以从 Ollama 模型库拉取应用所需的模型:ollama pull <model-na...
Spring AI 使用甲骨文云基础设施(OCI)生成式人工智能嵌入向量

Spring AI 使用甲骨文云基础设施(OCI)生成式人工智能嵌入向量

技术文档 10℃ 0
甲骨文云基础设施生成式人工智能服务支持通过按需模型或专用人工智能集群生成文本嵌入向量。甲骨文云基础设施嵌入模型页面和甲骨文云基础设施文本嵌入向量页面提供了在甲骨文云基础设施上使用和部署嵌入模型的详细说明。前提条件添加仓库和物料清单Spring AI 构件已发布至 Maven 中央仓库和 Spring 快照仓库。参考「构件仓库」章节,将这些仓库添加到你的构建系统中。为简化依赖管理,Spring AI 提供了物料清单(BOM),确保整个项目使用一致版本的 Spring AI。参考「依赖管理」章节,将 Spring AI 物料清单添加到你的构建系统中。自动配置Spring AI 自动配置、启动器模块的构件名称发生了重大变更。更多信息请参考...
Spring AI 使用 MiniMax 嵌入向量模型

Spring AI 使用 MiniMax 嵌入向量模型

技术文档 11℃ 0
Spring AI 支持 MiniMax 旗下各类人工智能语言模型。你可以与 MiniMax 语言模型交互,并基于 MiniMax 模型构建多语种对话助手。前提条件你需要创建 MiniMax API 密钥才能访问 MiniMax 语言模型。在 MiniMax 注册页面创建账号,并在 API 密钥页面生成令牌。Spring AI 项目定义了配置属性 spring.ai.minimax.api-key,你需要将其设置为从 API 密钥页面获取的 API 密钥值。你可以在 application.properties 文件中设置该配置属性:spring.ai.minimax.api-key=为了在处理 API 密钥等敏感信息时提升安全性,...
Spring AI 使用 Mistral AI 嵌入向量

Spring AI 使用 Mistral AI 嵌入向量

技术文档 13℃ 0
Spring AI 支持 Mistral AI 的文本嵌入向量模型。嵌入向量是文本的向量表示形式,通过其在高维向量空间中的位置来捕捉段落的语义含义。Mistral AI 嵌入向量 API 提供前沿、顶尖的文本嵌入向量,可用于多种自然语言处理任务。可用模型Mistral AI 提供两种嵌入向量模型,每种模型针对不同使用场景进行了优化:模型维度使用场景说明mistral-embed1024通用文本通用嵌入向量模型,适用于语义搜索、聚类和文本相似度任务,是处理自然语言内容的理想选择codestral-embed1536代码专用嵌入向量模型,针对代码相似度、代码搜索以及基于代码仓库的检索增强生成(RAG)优化,提供专为理解代码语义设计的高维...
Spring AI 使用 Google 生成式人工智能文本嵌入

Spring AI 使用 Google 生成式人工智能文本嵌入

技术文档 12℃ 0
Google 生成式人工智能嵌入 API 可通过 Gemini 开发者 API 或 Vertex AI,借助 Google 的嵌入模型生成文本嵌入向量。本文档介绍如何使用 Google 生成式人工智能文本嵌入 API 创建文本嵌入向量。Google 生成式人工智能文本嵌入 API 采用稠密向量表示形式。与稀疏向量(通常直接将单词映射为数字)不同,稠密向量旨在更好地表示文本片段的语义。在生成式人工智能中使用稠密向量嵌入的优势在于,无需搜索精确的单词或语法匹配项,即可更精准地查找与查询语义一致的段落,即便段落使用的语言不同也可实现。目前,Google 生成式人工智能 SDK 仅支持文本嵌入向量。多模态嵌入向量的支持功能正在开发中,将在...
Spring AI Amazon Bedrock API

Spring AI Amazon Bedrock API

技术文档 12℃ 0
遵循Bedrock的推荐规范,Spring AI已在所有聊天对话实现中全面切换为使用Amazon Bedrock的Converse API。Bedrock Converse API具备以下核心优势:统一接口:编写一次代码,即可适配Amazon Bedrock支持的任意模型模型灵活性:无需修改代码,即可在不同对话模型之间无缝切换扩展功能:通过专用结构支持模型专属参数配置工具支持:原生集成函数调用和工具使用能力多模态能力:内置支持视觉及其他多模态特性面向未来:与Amazon Bedrock官方推荐的最佳实践保持一致Converse API不支持嵌入操作,因此该功能将保留在现有API中,且基于InvokeModel API的嵌入模型功能会...
Spring AI 嵌入模型 API

Spring AI 嵌入模型 API

技术文档 13℃ 0
嵌入是文本、图像或视频的数值表示,能够捕捉输入数据之间的关联关系。嵌入的工作原理是将文本、图像和视频转换为浮点数组,该数组也被称为向量。这些向量的设计目标是捕捉文本、图像和视频的语义含义。嵌入数组的长度被称为向量的维度。通过计算两段文本向量表示之间的数值距离,应用程序可以判断生成嵌入向量的对象之间的相似度。EmbeddingModel 接口专为便捷集成人工智能与机器学习领域的嵌入模型而设计。它的核心功能是将文本转换为数值向量,这类向量通常被称为嵌入向量。嵌入向量对于语义分析、文本分类等多种任务至关重要。EmbeddingModel 接口的设计围绕两大核心目标:可移植性:该接口确保能够轻松适配各类嵌入模型。开发者只需极少的代码修改,即...
Spring AI 使用智谱 AI

Spring AI 使用智谱 AI

技术文档 11℃ 0
Spring AI 支持智谱 AI 提供的各类人工智能语言模型。你可以与智谱 AI 语言模型交互,并基于智谱 AI 模型创建多语种对话助手。如果你不使用中文,可以访问智谱 AI 的国际站点 Z.ai。前提条件你需要创建智谱 AI API 密钥才能访问智谱 AI 语言模型。在智谱 AI 注册页面(或 Z.ai 注册页面)创建账号,并在 API 密钥页面(或 Z.ai API 密钥页面)生成令牌。Spring AI 项目定义了一个名为 spring.ai.zhipuai.api-key 的配置属性,你需要将其设置为从 API 密钥页面获取的 API 密钥值。你可以在 application.properties 文件中设置该配置属性:s...
PyTorch 2.12 Tensor API 张量

PyTorch 2.12 Tensor API 张量

技术文档 16℃ 0
张量张量是一种专用数据结构,与数组和矩阵非常相似。在PyTorch中,我们使用张量来编码模型的输入、输出以及模型的参数。张量与NumPy的ndarray类似,区别在于张量可以在GPU或其他硬件加速器上运行。事实上,张量和NumPy数组通常可以共享底层内存,无需复制数据。张量同样针对自动微分进行了优化。如果你熟悉ndarray,就能轻松上手Tensor API。如果不熟悉,也可以继续学习!import torch import numpy as np初始化张量张量可以通过多种方式初始化。请看以下示例:直接从数据创建可以直接从数据创建张量,数据类型会自动推断。data = [...
PyTorch 2.12 快速入门

PyTorch 2.12 快速入门

技术文档 20℃ 0
数据处理PyTorch提供了两个用于数据处理的基础组件:torch.utils.data.DataLoader和torch.utils.data.Dataset。Dataset用于存储样本及其对应的标签,DataLoader则对Dataset进行迭代封装。import torch from torch import nn from torch.utils.data import DataLoader from torchvision import datasets from torchvision.transform...
Spring AI 使用 OpenAI SDK

Spring AI 使用 OpenAI SDK

技术文档 27℃ 0
Spring AI 通过 OpenAI Java SDK 支持 OpenAI 的语言模型,提供与 OpenAI 服务(包括微软 Foundry 和 GitHub Models)的可靠、官方维护集成。本实现使用 OpenAI 官方提供的 Java SDK。如需替代的 Spring AI 实现,请参考 OpenAI Chat。OpenAI SDK 模块会根据你提供的基础 URL 自动检测服务提供商(OpenAI、微软 Foundry 或 GitHub Models)。身份验证身份验证通过基础 URL 和 API 密钥完成。该实现通过 Spring Boot 配置属性或环境变量提供灵活的配置选项。使用 OpenAI若直接使用 OpenAI...
Spring AI 使用 OCI GenAI Cohere

Spring AI 使用 OCI GenAI Cohere

技术文档 15℃ 0
OCI 生成式 AI 服务提供支持按需模型或专用 AI 集群的生成式 AI 对话能力。OCI 聊天模型页面和 OCI 生成式 AI 实验场提供了在 OCI 上使用和托管聊天模型的详细信息。前提条件使用 OCI GenAI Cohere 聊天客户端需要一个有效的甲骨文云基础设施(OCI)账户。客户端提供四种不同的连接方式,包括使用用户和私钥的简易认证、工作负载身份、实例主体或 OCI 配置文件认证。添加仓库与物料清单(BOM)Spring AI 构件发布在 Maven 中央仓库和 Spring 快照仓库。参考构件仓库章节将这些仓库添加到你的构建系统中。为了帮助进行依赖管理,Spring AI 提供了 BOM(物料清单),确保整个项目使...
Spring AI 使用 Perplexity

Spring AI 使用 Perplexity

技术文档 13℃ 0
Perplexity AI 提供独特的AI服务,将其语言模型与实时搜索能力相结合。它提供多种模型,并支持对话AI的流式响应。Spring AI 通过复用现有的 OpenAI 客户端与 Perplexity AI 集成。开始之前,你需要获取 Perplexity API 密钥、配置基础 URL 并选择支持的模型之一。Spring AI 与 Perplexity 集成说明Perplexity API 与 OpenAI API 并非完全兼容。Perplexity 将实时网络搜索结果与其语言模型响应相结合。与 OpenAI 不同,Perplexity 不暴露工具调用(函数调用)机制。此外,目前 Perplexity 不支持多模态消息。查看...
Spring AI 使用 Ollama

Spring AI 使用 Ollama

技术文档 14℃ 0
借助 Ollama,你可以在本地运行各类大语言模型(LLMs)并生成文本内容。Spring AI 通过 OllamaChatModel API 支持 Ollama 的聊天补全能力。Ollama 同时提供了兼容 OpenAI API 的接口。OpenAI API 兼容性章节会介绍如何使用 Spring AI OpenAI 连接到 Ollama 服务端。前提条件首先你需要能访问 Ollama 实例,可选方式如下:在本地设备下载并安装 Ollama通过 Testcontainers 配置并运行 Ollama通过 Kubernetes 服务绑定连接 Ollama 实例你可以从 Ollama 模型库拉取应用所需的模型:ollama ...
Spring AI 使用 NVIDIA LLM API

Spring AI 使用 NVIDIA LLM API

技术文档 16℃ 0
NVIDIA LLM API 是一个多模型托管推理服务**,聚合了来自不同厂商的主流大模型,并提供 OpenAI 兼容接口。    Spring AI 通过**复用 OpenAI 客户端**实现对 NVIDIA 服务的无缝集成。⚠️ 重要提醒:NVIDIA API 必须显式设置 maxTokens,否则会直接抛出服务器错误。前提条件注册 NVIDIA 账号并获取额度选择模型(如 meta/llama-3.1-70b-instruct)生成对应模型的 API Key核心配置(必看)spring.ai.openai.api-key=${NVIDIA_API_KEY} spring.ai.openai.base-...