如何将文本转换为向量？(方法二)

DashVector · 2024-08-14 17:37:33 · 991 次点击 · 预计阅读时间 5 分钟 · 大约8小时之前开始浏览

这是一个创建于 2024-08-14 17:37:33 的文章，其中的信息可能已经有所发展或是发生改变。

本文介绍如何通过ModelScope魔搭社区中的文本向量开源模型将 文本转换为向量 ，并入库至向量检索服务DashVector中进行向量检索。

ModelScope魔搭社区旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单。

ModelScope魔搭社区的愿景是汇集行业领先的预训练模型，减少开发者的重复研发成本，提供更加绿色环保、开源开放的AI开发环境和模型服务，助力绿色"数字经济"事业的建设。 ModelScope魔搭社区将以开源的方式提供多类优质模型，开发者可在平台上免费体验与下载使用。

在ModelScope魔搭社区，您可以：

免费使用平台提供的预训练模型，支持免费下载运行
一行命令实现模型预测，简单快速验证模型效果

用自己的数据对模型进行调优，定制自己的个性化模型

学习系统性的知识，结合实训，有效提升模型研发能力
分享和贡献你的想法、评论与模型，让更多人认识你，在社区中成长

前提条件

DashVector：
- 已创建Cluster
- 已获得API-KEY
- 已安装最新版SDK

ModelScope：
- 已安装最新版SDK：pip install -U modelscope

CoROM文本向量

简介

说明

关于CoROM文本向量模型更多信息请参考：CoROM文本向量

使用示例

说明

需要进行如下替换代码才能正常运行：

DashVector api-key替换示例中的{your-dashvector-api-key}
DashVector Cluster Endpoint替换示例中的{your-dashvector-cluster-endpoint}

使用上表中 模型ID 替换示例中的{model_id}

需注意，若所使用的模型若为tiny模型，则向量维度为256

Python

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from typing import List
from dashvector import Client


pipeline_se = pipeline(Tasks.sentence_embedding, model='{model_id}')


def generate_embeddings(texts: List[str]):
    inputs = {'source_sentence': texts}
    result = pipeline_se(input=inputs)
    return result['text_embedding']


########### 以下为通用示例：向量入库DashVector和向量检索代码参考###########
# 创建DashVector Client
client = Client(
    api_key='{your-dashvector-api-key}',
    endpoint='{your-dashvector-cluster-endpoint}'
)

# 创建DashVector Collection
# 注意：需根据模型对应向量维度调整dimension参数
rsp = client.create('CoROM-text-embedding', dimension=768)
assert rsp
collection = client.get('CoROM-text-embedding')
assert collection

# 向量入库DashVector
collection.insert(
    ('ID1', generate_embeddings(['阿里云向量检索服务DashVector是性能、性价比具佳的向量数据库之一'])[0])
)

# 向量检索
docs = collection.query(
    generate_embeddings(['The best vector database'])[0]
)
print(docs)

GTE文本向量

简介

说明

关于GTE文本向量模型更多信息请参考：GTE文本向量

使用示例

本模型使用示例同[CoROM文本向量-使用示例]，进行相应 模型ID 和 向量维度 替换即可运行。

Udever 多语言通用文本表示模型

简介

说明

关于Udever 多语言通用文本表示模型更多信息请参考：Udever 多语言通用文本表示模型

使用示例

本模型使用示例同[CoROM文本向量-使用示例]，进行相应 模型ID 和 向量维度 替换即可运行。

StructBERT FAQ问答

简介

说明

关于StructBERT FAQ问答模型更多信息请参考：StructBERT FAQ问答

使用示例

说明

需要进行如下替换代码才能正常运行：

使用上表中 模型ID 替换示例中的{model_id}

Python

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from typing import List

pipeline = pipeline(Tasks.faq_question_answering, model='{model_id}')


def generate_embeddings(texts: List[str], max_len=30):
    return pipeline.get_sentence_embedding(texts)

说明

本示例中，向量入库DashVector和向量检索代码，参考[CoROM文本向量-使用示例]中的通用示例部分

更多文本向量模型

说明

列表中模型示例同[CoROM文本向量-使用示例]，进行相应 模型ID 和 向量维度 替换即可运行

更多ModelScope社区中的开源文本向量模型在本文中不再一一列举，更多文本向量模型待您探索、发现和共建，点击进入。

有疑问加站长微信联系（非本文作者））

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

991 次点击

加入收藏微博

收入我的专栏

上一篇：注销账号

下一篇：如何将文本转换为向量？(方法三)

信息

代码

python

检索服务

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

如何将文本转换为向量？(方法二)

前提条件

CoROM文本向量

简介

使用示例

GTE文本向量

简介

使用示例

Udever 多语言通用文本表示模型

简介

使用示例

StructBERT FAQ问答

简介

使用示例

用户登录

今日阅读排行

一周阅读排行

关注我

如何将文本转换为向量？(方法二)

前提条件

CoROM文本向量

简介

使用示例

GTE文本向量

简介

使用示例

Udever 多语言通用文本表示模型

简介

使用示例

StructBERT FAQ问答

简介

使用示例

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏