新京报贝壳财经讯(记者罗亦丹)6月6日,阿里开源通义千问3全新的向量模型系列Qwen3-Embedding(简称千问3向量模型)。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,性能较上一版本可提升40%,在MTEB等权威专项榜单中超越了谷歌、OpenAI、微软等公司的模型。
向量模型像是AI的“翻译器”,它可以将文本、图片等人类可认知的非结构化信息映射(embedding)到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。也正因此,向量模型对于提升AI的语义理解、信息检索、多模态融合等核心能力至关重要。基于千问3模型,通义团队通过对比训练、SFT、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型Qwen3-Embedding以及文本排序模型Qwen3-Reranker。
为方便开发者,此次有9款千问3向量模型开源,涵盖0.6B、4B、8B等不同尺寸及GGUF版本。目前,千问3Embedding和 Reranker模型均已在魔搭社区、Hugging Face和GitHub等平台上开源,开发者也可直接通过阿里云百炼使用API服务。