全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    公告:Elastic (NYSE: ESTC) 完成对Jina AI的收购

    作者:Jina AI发布日期:2025-10-10 12:25:59

    速读1. 纽约时间 2025 年 10 月 9 日早上 9 点,Elastic (NYSE: ESTC) 在其官网宣布完成了对 Jina AI 的收购。2. 未来 Elastic 会与 Jina AI

    阅读全文
  • 文章封面

    Jina Reranker v3: 全新“列式”重排器,0.6B参数刷新文档检索SOTA

    作者:Jina AI发布日期:2025-10-09 16:06:32

    我们正式推出第三代重排器 Jina Reranker v3。它在多项多语言检索基准上刷新了当前最佳表现(SOTA)。🤗:https://huggingface.co/jinaai/jina-reran

    阅读全文
  • 文章封面

    Jina官方MCP三板斧:搜、读、筛

    作者:Jina AI发布日期:2025-09-30 16:17:52

    模型上下文协议 (MCP) 是连接 LLM/Agent 与外部工具的通信标准。它允许 LLM 动态发现并调用 API工具,将他们串成一个完整的工作流,从而实现自主规划、推理与执行。上个月我们悄悄发布了

    阅读全文
  • 文章封面

    让 llama.cpp 支持多模态向量模型

    作者:Jina AI发布日期:2025-09-12 10:20:54

    几周前,我们发布了 jina-embeddings-v4 模型的 GGUF 版本,大幅降低了显存占用,提升了运行效率。不过,受限于 llama.cpp 上游版本的运行时,当时的 GGUF 模型只能当作

    阅读全文
  • 文章封面

    Jina Code Embeddings: 为高质量代码搜索而生的0.5B/1.5B向量模型

    作者:Jina AI发布日期:2025-09-05 10:24:55

    我们今天正式开源 jina-code-embeddings,一套全新的代码向量模型。包含 0.5B 和 1.5B 两种参数规模,并同步推出了 1-4 bit 的 GGUF 量化版本,方便在各类端侧硬件

    阅读全文
  • 文章封面

    回归C++: 在GGUF上构建高效的向量模型

    作者:Jina AI发布日期:2025-08-14 09:03:41

    两周前,我们发布了 jina-embeddings-v4 的 GGUF 格式及其多种动态量化版本。jina-embeddings-v4 原模型有 37.5 亿参数,在我们的 GCP G2 GPU 实例

    阅读全文
  • 文章封面

    JinaVDR: 一个图文混排文档搜索任务的基准集

    作者:Jina AI发布日期:2025-08-07 12:46:41

    大部分现有的文档检索基准(如MTEB)只考虑了纯文本。而一旦文档的关键信息蕴含在图表、截图、扫描件和手写标记中,这些基准就无能为力。为了更好的开发下一代向量模型和重排器,我们首先需要一个能评测模型在视

    阅读全文
  • 文章封面

    Jina Embeddings v4 的量化感知训练

    作者:Jina AI发布日期:2025-07-09 13:34:59

    在 AI 领域,我们对模型的期待总是既要、又要、还要:模型要强,速度要快,成本还要低。但实际应用时,高质量的向量表征往往意味着庞大的数据体积,既拖慢检索速度,也推高存储和内存消耗。量化(Quantiz

    阅读全文
  • 文章封面

    用子模优化法为DeepResearch生成多样性查询

    作者:Jina AI发布日期:2025-07-07 11:41:30

    在开发DeepResearch时,生成多样化的查询 (query) 是一个关键细节。我们在开发时会在至少两处遇到这个问题。第一处是在解析用户的原始输入,并生成网页搜索查询,因为直接把原始输入抛给搜索引

    阅读全文
  • 文章封面

    Correlations:氛围测试你的向量模型

    作者:Jina AI发布日期:2025-05-29 11:25:06

    在今年 ICLR 会议上,我们被问到最多且最有意思的问题是:像 Jina AI 这样的向量搜索模型提供商,除了在 MTEB 上做基准测试,会不会做些氛围测试 (Vibe-testing)?MTEB 全

    阅读全文
  • 文章封面

    这样更公平:用jina-reranker-m0为多模态文档打分重排

    作者:Jina AI发布日期:2025-05-27 08:18:03

    当你在搜索“中国队在多哈乒乓球锦标赛的成绩”时,一篇新闻报道的文本部分和你的查询的相关性是 0.7,配图的相关性 0.5;另一篇则是文本相关性为 0.6,图片也是 0.6。那么,哪一篇报道才是你真正想

    阅读全文
  • 文章封面

    喝下这一碗模型汤,掌握向量模型的训练秘方

    作者:Jina AI发布日期:2025-05-09 18:31:30

    那些曾在KDD时代Kaggle上打榜刷分的老炮儿,每每提起 Bagging 与 Boosting 这两项技术嘴角都压不住笑。如果说Ensemble Learning代表了上个时代的机器学习,那么“模型

    阅读全文
  • 文章封面

    文本向量的长度偏差及其在搜索中的影响

    作者:Jina AI发布日期:2025-04-17 09:02:12

    向量模型的核心功能是测量语义相似度,但这个测量结果很容易受到多种干扰因素的影响。在本文中,我们将着眼于文本向量模型中一个普遍存在的偏差来源:输入内容的长度。通常情况下,当与其它文本向量进行比较时,长文

    阅读全文
  • 文章封面

    Jina AI 携搜索小模型亮相 ICLR 2025 新加坡

    作者:Jina AI发布日期:2025-04-11 16:23:17

    四月,机器学习领域的目光将汇聚新加坡,顶级会议 ICLR 2025 定于 4 月 24 日至 28 日在新加坡博览中心举行。当大家都在追逐大模型时,Jina AI 将带来不一样的声音:我们聚焦于更小巧

    阅读全文
  • 文章封面

    jina-reranker-m0 全新多模态多语言重排器

    作者:Jina AI发布日期:2025-04-09 12:00:26

    今天,我们正式发布jina-reranker-m0。这是一款多模态、多语言重排器(reranker),其核心能力在于 对包含丰富视觉元素的文档进行重排和精排,同时兼容跨语言场景。当用户输入一个查询(q

    阅读全文
  • 文章封面

    Jina AI x Google Cloud: DeepSearch技术沙龙·深圳站报名开启!

    作者:Jina AI发布日期:2025-04-07 17:01:09

    在 2025 年春节短短几天内,Deep(Re)Search 迅速从一个学术概念走向了生产实践,迅速成为 25 年 AI 搜索的新范式。Deep(Re)Search 并非简单的 RAG,而是基于“搜索

    阅读全文
  • 文章封面

    在DeepSearch中用DeepSeek-R1来做动作决策会更好么?

    作者:Jina AI发布日期:2025-04-02 10:05:11

    众所周知,DeepSeek R1 这种模型在推理任务上很能打,尤其是在数学和编程这些逻辑性强的领域。那么我们能直接把这种强大的推理能力搬到 DeepSearch 这种需要动态规划、多轮交互的深度搜索场

    阅读全文
  • 文章封面

    DeepSearch/DeepResearch 北京场分享干货回顾!本周日,上海再续!

    作者:Jina AI发布日期:2025-03-24 18:07:14

    2025 年 3 月 22 号,Jina AI x Google Cloud Deep(Re)Search 线下沙龙 · 北京场圆满结束,本场活动吸引了超过 100 位搜索领域同好,大家与分享嘉宾 J

    阅读全文