OneSearch,揭开快手电商搜索「一步到位」的秘技
机器之心发布机器之心编辑部还有一个多月,一年一度的“双十一”购物节就要来了!作为消费者,你通常会如何寻找心仪的商品呢?或许你兴致勃勃地在搜索框里敲下关键词,却发现呈现出来的商品列表总是差强人意。那么,
阅读全文机器之心发布机器之心编辑部还有一个多月,一年一度的“双十一”购物节就要来了!作为消费者,你通常会如何寻找心仪的商品呢?或许你兴致勃勃地在搜索框里敲下关键词,却发现呈现出来的商品列表总是差强人意。那么,
阅读全文机器之心报道编辑:杨文、+0IMO 之后,OpenAI 与 Gemini 双双加冕 ICPC 2025 金牌。就在刚刚,OpenAI 和 Gemini 都声称达到了 ICPC 金牌水平。其中,Open
阅读全文机器之心报道机器之心编辑部Agent 今年这么火,AI 圈几乎人人都在讨论。但抛开那些花哨的概念,一个好用的 Agent 究竟应该是什么样的?咱们不妨接地气一点,从每天都刷一刷的「公众号」聊起。不知道
阅读全文最近在 B 站上,你是否也刷到过一些 “魔性” 又神奇的 AI 视频?比如英文版《甄嬛传》、坦克飞天、曹操大战孙悟空…… 这些作品不仅完美复现了原角色的音色,连情感和韵律都做到了高度还原!更让人惊讶的
阅读全文机器之心原创编辑:杜伟不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商
阅读全文机器之心发布机器之心编辑部今天,蚂蚁百灵大模型团队正式开源其最新 MoE 大模型 ——Ling-flash-2.0。作为 Ling 2.0 架构系列的第三款模型,Ling-flash-2.0 以总参数
阅读全文机器之心报道机器之心编辑部近日,Agent 领域再次传来新进展,谷歌宣布推出 Agent 支付协议 ——AP2(Agent Payments Protocol ),这是一种开放的共享协议,为 Agen
阅读全文自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后,如何让大模型掌握这种并行探索多种推理路径的能力,成为了学界关注的焦点。然而,现有方法多依赖于监督微调(SFT),模型一来只能
阅读全文机器之心报道编辑:Panda很多人相信,我们已经进入了所谓的「AI 下半场」,一个模型能力足够强大、应用理应爆发的时代。然而,对于这个时代真正缺少的东西,不同的人有不同的侧重,比如(前)OpenAI
阅读全文机器之心发布机器之心编辑部近日,全球网络通信顶会 ACM SIGCOMM 2025 在葡萄牙落幕,共 3 篇论文获奖,华为网络技术实验室与香港科技大学 iSING Lab 合作的 DCP 研究成果,获
阅读全文近年来,以人形机器人、自动驾驶为代表的具身人工智能(Embodied Artificial Intelligence, EAI)正以前所未有的速度发展,从数字世界大步迈向物理现实。然而,当一次错误的风
阅读全文机器之心发布机器之心编辑部让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的,是当明快的旋律响起,它会自然扬起嘴角,眼神含笑;当进入说唱段落,它会随着鼓点起伏,肩膀与手臂有节奏地带动气氛。观众
阅读全文机器之心发布机器之心编辑部日前,在 2025 Inclusion・外滩大会上,蚂蚁集团发布了全球首个智能眼镜可信连接技术框架 ——gPass。该技术具备「安全、交互、连接」三大核心能力,致力于实现 A
阅读全文本文来自加州大学圣克鲁兹分校(UCSC)、苹果公司(Apple)与加州大学伯克利分校(UCB)的合作研究。第一作者刘彦青,本科毕业于浙江大学,现为UCSC博士生,研究方向包括多模态理解、视觉-语言预训
阅读全文机器之心报道编辑:杨文AI点餐时代来了?这一年,AI Agent 的热度一路走高。从大洋彼岸的 OpenAI、谷歌等 AI 巨头,到国内的各类创业公司,大家都在摸索如何让 AI 真正帮人干活。相比需要
阅读全文机器之心报道编辑:张倩只用 1.5% 的内存预算,性能就能超越使用完整 KV cache 的模型,这意味着大语言模型的推理成本可以大幅降低。EvolKV 的这一突破为实际部署中的内存优化提供了全新思路
阅读全文在大型语言模型(LLM)的浪潮下,多模态 AI 取得了飞速发展,尤其是在视觉语言(LVLM)领域,已经形成了成熟的研究范式。然而,与之形成鲜明对比的是,大型语音语言模型(LSLM)的发展却显得零散且步
阅读全文机器之心报道编辑:泽南、杨文与其他全开源模型相比,性能提升2-5倍。小参数模型也进入了 R1 时代,这次开源出新技术的是 Meta。本周五,Meta AI 团队正式发布了 MobileLLM-R1。H
阅读全文机器之心报道编辑:冷猫超高规格团队,重新审视RL推理领域发展策略。在人工智能的发展中,强化学习 (RL) 一直是一种非常重要的方法。自 1998 年 Sutton 提出强化学习概念以来,就明确了只要给
阅读全文数字人视频生成技术正迅速成为增强人机交互体验的核心手段之一。然而,现有方法在实现低延迟、多模态控制与长时序一致性方面仍存在显著挑战。大多数系统要么计算开销巨大,无法实时响应,要么只能处理单一模态输入,
阅读全文机器之心报道编辑:张倩挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数
阅读全文机器之心报道机器之心编辑部好工具,才有好智能体。智能体(Agent)时代,工具已不再只是传统 API 或函数接口的简单封装,而是决定智能体能否高效完成任务的关键。为了让智能体真正释放潜力,我们需要重新
阅读全文图检索增强生成(GraphRAG)已成为大模型解决复杂领域知识问答的重要解决方案之一。然而,当前学界和开源界的方案都面临着三大关键痛点:开销巨大:通过 LLM 构建图谱及社区,Token 消耗大,耗时
阅读全文机器之心报道机器之心编辑部真正的元凶是缺乏批次不变性。就在今天,由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab,
阅读全文机器之心报道机器之心编辑部AI 开发复杂软件的时代即将到来?近年来,以 Google 的 AlphaEvolve 为代表的研究已经证明,AI 智能体可以通过迭代来优化算法,甚至在某些小型、独立的编程任
阅读全文当人们还在惊叹大模型能写代码、能自动化办公时,它们正在悄然踏入一个更敏感、更危险的领域 —— 网络安全。想象一下,如果 AI 不只是写代码的助手,而是能够像「白帽黑客」一样,在不破坏系统的前提下模拟攻
阅读全文机器之心原创编辑:吴昕一场关于未来金融智能的集体预演,见证了创业者们的冲刺,也折射出一个行业的进化。2025 年的 AI ,正在上演「双线长跑」。一端是大模型底层的持续进化,远未触顶;另一端是场景应用
阅读全文机器之心报道编辑:+0、张倩想象一下,如果 ChatGPT 等 AI 大模型在生成的时候,能把自己不确定的地方都标记出来,你会不会对它们生成的答案放心很多?上周末,OpenAI 发的一篇论文引爆了社区
阅读全文打开手机,让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务,这正成为智能手机交互的新范式。一个能自主处理大部分日常任务的个人专属智能体,正在从科幻走进现实。然而,通往 “解放双手”
阅读全文机器之心报道机器之心编辑部当下的大语言模型,不怕它搞不定,就怕它胡说八道:有「幻觉」存在,我们经常会下意识地不信任 AI 输出的结果。就在上周,OpenAI 的论文《Why Language Mode
阅读全文