全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    OneSearch,揭开快手电商搜索「一步到位」的秘技

    作者:机器之心发布日期:2025-09-18 12:29:05

    机器之心发布机器之心编辑部还有一个多月,一年一度的“双十一”购物节就要来了!作为消费者,你通常会如何寻找心仪的商品呢?或许你兴致勃勃地在搜索框里敲下关键词,却发现呈现出来的商品列表总是差强人意。那么,

    阅读全文
  • 文章封面

    刚刚,OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平

    作者:机器之心发布日期:2025-09-18 12:29:05

    机器之心报道编辑:杨文、+0IMO 之后,OpenAI 与 Gemini 双双加冕 ICPC 2025 金牌。就在刚刚,OpenAI 和 Gemini 都声称达到了 ICPC 金牌水平。其中,Open

    阅读全文
  • 文章封面

    从一个公众号智能体说起:好用的Agent,究竟需要什么?

    作者:机器之心发布日期:2025-09-18 12:29:05

    机器之心报道机器之心编辑部Agent 今年这么火,AI 圈几乎人人都在讨论。但抛开那些花哨的概念,一个好用的 Agent 究竟应该是什么样的?咱们不妨接地气一点,从每天都刷一刷的「公众号」聊起。不知道

    阅读全文
  • 文章封面

    B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

    作者:机器之心发布日期:2025-09-18 12:29:05

    最近在 B 站上,你是否也刷到过一些 “魔性” 又神奇的 AI 视频?比如英文版《甄嬛传》、坦克飞天、曹操大战孙悟空…… 这些作品不仅完美复现了原角色的音色,连情感和韵律都做到了高度还原!更让人惊讶的

    阅读全文
  • 文章封面

    没想到,音频大模型开源最彻底的,居然是小红书

    作者:机器之心发布日期:2025-09-17 17:34:41

    机器之心原创编辑:杜伟不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商

    阅读全文
  • 文章封面

    6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0

    作者:机器之心发布日期:2025-09-17 17:34:41

    机器之心发布机器之心编辑部今天,蚂蚁百灵大模型团队正式开源其最新 MoE 大模型 ——Ling-flash-2.0。作为 Ling 2.0 架构系列的第三款模型,Ling-flash-2.0 以总参数

    阅读全文
  • 文章封面

    「AI助手」真来了?谷歌牵头推进Agent支付协议AP2

    作者:机器之心发布日期:2025-09-17 17:34:41

    机器之心报道机器之心编辑部近日,Agent 领域再次传来新进展,谷歌宣布推出 Agent 支付协议 ——AP2(Agent Payments Protocol ),这是一种开放的共享协议,为 Agen

    阅读全文
  • 文章封面

    腾讯AI Lab首创RL框架Parallel-R1,教大模型学会「并行思维」

    作者:机器之心发布日期:2025-09-17 17:34:41

    自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后,如何让大模型掌握这种并行探索多种推理路径的能力,成为了学界关注的焦点。然而,现有方法多依赖于监督微调(SFT),模型一来只能

    阅读全文
  • 文章封面

    高阶程序,让AI从技术可行到商业可信的最后一公里

    作者:机器之心发布日期:2025-09-16 19:45:58

    机器之心报道编辑:Panda很多人相信,我们已经进入了所谓的「AI 下半场」,一个模型能力足够强大、应用理应爆发的时代。然而,对于这个时代真正缺少的东西,不同的人有不同的侧重,比如(前)OpenAI

    阅读全文
  • 文章封面

    网络顶会获奖!华为提出端网协同RDMA传输架构,解决大规模AI集群网络可扩展性问题

    作者:机器之心发布日期:2025-09-16 19:45:58

    机器之心发布机器之心编辑部近日,全球网络通信顶会 ACM SIGCOMM 2025 在葡萄牙落幕,共 3 篇论文获奖,华为网络技术实验室与香港科技大学 iSING Lab 合作的 DCP 研究成果,获

    阅读全文
  • 文章封面

    具身智能能力狂飙,安全却严重滞后?首个安全可信EAI框架与路线图出炉!

    作者:机器之心发布日期:2025-09-16 19:45:58

    近年来,以人形机器人、自动驾驶为代表的具身人工智能(Embodied Artificial Intelligence, EAI)正以前所未有的速度发展,从数字世界大步迈向物理现实。然而,当一次错误的风

    阅读全文
  • 文章封面

    从「对口型」到「会表演」,刚进化的可灵AI数字人,技术公开了

    作者:机器之心发布日期:2025-09-15 20:17:07

    机器之心发布机器之心编辑部让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的,是当明快的旋律响起,它会自然扬起嘴角,眼神含笑;当进入说唱段落,它会随着鼓点起伏,肩膀与手臂有节奏地带动气氛。观众

    阅读全文
  • 文章封面

    数字生活的原生入口:蚂蚁集团发布AI眼镜全新技术框架gPass

    作者:机器之心发布日期:2025-09-15 20:17:07

    机器之心发布机器之心编辑部日前,在 2025 Inclusion・外滩大会上,蚂蚁集团发布了全球首个智能眼镜可信连接技术框架 ——gPass。该技术具备「安全、交互、连接」三大核心能力,致力于实现 A

    阅读全文
  • 文章封面

    OpenVision 2:大道至简的生成式预训练视觉编码器

    作者:机器之心发布日期:2025-09-15 20:17:07

    本文来自加州大学圣克鲁兹分校(UCSC)、苹果公司(Apple)与加州大学伯克利分校(UCB)的合作研究。第一作者刘彦青,本科毕业于浙江大学,现为UCSC博士生,研究方向包括多模态理解、视觉-语言预训

    阅读全文
  • 文章封面

    抢先实测美团首个AI Agent,让我体验一把「懒人点餐」的快乐

    作者:机器之心发布日期:2025-09-14 13:13:34

    机器之心报道编辑:杨文AI点餐时代来了?这一年,AI Agent 的热度一路走高。从大洋彼岸的 OpenAI、谷歌等 AI 巨头,到国内的各类创业公司,大家都在摸索如何让 AI 真正帮人干活。相比需要

    阅读全文
  • 文章封面

    将KV Cache预算降至1.5%!他们用进化算法把大模型内存占用砍下来了

    作者:机器之心发布日期:2025-09-14 13:13:34

    机器之心报道编辑:张倩只用 1.5% 的内存预算,性能就能超越使用完整 KV cache 的模型,这意味着大语言模型的推理成本可以大幅降低。EvolKV 的这一突破为实际部署中的内存优化提供了全新思路

    阅读全文
  • 文章封面

    LLaSO 横空出世:逻辑智能推出全球首个完全开源语音大模型框架,定义 LSLM 研究新基准

    作者:机器之心发布日期:2025-09-14 13:13:34

    在大型语言模型(LLM)的浪潮下,多模态 AI 取得了飞速发展,尤其是在视觉语言(LVLM)领域,已经形成了成熟的研究范式。然而,与之形成鲜明对比的是,大型语音语言模型(LSLM)的发展却显得零散且步

    阅读全文
  • 文章封面

    Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3

    作者:机器之心发布日期:2025-09-13 16:52:17

    机器之心报道编辑:泽南、杨文与其他全开源模型相比,性能提升2-5倍。小参数模型也进入了 R1 时代,这次开源出新技术的是 Meta。本周五,Meta AI 团队正式发布了 MobileLLM-R1。H

    阅读全文
  • 文章封面

    清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

    作者:机器之心发布日期:2025-09-13 16:52:17

    机器之心报道编辑:冷猫超高规格团队,重新审视RL推理领域发展策略。在人工智能的发展中,强化学习 (RL) 一直是一种非常重要的方法。自 1998 年 Sutton 提出强化学习概念以来,就明确了只要给

    阅读全文
  • 文章封面

    快手可灵团队提出MIDAS:压缩比64倍、延迟低于500ms,多模态互动数字人框架实现交互生成新突破

    作者:机器之心发布日期:2025-09-13 16:52:17

    数字人视频生成技术正迅速成为增强人机交互体验的核心手段之一。然而,现有方法在实现低延迟、多模态控制与长时序一致性方面仍存在显著挑战。大多数系统要么计算开销巨大,无法实时响应,要么只能处理单一模态输入,

    阅读全文
  • 文章封面

    扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源

    作者:机器之心发布日期:2025-09-12 19:28:02

    机器之心报道编辑:张倩挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数

    阅读全文
  • 文章封面

    如何为LLM智能体编写工具?Anthropic官方教程来了

    作者:机器之心发布日期:2025-09-12 19:28:02

    机器之心报道机器之心编辑部好工具,才有好智能体。智能体(Agent)时代,工具已不再只是传统 API 或函数接口的简单封装,而是决定智能体能否高效完成任务的关键。为了让智能体真正释放潜力,我们需要重新

    阅读全文
  • 文章封面

    腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破

    作者:机器之心发布日期:2025-09-12 19:28:02

    图检索增强生成(GraphRAG)已成为大模型解决复杂领域知识问答的重要解决方案之一。然而,当前学界和开源界的方案都面临着三大关键痛点:开销巨大:通过 LLM 构建图谱及社区,Token 消耗大,耗时

    阅读全文
  • 文章封面

    刚刚,Thinking Machines Lab首次发长文,揭开LLM推理不确定性真相

    作者:机器之心发布日期:2025-09-11 11:32:23

    机器之心报道机器之心编辑部真正的元凶是缺乏批次不变性。就在今天,由 OpenAI 前 CTO Mira Murati 成立于今年 2 月的人工智能初创公司 Thinking Machines Lab,

    阅读全文
  • 文章封面

    英伟达的AI已经开始接管整个项目了?SATLUTION自主进化代码库登顶SAT竞赛

    作者:机器之心发布日期:2025-09-11 11:32:23

    机器之心报道机器之心编辑部AI 开发复杂软件的时代即将到来?近年来,以 Google 的 AlphaEvolve 为代表的研究已经证明,AI 智能体可以通过迭代来优化算法,甚至在某些小型、独立的编程任

    阅读全文
  • 文章封面

    大模型智能体不止能写代码,还能被训练成白帽黑客

    作者:机器之心发布日期:2025-09-11 11:32:23

    当人们还在惊叹大模型能写代码、能自动化办公时,它们正在悄然踏入一个更敏感、更危险的领域 —— 网络安全。想象一下,如果 AI 不只是写代码的助手,而是能够像「白帽黑客」一样,在不破坏系统的前提下模拟攻

    阅读全文
  • 文章封面

    AI应用元年,这场标杆赛事见证了中国创新速度与野心

    作者:机器之心发布日期:2025-09-10 12:00:02

    机器之心原创编辑:吴昕一场关于未来金融智能的集体预演,见证了创业者们的冲刺,也折射出一个行业的进化。2025 年的 AI ,正在上演「双线长跑」。一端是大模型底层的持续进化,远未触顶;另一端是场景应用

    阅读全文
  • 文章封面

    AI胡说八道这事,终于有人管了?

    作者:机器之心发布日期:2025-09-10 12:00:02

    机器之心报道编辑:+0、张倩想象一下,如果 ChatGPT 等 AI 大模型在生成的时候,能把自己不确定的地方都标记出来,你会不会对它们生成的答案放心很多?上周末,OpenAI 发的一篇论文引爆了社区

    阅读全文
  • 文章封面

    人人都能炼专属Agent,上海交大开源端侧Agent全栈工具链,真实场景性能超GPT-5!

    作者:机器之心发布日期:2025-09-10 12:00:02

    打开手机,让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务,这正成为智能手机交互的新范式。一个能自主处理大部分日常任务的个人专属智能体,正在从科幻走进现实。然而,通往 “解放双手”

    阅读全文
  • 文章封面

    文心新出的推理大模型,给了我们信心

    作者:机器之心发布日期:2025-09-09 19:43:45

    机器之心报道机器之心编辑部当下的大语言模型,不怕它搞不定,就怕它胡说八道:有「幻觉」存在,我们经常会下意识地不信任 AI 输出的结果。就在上周,OpenAI 的论文《Why Language Mode

    阅读全文
上一页下一页