Monet:赋予多模态大模型如人类一般的抽象视觉思考能力
“Think with images”范式,即通过工具调用或代码生成等方法来在思考过程的中间步引入辅助图像(如裁剪、标定、作辅助线等),已经成为增强多模态大语言模型(MLLMs)视觉推理能力的重要范式
阅读全文“Think with images”范式,即通过工具调用或代码生成等方法来在思考过程的中间步引入辅助图像(如裁剪、标定、作辅助线等),已经成为增强多模态大语言模型(MLLMs)视觉推理能力的重要范式
阅读全文图片由 AI 生成在当前的AI服务场景中,大语言模型(LLM)的部署常常面临一个核心难题:如何在不中断服务的情况下,根据实时变化的负载动态调整模型的计算资源分配?传统的静态部署方式,一旦选定流水线并行
阅读全文Talk is cheap. Show me the code.「少说废话,代码拿来。」Linux 内核和 Git 的作者 Linus Torvalds,如是说。Kimi 官方把它放在了今天这份技术博
阅读全文阿里前几天开源的Qwen3.6-35B-A3B,让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争,一边又必须回答一个更麻烦的问题:相较于 Qwen3.5
阅读全文2026-04-21 GitHub日Star榜 每日精选最值得关注的开源项目 1. Kami(热度: 461) Kami是一个AI技能,用于文档自动排版,采用温暖纸浆色调、单一强调色和统一
阅读全文新智元报道 编辑:Aeneas【新智元导读】华为Pura X Max震撼发布!搭载HarmonyOS 6.1与行业首创的伴随式AI解决方案——「小艺伴随式AI」,从此AI不再是「外挂」,而是你的
阅读全文新智元报道 编辑:KingHZ【新智元导读】OpenAI放出一记暗招——让AI记住你电脑上的一切。Chronicle不是聊天工具,是贴身读心术。Anthropic把Claude Code杀进程序
阅读全文新智元报道 编辑:LRST【新智元导读】随着大语言模型(LLM)驱动的多智能体系统快速发展,越来越多的系统被用于软件工程、科学分析、网页自动化、组织协作和社会模拟等任务。但一个核心问题始终没有被
阅读全文K2.6 加持的 Kimi「Agent」表现如何?👦🏻 作者: 镜山🥷 编辑: Koji🧑🎨 排版: NCon最近两个月,OpenClaw 和 Hermes Agent 相继爆火。OpenClaw
阅读全文龙虾还没装上,朋友圈已经开始「养马」了。今年 OpenClaw 和 Hermes 火了之后,AI 能干活这件事算是彻底坐实了。不过虽然 AI 圈的朋友熬夜「养龙虾」,已经跑通了各种自动化流程,但很多人
阅读全文Kimi K2.6发布并开源了,代码、Agent能力大幅提升。龙虾又可以换更好的国产模型替代了。Claude Code的源码前不久泄露了,这事儿大家应该都知道了。因为还缺了一些东西,所以想在本地把这东
阅读全文如果你的企业龙虾还饿着,用不了你的企业软件,请联络我们聊聊(联系方式见文末)。最近跟几家企业聊 Agent 落地,听到一个高频场景:老板看了 OpenClaw 的演示,觉得太牛了,立刻让团队装上。三天
阅读全文顶会越来越卷,与其在天坑里盲目死磕,不如用这五年的两万份真实投稿数据,给自己的选题算一卦。ICLR 2026 官方公布的数据显示,今年的整体录用率仅为 27.4%。在顶会命中率持续走低的大环境下,前期
阅读全文随着大语言模型(LLM)驱动的多智能体系统快速发展,越来越多的系统被用于软件工程、科学分析、网页自动化、组织协作和社会模拟等任务。但一个核心问题始终没有被系统回答:为什么有些智能体架构可以支持长链条、
阅读全文作者 | 凌敏 特斯拉前 AI 总监、OpenAI 创始成员 Andrej Karpathy 在去年随口提出 Vibe Coding 的时候,或许也没想到,它会变成一场运动,并从 240 亿个词汇中脱
阅读全文作者 | 王硕 业务背景在我们团队的视频审核服务中台里,每天需要处理海量的视频进审截图。为了全方位保障内容安全,我们引入了多种 AI 小模型对图片进行并发检测,主要包括:自研色情检测服务(基于 ViT
阅读全文作者 | 木子 又是人间 4 月天,今年的 2050 大会即将开幕!⌛️ 时间:2026 年 4 月 24 日 -4 月 26 日🏢 地点:中国杭州 · 云栖小镇国际会展中心2050 大会,是王坚院士
阅读全文关于AI与电工短缺的三个“反常识”预言。作者|硅谷Tech news编辑|赵虹宇本文首发于钛媒体APP英伟达CEO黄仁勋最近有点“烦”。一边是美国政府不断收紧的芯片出口管制,一边是市场对其“护城河”还
阅读全文工业场景下,物理AI已经可以替代人在危险场景下作业。文|Leo张ToB杂谈作者|张申宇编辑丨杨林本文首发于钛媒体APP中科智云首席产品官轩江告诉笔者,通过其工业装备全域智能体,一个建筑工地上的四台塔吊
阅读全文AutoClaw的Hermes 自我进化能力上线!内置了本地的Skills商店功能,包含了众多高质量的Skill。内容覆盖深度研究、公众号写作、金融数据分析以及各类开发工具,与飞书的集成等等内容。打包
阅读全文前文列表让 OpenClaw 安全的运行在 MacOS 主力机上最大化提效OpenClaw 总体架构技术拆解OpenClaw 操作指令大全OpenClaw 在企业白领提升办公效率方面的应用场景分析op
阅读全文邓明扬现为 MIT 博士生,师从何恺明,主要研究生成模型。本科期间,他在 MIT 学习数学与计算机科学,也曾在 DeepMind 和 Meta 实习。更早之前,他曾获得 IMO 金牌和 IOI 金牌。
阅读全文图片来源:Mike SullivanGoogle 已组建了一支由研究人员和工程师组成的特别小组来改进其 AI 编码模型,据三位了解情况的人士透露,此举旨在实现更多自身编码的自动化,并最终实现 AI 研
阅读全文图片来源:CuspAI英国初创公司CuspAI 致力于利用人工智能发现新材料,目前正在讨论融资至少 2 亿美元的新一轮融资,知情人士表示。尽管尚未签署条款清单,但据其中一位知情人士透露,任何一轮融资都
阅读全文作者|孙芮邮箱|sunrui@pingwest.com对于一个没有技术背景的人来说,把想法变成可用的工具,最大的阻碍是什么?最近,我在朋友圈看到一个完全没有技术背景的朋友也在做自己的「闪应用」。她在周
阅读全文作者|董道力邮箱|dongdaoli@pingwest.com4 月 20 日,月之暗面发布了新模型 Kimi K2.6,并同步开源。从官方展示来看,这次更新重点有三块:长周期 coding、网页设计
阅读全文