全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    轻量高效,即插即用:Video-RAG为长视频理解带来新范式

    作者:机器之心发布日期:2025-10-20 12:48:21

    尽管视觉语言模型(LVLMs)在图像与短视频理解中已取得显著进展,但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一

    阅读全文
  • 文章封面

    Claude Skills到底是什么?和MCP、RAG、FunctionCaling的本质区别是? 一个暴论:AI Agent的未来,一半靠模型,另一半靠工程。 A社这次不止增加了这个概念,还开源了一个仓库,https://github.com/anthropics/skills,里面包含了所有20个左右的官方Skill的源码示例,这才是真正的灵魂。 一个Skill = 任务说明书 SKILL.md + 工具代码 (scripts) + 专业知识 (references) + 素材资源 (assets)。 它把完成一个特定任务所需的一切都打包好了,本质上就是一种代码和资源的组织方式,一种约定优于配置的理念。 精髓是:为上下文窗口减负这部分是Claude Skills设计的精髓,也是它和简单RAG/MCP/FunctionCalling的最大区别。它就是一套精心设计,为了节省上下文窗口而设计的分层加载策略。 Claude Skills与MCP的关系,它俩不是替代关系,而是正交的、可以组合的。MCP负责连接,Skills负责驱动。一个解决通信标准,一个解决能力封装。 这套东西,有什么用?既然这玩意儿本质上就是一堆文件夹和代码,我们能从中得到什么?最大的价值是:Anthropic把他们在生产环境中打磨出的一套Agent能力管理的设计模式开源了。我们完全可以把这个模式借鉴过来,用在自己的Agent体系里,不管你用的是Qwen、Deepseek,还是别的模型。 当你的Agent能力越来越多时,怎么管理?一个几千行的System Prompt?一个包含几十个工具函数的大杂烩文件?这些都很难维护。 而Skills提供了一种解耦的、模块化的方案。你团队里的Agent不再是依赖一个巨大的、难以维护的system_prompt.txt,而是一个由几十个标准化的Skill文件夹组成的能力库,每个Skill都可以独立版本控制、测试和迭代。 所以说呀,Claude Skills本身不是什么黑科技。它最大的启示还是:AI Agent的未来,一半靠模型,另一半靠工程。

    作者:探索AGI发布日期:2025-10-20 11:50:00

    Claude Skills到底是什么?和MCP、RAG、FunctionCaling的本质区别是? 一个暴论:AI Agent的未来,一半靠模型,另一半靠工程。 A社这次不止增加了这个概念,还开源

    阅读全文
  • 文章封面

    中国AI的另一面,创业公司正在集体“出局”

    作者:钛媒体AGI发布日期:2025-10-20 11:38:21

    全球AI发展两年多,人们逐渐认识到了一个现实:模型的机会只属于大厂,而创业公司最终拿走了AI应用的机会。一个数据印证了这一趋势:在AI产品榜全球Top50中,34个国外应用里仅有5个出自“大厂”。但到

    阅读全文
  • 文章封面

    Codex 和 Claude Code,用哪个?

    作者:AGI Hunt发布日期:2025-10-20 11:01:56

    Codex 和 Claude Code,用哪个呢?当然是:全!都!要!本文 90% 是我用嘴写的(语音输入),当作周末做的一个小东西的整理,属于想到哪儿说到哪儿,硬凑了 10 点,如下:一、如果有条件

    阅读全文
  • 文章封面

    百度0.9B参数模型登顶全球第一,聊聊PaddleOCR-VL背后的技术细节

    作者:AIGC开放社区发布日期:2025-10-20 10:53:57

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!‍‍‍‍百度用一个仅0.9B参数的

    阅读全文
  • 文章封面

    万字硬核解读SAM 3:不止分割一切,它开始理解世界了

    作者:AIGC开放社区发布日期:2025-10-20 10:53:57

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!Meta最新的SAM 3,让分割模

    阅读全文
  • 文章封面

    Vibe Coding线下沙龙来啦!吃透原理、玩转应用,大咖圆桌陪你畅聊AI开发

    作者:AIGC开放社区发布日期:2025-10-20 10:53:57

    为助力开发者深入理解 Vibe Coding 核心逻辑,高效掌握其在实际场景中的应用方法,10 月 25 日,由AIGC开放社区主办的「Vibe Coding—AI Code 线下沙龙」将在上海云赛空

    阅读全文
  • 文章封面

    CSwitch 新增加托盘可一键切换模型

    作者:字节笔记本发布日期:2025-10-20 10:12:08

    阅读全文
  • 文章封面

    中国IT革命三十年,科技品牌如何年轻?

    作者:硅星人Pro发布日期:2025-10-20 09:58:04

    作者|郭海惟邮箱|guohaiwei@pingwest.com作者|黄小艺邮箱|huangxiaoyi@pingwest.com10月13日,华为正式发布了中译版的宣传片《Now is Yours》。

    阅读全文
  • 文章封面

    「醉」简单的机器人局 | IROS Paper 看完了,来聊点论文里不写的

    作者:硅星人Pro发布日期:2025-10-20 09:58:04

    1当 IROS 主会散场,机器人还不肯睡——2025年10月19日—10月25日,IEEE/RSJ 国际智能机器人与系统大会(IROS 2025)将在中国杭州举行。这是时隔 19 年 IROS 再回中

    阅读全文
  • 文章封面

    苏妈不想当第二

    作者:硅星人Pro发布日期:2025-10-20 09:58:04

    文章转载于直面AI全球三大芯片巨头英伟达、AMD、英特尔,已经全部由华人掌舵——英伟达的CEO是其创始人黄仁勋,人称皮衣教主;AMD的CEO是人称“苏妈”的苏姿丰;而英特尔的CEO是今年3月才上任的陈

    阅读全文
  • 文章封面

    iPhone 17全系包揽销量榜前三/OpenAI员工否认GPT-6年底见/法国罗浮宫被盗过程仅7分钟

    作者:APPSO发布日期:2025-10-20 08:49:52

    🍎iPhone 17 Pro 机身褪色上热搜,触屏版 MacBook Pro 再曝光💎法国罗浮宫被盗过程仅 7 分钟💻苹果 CEO:Apple Intelligence 正努力入华🔍接替王腾,魏思琪新

    阅读全文
  • 文章封面

    视频AI的"统一时刻":UniVideo如何实现理解、生成与编辑的三位一体

    作者:觉察流发布日期:2025-10-20 08:10:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 可灵UniVideo突破性地将统一多模态模型扩展至视频领域,通过双流架构实现理解、生成与编辑的无缝融合。本文介绍其技术原

    阅读全文
  • 文章封面

    {速度+质量}兼得 | FlashWorld 6s生成高质量3D场景,支持“单图或文本”,无需等待1小时!

    作者:AI产品汇发布日期:2025-10-20 07:50:00

    打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://imlixinyang.github.io/FlashWorld-Project-Page/样

    阅读全文
  • 文章封面

    谷歌 AI Studio 三连更,Gemini 3 真要来了?

    作者:AI信息Gap发布日期:2025-10-20 06:00:00

    一文带你认识最新的谷歌 AI Studio。上周,几乎被 Logan Kilpatrick 刷屏了。这位前 OpenAI 开发者关系负责人,去年 4 月跳槽到谷歌担任 AI Studio 产品负责人。

    阅读全文
  • 文章封面

    是RAG已死,还是RAG Anything,All in RAG?

    作者:AI修猫Prompt发布日期:2025-10-20 00:17:29

    每隔一阵子,总有人宣告“RAG已死”:上下文越来越长、端到端多模态模型越来越强,好像不再需要检索与证据拼装。但真正落地到复杂文档与可溯源场景,你会发现死掉的只是“只切文本的旧RAG”。当图、表、公式与

    阅读全文
  • 文章封面

    百度0.9B小模型碾压GPT-4o!PaddleOCR-VL 如何定义多模态文档理解新范式?

    作者:机智流发布日期:2025-10-19 23:23:44

    引言PaddleOCR-VL 来了!它是百度飞桨团队最新推出的超轻量视觉语言模型(VLM),以仅 0.9 亿参数的紧凑设计,在全球多模态文档解析评测榜 OmniDocBench v1.5 上以 92.

    阅读全文
  • 文章封面

    本周P站更新|支持搜索、上线 ICCV 2025 专区,消耗12 亿Token生成2701篇中英文对照 PDF

    作者:机智流发布日期:2025-10-19 23:23:44

    上新 ICCV 2025 专区,收录 2702 篇 ICCV 论文,并使用科学能力超强的 Intern-S1 生成了 2702 篇「图文并茂」的解读博客以及「中英文」对照的 PDF 翻译。https

    阅读全文
  • 文章封面

    低音炮逆天,REDMI这新机太炸裂了!

    作者:智能Pro发布日期:2025-10-19 22:56:56

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......在文章正式开始之前,我想先问大家一个问题:在挑手机的时候,不知道各位主要会看哪些参数?我相信,绝

    阅读全文
  • 文章封面

    高质量宝藏App!完全免费,再也不怕乱花钱

    作者:智能Pro发布日期:2025-10-19 22:56:56

    哈喽,大家晚上好呀。👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......不知道在座各位平时有没有记账的习惯呢?对于打工人来说,有时候给自己的消费记个

    阅读全文
  • 文章封面

    让生意经营开启“智驾模式”,1688成AI+电商试验田

    作者:智能Pro发布日期:2025-10-19 22:56:56

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2025年,随着“百模大战”的结束,大模型进入落地的深水区,电商则成为AI的黄金场景,Amazo

    阅读全文
  • 文章封面

    移动语义 std::move 和完美转发 std::forward

    作者:AI大模型调参指北笔记发布日期:2025-10-19 21:57:41

    移动语义和完美转发是现代C++中用于提升程序效率的两个重要特性。下面这个表格清晰地展示了它们的主要特点。特性核心目标关键机制主要应用场景移动语义转移资源所有权,避免不必要的深拷贝,提升性能。右值引用

    阅读全文
  • 文章封面

    Andrej Karpathy 2小时访谈:未来十年,没有 AGI,只有 Agent |附:中文版音频

    作者:赛博禅心发布日期:2025-10-19 21:21:56

    看了 Andrej Karpathy 的播客,信息量巨大开篇泼冷水:未来十年没有 AGI,只有 Agent这里说一下,Karpathy 是 OpenAI 早期成员,参与过 GPT 背后的技术路线,在

    阅读全文
  • 文章封面

    AI 不再“乱跑”:LangChain × LangGraph 打造可控多阶段智能流程

    作者:PyTorch研习社发布日期:2025-10-19 18:31:26

    一个使用最新 LangChain + LangGraph APIs 创建多步骤、有状态 LLM 管道的实践指南图片来源:Markus Spiske on Unsplash引言大型语言模型(LLMs)功

    阅读全文
  • 文章封面

    我在 iPhone 17 Pro Max 上跑 AI 模型,体验了一把十年前「越狱」的快乐

    作者:APPSO发布日期:2025-10-19 17:55:00

    「我成功在国行 iPhone 上跑通了 AI 模型!」「然后呢?」「然后就没怎么用过了。」iPhone 17 Pro Max 发布都一个月了,苹果国行 Apple Intelligence 还是遥遥无

    阅读全文
  • 文章封面

    Meta用40万个GPU小时做了一个实验,只为弄清强化学习Scaling Law

    作者:机器之心发布日期:2025-10-19 17:14:23

    机器之心报道编辑:张倩在 LLM 领域,扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子,还有几个关键问题悬而未决:如何 scale?sc

    阅读全文
  • 文章封面

    长上下文窗口、Agent崛起,RAG已死?

    作者:机器之心发布日期:2025-10-19 17:14:23

    机器之心报道机器之心编辑部在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。向量数据库 Chroma 创始人兼

    阅读全文
  • 文章封面

    无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」

    作者:机器之心发布日期:2025-10-19 17:14:23

    本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助理教授。在机器人学习领域,提升基于生成式模型

    阅读全文
  • 文章封面

    Lilian Weng最新对话:首谈离开OpenAI创业,以及AI研究的现实扭曲场

    作者:硅星人Pro发布日期:2025-10-19 14:00:19

    编辑:王兆洋记录:Kyla作为AI领域最有影响力的科学家之一,Thinking Machines 联合创始人、前OpenAI研究副总裁 Lilian Weng 的很多研究方向、研究思考和研究方法对今天

    阅读全文
  • 文章封面

    如果我死了,请不要用 Sora 「复活」我

    作者:硅星人Pro发布日期:2025-10-19 14:00:19

    文章转载于APPSO最近,保时捷最佳销冠,被 AI 恶意伪造视频的事件冲上热搜,她第一时间去报警。但她不是唯一的受害者,被 AI 捏造、恶搞的公众人物名单还在不断延长,甚至延伸到了已经去世的人物。坐在

    阅读全文
上一页下一页