轻量高效,即插即用:Video-RAG为长视频理解带来新范式
尽管视觉语言模型(LVLMs)在图像与短视频理解中已取得显著进展,但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一
阅读全文尽管视觉语言模型(LVLMs)在图像与短视频理解中已取得显著进展,但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一
阅读全文Claude Skills到底是什么?和MCP、RAG、FunctionCaling的本质区别是? 一个暴论:AI Agent的未来,一半靠模型,另一半靠工程。 A社这次不止增加了这个概念,还开源
阅读全文全球AI发展两年多,人们逐渐认识到了一个现实:模型的机会只属于大厂,而创业公司最终拿走了AI应用的机会。一个数据印证了这一趋势:在AI产品榜全球Top50中,34个国外应用里仅有5个出自“大厂”。但到
阅读全文Codex 和 Claude Code,用哪个呢?当然是:全!都!要!本文 90% 是我用嘴写的(语音输入),当作周末做的一个小东西的整理,属于想到哪儿说到哪儿,硬凑了 10 点,如下:一、如果有条件
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!百度用一个仅0.9B参数的
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!Meta最新的SAM 3,让分割模
阅读全文为助力开发者深入理解 Vibe Coding 核心逻辑,高效掌握其在实际场景中的应用方法,10 月 25 日,由AIGC开放社区主办的「Vibe Coding—AI Code 线下沙龙」将在上海云赛空
阅读全文作者|郭海惟邮箱|guohaiwei@pingwest.com作者|黄小艺邮箱|huangxiaoyi@pingwest.com10月13日,华为正式发布了中译版的宣传片《Now is Yours》。
阅读全文1当 IROS 主会散场,机器人还不肯睡——2025年10月19日—10月25日,IEEE/RSJ 国际智能机器人与系统大会(IROS 2025)将在中国杭州举行。这是时隔 19 年 IROS 再回中
阅读全文🍎iPhone 17 Pro 机身褪色上热搜,触屏版 MacBook Pro 再曝光💎法国罗浮宫被盗过程仅 7 分钟💻苹果 CEO:Apple Intelligence 正努力入华🔍接替王腾,魏思琪新
阅读全文点击👇🏻可关注,文章来自🙋♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 可灵UniVideo突破性地将统一多模态模型扩展至视频领域,通过双流架构实现理解、生成与编辑的无缝融合。本文介绍其技术原
阅读全文打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://imlixinyang.github.io/FlashWorld-Project-Page/样
阅读全文一文带你认识最新的谷歌 AI Studio。上周,几乎被 Logan Kilpatrick 刷屏了。这位前 OpenAI 开发者关系负责人,去年 4 月跳槽到谷歌担任 AI Studio 产品负责人。
阅读全文每隔一阵子,总有人宣告“RAG已死”:上下文越来越长、端到端多模态模型越来越强,好像不再需要检索与证据拼装。但真正落地到复杂文档与可溯源场景,你会发现死掉的只是“只切文本的旧RAG”。当图、表、公式与
阅读全文引言PaddleOCR-VL 来了!它是百度飞桨团队最新推出的超轻量视觉语言模型(VLM),以仅 0.9 亿参数的紧凑设计,在全球多模态文档解析评测榜 OmniDocBench v1.5 上以 92.
阅读全文上新 ICCV 2025 专区,收录 2702 篇 ICCV 论文,并使用科学能力超强的 Intern-S1 生成了 2702 篇「图文并茂」的解读博客以及「中英文」对照的 PDF 翻译。https
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......在文章正式开始之前,我想先问大家一个问题:在挑手机的时候,不知道各位主要会看哪些参数?我相信,绝
阅读全文哈喽,大家晚上好呀。👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......不知道在座各位平时有没有记账的习惯呢?对于打工人来说,有时候给自己的消费记个
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2025年,随着“百模大战”的结束,大模型进入落地的深水区,电商则成为AI的黄金场景,Amazo
阅读全文移动语义和完美转发是现代C++中用于提升程序效率的两个重要特性。下面这个表格清晰地展示了它们的主要特点。特性核心目标关键机制主要应用场景移动语义转移资源所有权,避免不必要的深拷贝,提升性能。右值引用
阅读全文看了 Andrej Karpathy 的播客,信息量巨大开篇泼冷水:未来十年没有 AGI,只有 Agent这里说一下,Karpathy 是 OpenAI 早期成员,参与过 GPT 背后的技术路线,在
阅读全文一个使用最新 LangChain + LangGraph APIs 创建多步骤、有状态 LLM 管道的实践指南图片来源:Markus Spiske on Unsplash引言大型语言模型(LLMs)功
阅读全文「我成功在国行 iPhone 上跑通了 AI 模型!」「然后呢?」「然后就没怎么用过了。」iPhone 17 Pro Max 发布都一个月了,苹果国行 Apple Intelligence 还是遥遥无
阅读全文机器之心报道编辑:张倩在 LLM 领域,扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子,还有几个关键问题悬而未决:如何 scale?sc
阅读全文机器之心报道机器之心编辑部在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。向量数据库 Chroma 创始人兼
阅读全文本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助理教授。在机器人学习领域,提升基于生成式模型
阅读全文编辑:王兆洋记录:Kyla作为AI领域最有影响力的科学家之一,Thinking Machines 联合创始人、前OpenAI研究副总裁 Lilian Weng 的很多研究方向、研究思考和研究方法对今天
阅读全文文章转载于APPSO最近,保时捷最佳销冠,被 AI 恶意伪造视频的事件冲上热搜,她第一时间去报警。但她不是唯一的受害者,被 AI 捏造、恶搞的公众人物名单还在不断延长,甚至延伸到了已经去世的人物。坐在
阅读全文