CVPR 2025 | 打破壁垒!多模态统一学习新范式来了,数据、模型、代码全开源
我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。过去大量的工作主要
阅读全文我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。过去大量的工作主要
阅读全文在 2015 年的计算机视觉领域顶会 ICCV 中,HD-CNN(Hierarchical Deep Convolutional Neural Networks)模型横空出世,在当时极具挑战性的 Im
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!清华大学信息国家研究中心清华大学北京信息科学与技术国家研究中心(简称:清华大学
阅读全文衡宇 时令 发自 凹非寺量子位 | 公众号 QbitAI16岁的天才小孩哥挥一挥衣袖,宣布从SpaceX离职了。2年前,14岁的Kairan Quazi从圣克拉拉大学毕业,被马斯克pick,加入入职成
阅读全文梦晨 发自 凹非寺量子位 | 公众号 QbitAI谷歌生成式AI团队创始成员竟然劝退AI博士?Jad Tarifi,这位在谷歌待了近十年、参与创立了谷歌第一个生成式AI团队的大佬,最近直接开炮:别为了
阅读全文不圆 发自 凹非寺量子位 | 公众号 QbitAI小模型也开始卷起来了!在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行
阅读全文CombatVLA团队 投稿量子位 | 公众号 QbitAI3B多模态大模型在动作角色扮演游戏的战斗任务中,成功率超越GPT-4o和人类玩家,淘天集团未来生活实验室团队提出了CombatVLA,已被I
阅读全文新智元报道 编辑:桃子 倾倾【新智元导读】GPT-5发布半月,却被连连吐槽。如今,一张基准与GPT-4对比基准测试图,证明了Scaling Law没有撞墙。七年间,从GPT-1到GPT-5十四个
阅读全文新智元报道 编辑:定慧【新智元导读】前OpenAI研究员Kevin Lu加盟由前OpenAI CTO Mira Murati创立的Thinking Machines Lab。公司2025年7月获
阅读全文新智元报道 编辑:peter东 英智【新智元导读】究竟哪些职业,更容易受到AI影响?基于20万微软Copilot使用数据,近日的一项研究指出,AI能够支持许多涉及研究、写作和沟通的任务,但这并不
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。2025年9月7日,新
阅读全文看到OpenAI的Tibo(@thsottiaux)说Codex CLI现在已经支持ChatGPT账号登录,并且Plus和Pro订阅用户可以直接在命令行里使用GPT-5.Codex 的安装命令如下:$
阅读全文这是一个 AI 的季节空气里都是 Token 的味道孤独的 AI 创造者是可耻的这是一个 AI 的季节创造者应该互相拥抱打气加油 这样就好我喜欢创造 城市里应该有创造即使被人无视 创造力也应该长出来9
阅读全文作者|董道力邮箱|dongdaoli@pingwest.com这几年,中国人的餐桌革命始于二维码:点菜、付款、好评——一切都被浓缩进那一方黑白方块。但在今年的 WAIC 2025(世界人工智能大会)上
阅读全文文章转载于直面AIGPT-5正式发布,虽然在测试集上登顶,但用户反馈却褒贬不一,不少用户希望能保留GPT-4o。OpenAI希望通过增加模型路由功能,来达到以不同模型,不同算力成本满足不同用户需求的目
阅读全文📖 预计阅读:18-22分钟 | ⭐⭐⭐⭐ 难度等级 | 🎯 目标读者:后端开发者、系统架构师、DevOps工程师🔍 前置知识: API调用机制、函数编程基础、系统安全概念当工具链安全成为AI开发的
阅读全文这是 OpenAI 官方出品的 GPT-5 提示词指南:《GPT-5 Prompting Guide》。看完之后,我最大的感受是,AI 模型已经不只是一个“问答工具”,更像是一个能主动思考、能自己执行
阅读全文机器之心报道作者:泽南、杨文国产开源版 Genie 3 问世,昆仑万维用 1.8B 模型跑出了神级效果。世界模型,正在迎来一次技术大突破。本月初,Google DeepMind 发布的 Genie 3
阅读全文机器之心报道编辑:杜伟、杨文现在,AI看你画的就能懂。Higgsfield AI 这家公司,有点意思。不仅三天两头上线新功能,在 X 上疯狂刷存在感,还一度被传出和 Meta 洽谈收购事宜,虽然最后不
阅读全文刘锋林,中科院计算所泛在计算系统研究中心博士研究生(导师:高林研究员),研究方向为计算机图形学与生成式人工智能,在ACM SIGGRAPH\TOG,IEEE TPAMI,IEEE TVCG,IEEE
阅读全文在大模型智能体(Agent)时代,最重要的技术之一就是通过智能体强化学习(Agentic RL)训练通用智能体。ASearcher 是 AReaL 团队的第一个 Agentic RL 项目,基于 AR
阅读全文🚗特斯拉 Model Y L 价格公布:33.9 万元起❗️OpenAI CEO:我们开源是因为 DeepSeek📈机构:华为重夺中国手机市场榜首👓Meta 带屏智能眼镜有望 800 美元起售🔍小米卢
阅读全文点击👇🏻可关注,文章来自🙋♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在AI驱动的软件维护中,真正的突破不在于更强大的模型,而在于构建能够从历史中学习的"记忆"。SWE-Exp通过四阶段经验
阅读全文我们很⾼兴推出 Qwen-Image-Edit,Qwen-Image的图像编辑版本。Qwen-Image-Edit基于我们20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......当地时间8月12日,AI初创企业Perplexity向谷歌母公司Alphabet发起收购要约,拟
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......在日常的生活与工作里,我们时常会因各种需求而四处搜寻资源网站,但通过百度找到的结果,常常不尽如人
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......蒙头狂飙五年后,比亚迪的战略重心开始悄然转向。8月14日,郑州航空港区,比亚迪全地形赛车场正式开
阅读全文本文是AI前端小课从零到全栈系列的第8篇。大多数人使用AI生成都是使用黑盒方式,用自然语言随便聊,只丢一句模糊的指令,然后等待随机结果。真正高效方式用的是“白盒方式” ,真正理解 AI 背后的工作逻辑
阅读全文当500个AI被放进一个社交平台,它们会做什么?答案是:抱团、站队、打群架。最近,阿姆斯特丹大学的研究人员做了一个有趣的实验:他们创建了一个极简的社交平台,没有广告,没有算法推荐,只有最基本的发帖、转
阅读全文