美国视频生成老炮儿,入局世界模型
鹭羽 发自 凹非寺量子位 | 公众号 QbitAI世界模型赛道,又有老面孔新鲜入局!就在刚刚,Runway发布旗下首个通用世界模型GWM-1。不止于此,还打包发布了一系列世界模型变体:模拟真实环境的G
阅读全文鹭羽 发自 凹非寺量子位 | 公众号 QbitAI世界模型赛道,又有老面孔新鲜入局!就在刚刚,Runway发布旗下首个通用世界模型GWM-1。不止于此,还打包发布了一系列世界模型变体:模拟真实环境的G
阅读全文AEOS-Bench&AEOS-Former团队 投稿 量子位 | 公众号 QbitAI将卫星星座送入轨道我们都知道很难,但高效规划调度在轨卫星星座执行任务也不简单。随着部署的星座规模越来越大,通过人
阅读全文就在最近,豆包上新了图像创作模型 Doubao-Seedream-4.5(以下简称 Seedream 4.5)。猜猜下面两张图片,哪张是 Seedream 4.5 生成的?哪张是最近风头正盛的 Nan
阅读全文作者|李楠邮箱|linan@pingwest.com半年前如果有人说迪士尼会向OpenAI敞开怀抱,大概会被当作笑话。这家公司在版权保护上的强硬态度,世界闻名。自1990年以来,迪士尼一直在游说延长版
阅读全文在大模型圈,有几家名字人人都知道:OpenAI、Google DeepMind、Anthropic。但在这些名字背后,还有一家几乎不做 PR、从不上头条的公司——Surge AI。不到四年时间,这家公
阅读全文文|敏行作者|张敏编辑|李程程本文首发于钛媒体APPSpaceX真的要IPO了!而这一次,埃隆·马斯克(Elon Musk)不再抵触。12月11日,美国科技新闻网站Ars Technica的资深太空编
阅读全文Sora Android版上线首日就登顶Play Store,24小时内生成了百万级视频。最近OpenAI的一篇博客详情的记录了开发过程和心得。https://link.bytenote.net/zW
阅读全文📆《时代》年度人物公布,封面模仿经典影像被骂惨💬「微信群崩了」冲上热搜,官方回复📱iOS 26.2 正式版推送:锁屏字体 Liquid Glass 透明度可调,隔空投送验证码上线🌚小米回应「不让卖小米
阅读全文“Talk is cheap. Show me the code.” — Linus Torvalds在 AI 时代,这句话比以往任何时候都更真实。最近几个月,“Agentic AI” 成为行业热词。
阅读全文在技术领域,总有那么一刻会让人感觉有点“太魔法”了。这就是其中之一。Postman 悄悄发布了一个 AI Agent Builder,让你把超过 100,000 个可用的任意 API 转成可用的 MC
阅读全文别再眼红谷歌那一套了。事实证明,国产厂商还是热衷于打团战。12月9日,中科曙光与海光信息双双宣布终止重大资产重组。“两光”放弃延续近半年的“算力航母”概念,不约而同选择了All in开放计算生态。一个
阅读全文深入做UMI之后,我见识到了管理之难。作者丨高景辉编辑丨马晓宁数据采集,向来是具身智能行业的一大难题。成本、精度、泛化能力,似乎构成一个不可能三角,能找到一个可以落地的平衡点已十分不易。在此背景下,2
阅读全文昨晚我们刚说到Cursor提前泄露GPT-5.2,今天(当地时间12月11号)OpenAI就正式放出了这款被定位为“迄今最强专业知识工作模型”的新系统GPT-5.2[1],已全面向ChatGPT订阅用
阅读全文在 C++17 及更高版本中,[[nodiscard]] 是一个编译器属性,用于标记不应被忽略的函数返回值、类或枚举类型。其核心作用是提升代码健壮性,避免因忽略关键返回值导致的逻辑错误或资源泄漏。以
阅读全文一个模型不够用?那就加两个!多搞几个Agent(智能体)让它们自己开会讨论,效果肯定好。这种“智能体越多越好”的直觉,似乎成了当下的行业共识。甚至有论文曾宣称“More agents is all y
阅读全文今天我们正式发布 Jina-VLM,这是一款 2.4B 参数量的视觉语言模型(VLM),在同等规模下达到了多语言视觉问答(Multilingual VQA)任务上的 SOTA 基准。面对小参数量 VL
阅读全文文|飞向TAI空作者|胡珈萌编辑|李程程本文首发于钛媒体APP“我从未像现在这样对我们的研发和产品路线图,以及实现我们使命的整体方向感到如此乐观。”12月12日,在正式上线GPT-5.2的同时,Ope
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:冬日果酱 | 监制:罗超最近封禁「豆包手机」(nubia M53)的 App 名单越拉越长
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2025年即将结束,这一年关于汽车行业有很多关键词,其中之一就是“自动驾驶踩刹车”。今年春天,工
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......现在办公软件五花八门,作为资深打工人的小编,可用过不少。什么钉钉、企业微信、飞书啊,都格外熟悉。
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......如果你是闲鱼的老用户,估计会觉得这个平台变得挺“陌生”的,自从AI托管、AI帮卖等功能上线后,已
阅读全文亨利 发自 凹非寺量子位 | 公众号 QbitAI崇“洋”媚外这一块,也是轮到美国网友了!最近,一篇“中国机器人在比火场救人,美国机器狗还在给扎克伯格套脸?”的帖子被顶上了Reddit热门。这位发帖的
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI天下果然没有免费的午餐!为了让“米老鼠”加入Sora,OpenAI刚刚正式官宣与迪士尼达成合作。协议内容之一即为,OpenAI需向迪士尼出售价值10亿
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI拥有一台AI手机,竟能如此简单。这个AI手机,正是最近全面开源的、能让手机自己动起来的AutoGLM。先来看下效果:帮我在美团上点一杯冰豆花。只需要简
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAIOpenAI强势更新,谷歌也没闲着。正式发布增强版的Gemini Deep Research,基于Gemini 3 Pro构建,专门减少幻觉,在复杂信
阅读全文180 万小时、44k 高保真、支持全量微调——刚刚开源的 VoxCPM 1.5,技术细节全解密。最近,面壁技术团队发布了 VoxCPM 1.5 版本,在持续优化开发者开发体验的同时,也带来了多项核心
阅读全文以 CLIP 为代表的视觉语言模型(VLM)在大规模图文数据上进行了预训练,具备强大的通用视觉识别能力。然而,在细粒度识别任务上,VLM 往往难以区分相近类别之间的细微差异,识别能力显著下降。以 CL
阅读全文