全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    GPT-5.2已上线24小时:差评如潮!

    作者:机器之心发布日期:2025-12-13 12:56:03

    机器之心报道编辑:杨文网友吐槽GPT-5.2「不通人性」。X 上充斥着对 GPT-5.2 的恶评。昨天,OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业

    阅读全文
  • 文章封面

    谢赛宁REPA得到大幅改进,只需不到4行代码

    作者:机器之心发布日期:2025-12-13 12:56:03

    机器之心报道编辑:Panda邹忌曾经有一个问题:吾与徐公孰美?而对于 REPA,也有一个类似的问题:全局信息与空间结构,哪个对表征对齐更重要?表征对齐(REPA)可通过将强大的预训练视觉编码器的表征蒸

    阅读全文
  • 文章封面

    AAAI 2026 Oral | 拒绝「一刀切」!AdaMCoT:让大模型学会「看题下菜碟」,动态选择最佳思考语言

    作者:机器之心发布日期:2025-12-13 12:56:03

    多语言大模型(MLLM)在面对多语言任务时,往往面临一个选择难题:是用原来的语言直接回答,还是翻译成高资源语言去推理?实际上,不同的语言在模型内部承载着不同的「特长」。比如英语可能逻辑性强,适合科学推

    阅读全文
  • 文章封面

    全球强化学习+VLA范式,PI*0.6背后都有这家中国公司技术伏笔

    作者:机器之心发布日期:2025-12-12 11:20:44

    机器之心发布机器之心编辑部在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源:其中有我们熟悉的 Yuke Zhu 的研究,也有

    阅读全文
  • 文章封面

    Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

    作者:机器之心发布日期:2025-12-12 11:20:44

    机器之心报道编辑:+0随着扎克伯格将公司战略重心从「元宇宙」全面转向人工智能,公司内部正面临多重挑战。据《纽约时报》报道,Meta 新组建的顶尖 AI 团队与公司原有的核心业务部门之间,在资源分配、发

    阅读全文
  • 文章封面

    NUS LV Lab新作|FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈

    作者:机器之心发布日期:2025-12-12 11:20:44

    尹博:NUS 计算机工程硕士生、LV Lab 实习生,研究方向是生成式 AI,及参数高效率微调(PEFT)。胡晓彬:NUS LV Lab Senior Research Fellow, 研究方向是生成

    阅读全文
  • 文章封面

    大模型的第一性原理:(一)统计物理篇

    作者:机器之心发布日期:2025-12-11 17:57:09

    机器之心发布作者:白铂 博士白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家2022 年底,ChatGPT 横空出世,其能力震惊了整个世界。2024 年底,DeepSeek 以极低

    阅读全文
  • 文章封面

    何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

    作者:机器之心发布日期:2025-12-11 17:57:09

    机器之心报道机器之心编辑部不久前,NeurIPS 2025 顺利举办,作为人工智能学术界的顶级会议之一,其中不乏学术界大佬的工作和演讲。有一项荣誉的颁发显得格外厚重且众望所归 —— 由任少卿、何恺明、

    阅读全文
  • 文章封面

    效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决

    作者:机器之心发布日期:2025-12-11 17:57:09

    实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜

    阅读全文
  • 文章封面

    一手实测 | 智谱AutoGLM重磅开源: AI手机的「安卓时刻」正式到来

    作者:机器之心发布日期:2025-12-10 13:07:30

    机器之心报道编辑:冷猫、Panda「安静!吵到我用 TNT 了!」长期关注科技圈的朋友们都知道,罗永浩的锤子科技落幕已经七年。七年间,仍有无数锤科粉丝保留着旧手机备用,怀念手机圈当年的「锐利异类」,以

    阅读全文
  • 文章封面

    Mistral再开源!发布代码模型Devstral 2及原生CLI,但大公司被限制商用

    作者:机器之心发布日期:2025-12-10 13:07:30

    机器之心报道编辑:Panda刚刚,「欧洲的 DeepSeek」Mistral AI 再次开源,发布了其下一代代码模型系列:Devstral 2。该系列开源模型包含两个尺寸:Devstral 2 (12

    阅读全文
  • 文章封面

    告别专家依赖,让机器人学会自我参考,仅需200步性能飙升至99.2%

    作者:机器之心发布日期:2025-12-10 13:07:30

    费森俞,上海创智学院 & 同济大学博士一年级学生,导师赵宪忠教授,研究方向为 VLA 强化学习后训练。王思尹,上海创智学院 & 复旦大学博士二年级学生,导师邱锡鹏教授,研究方向为多模态具身智能。为本文

    阅读全文
  • 文章封面

    没了遥控器,还被扔进荒野,具身智能该「断奶」了

    作者:机器之心发布日期:2025-12-09 11:14:45

    机器之心原创作者:吴昕翻车是真的,希望也是真的。香港中文大学的一处山间小道,流水小桥,树影斑驳,青苔攀附在陡峭连绵的石梯上。无人机视野下500 米的定向越野路线。一只人形机器人跨过三十度的小桥,走上一

    阅读全文
  • 文章封面

    刚上市的摩尔线程,即将揭晓新一代GPU架构

    作者:机器之心发布日期:2025-12-09 11:14:45

    机器之心发布机器之心编辑部2025 年 12 月 19 日至 20 日,摩尔线程首届 MUSA 开发者大会(MUSA Developer Conference,简称 MDC 2025)将在北京中关村国

    阅读全文
  • 文章封面

    全图与切片并非等价?LLaVA-UHD-v3揭示差异推出高效全图建模方案

    作者:机器之心发布日期:2025-12-09 11:14:45

    随着多模态大模型(MLLMs)在各类视觉语言任务中展现出强大的理解与交互能力,如何高效地处理原生高分辨率图像以捕捉精细的视觉信息,已成为提升模型性能的关键方向。然而,主流的视觉编码范式往往难以兼顾性能

    阅读全文
  • 文章封面

    Snapchat提出Canvas-to-Image:一张画布集成 ID、姿态与布局

    作者:机器之心发布日期:2025-12-09 11:14:45

    Canvas-to-Image 是一个面向组合式图像创作的全新框架。它取消了传统「分散控制」的流程,将身份参考图、空间布局、姿态线稿等不同类型的控制信息全部整合在同一个画布中。用户在画布上放置或绘制的

    阅读全文
  • 文章封面

    ICLR 2026还会好吗?300篇投稿50篇含幻觉,引用example.com竟也能过审

    作者:机器之心发布日期:2025-12-08 18:08:36

    机器之心报道编辑:杜伟、Panda这届 ICLR 的烦心事还没有结束。最近一段时间,对于 ICLR 2026 来说,真可谓是一波未平、一波又起。先是第三方机构对审稿意见的系统性统计发现,其中有 21%

    阅读全文
  • 文章封面

    斯坦福最火CS课:不让学生写代码,必须用AI

    作者:机器之心发布日期:2025-12-08 18:08:36

    机器之心报道编辑:泽南、陈陈「0 代码」计算机课在教啥东西?这就是现代的软件开发吗?谁也想不到,斯坦福大学计算机系今年最热门的课程,居然明牌不鼓励你写代码。近日,斯坦福大学新开设的课程《现代软件开发者

    阅读全文
  • 文章封面

    AAAI 2026 Oral | 手机传感器正在泄露隐私?PATN实时守护隐私安全

    作者:机器之心发布日期:2025-12-08 18:08:36

    本文的作者分别来自西安交通大学和东京科学大学。第一作者宋天乐是来自西安交通大学的博士生,研究方向聚焦于人机交互行为安全,生物特征识别,隐私保护。通讯作者为西安交通大学蔺琛皓教授。移动应用通过 Andr

    阅读全文
  • 文章封面

    LLM强化学习不稳定之谜,被Qwen团队从「一阶近似」视角解开

    作者:机器之心发布日期:2025-12-07 12:30:48

    机器之心报道机器之心编辑部如今,强化学习(RL)已成为提升大语言模型(LLM)复杂推理与解题能力的关键技术范式,而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性,LLM 的

    阅读全文
  • 文章封面

    百万人围观的「萌娃教训小狗」视频火了,结果都是AI生成的|附教程

    作者:机器之心发布日期:2025-12-07 12:30:48

    机器之心报道编辑:杨文人类总是对可爱的小东西毫无抵抗力。最近社交平台冒出一堆萌娃与「汪星人」温馨互动的视频,简直把人萌化。不夸张地说,每一帧都精准击中老夫那颗尘封已久、半死不活的心。有小孩一本正经教训

    阅读全文
  • 文章封面

    DeepSeek、Gemini谁更能提供情感支持?趣丸×北大来了波情绪轨迹动态评估

    作者:机器之心发布日期:2025-12-07 12:30:48

    近日,由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《Detecting Emotional Dynamic Trajectories: An Evaluation Framework for

    阅读全文
  • 文章封面

    刚刚,英伟达CUDA迎来史上最大更新!

    作者:机器之心发布日期:2025-12-06 12:00:00

    机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最

    阅读全文
  • 文章封面

    Yann LeCun离开Meta后首篇论文?使用了宇树机器人做研究

    作者:机器之心发布日期:2025-12-06 12:00:00

    机器之心报道编辑:Panda还记得《黑客帝国》里 Neo 通过脑机接口瞬间学会功夫的场景吗?现在,机器人离这一天也不远了。想象一下,你只需在电脑上输入一句提示词:「一个人在打太极」,AI 视频模型(比

    阅读全文
  • 文章封面

    AAAI 2026|新突破:北大彭宇新团队提出可见光-红外终身行人重识别方法CKDA

    作者:机器之心发布日期:2025-12-06 12:00:00

    终身行人重识别旨在持续学习新增数据中不断涌现的新增行人鉴别性信息,同时保持对已知数据的识别能力,在公共安防、社区管理、运动分析等场景中具有重要的研究和应用价值。随着白天可见光图像和夜晚红外图像被不断采

    阅读全文
  • 文章封面

    字节前技术负责人创业,联手清华姚班校友,编程智能体世界登顶

    作者:机器之心发布日期:2025-12-05 12:03:08

    机器之心报道机器之心编辑部InfCode 正在定义 AI 编程的「工程时代」。自「造词大神」Andrej Karpathy 提出「Vibe Coding」这个概念后,它的热度就居高不下。只需一句提示词

    阅读全文
  • 文章封面

    基于文本AI的终结?Agent协作可直接「复制思维」,Token效率暴涨

    作者:机器之心发布日期:2025-12-05 12:03:08

    机器之心报道编辑:陈陈在 Agentic AI 时代,模型不再是独来独往的学霸,而是开始学会组队、一起想问题。多智能体系统(MAS,multi-agent systems)的发展让 AI 世界从一个人

    阅读全文
  • 文章封面

    首帧的真正秘密被揭开了:视频生成模型竟然把它当成「记忆体」

    作者:机器之心发布日期:2025-12-05 12:03:08

    在 Text-to-Video / Image-to-Video 技术突飞猛进的今天,我们已经习惯了这样一个常识:视频生成的第一帧(First Frame)只是时间轴的起点,是后续动画的起始画面。但你

    阅读全文
  • 文章封面

    刚刚,云计算一哥出手,大家AI Agent自由了

    作者:机器之心发布日期:2025-12-04 14:07:11

    机器之心报道编辑:泽南、陈陈最先进的 Agentic AI,现在是做什么工作的?在搞太空探索。上个月,蓝色起源「新格伦」重型运载火箭首次成功实现了一级回收,在与 SpaceX 的竞争中迈出了重要一步。

    阅读全文
  • 文章封面

    从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

    作者:机器之心发布日期:2025-12-04 14:07:11

    机器之心报道编辑:杜伟、+0昨日,有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、

    阅读全文
下一页