全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」

    作者:机器之心发布日期:2026-01-24 12:02:47

    机器之心编辑部自从图灵奖得主 Yann LeCun 离开 Meta 创立 AMI Labs(Advanced Machine Intelligence) 以来,这家新公司便引发了业界的高度关注。本周,

    阅读全文
  • 文章封面

    挑战Claude Code?OpenAI Codex发布月将至,今先揭秘智能体循环

    作者:机器之心发布日期:2026-01-24 12:02:47

    编辑|Panda刚刚,OpenAI CEO 山姆・奥特曼发了一条推文:「从下周开始的接下来一个月,我们将会发布很多与 Codex 相关的激动人心的东西。」他尤其强调了网络安全这个主题。当然,和奥特曼的

    阅读全文
  • 文章封面

    不止于Prompt:揭秘「神经网络可重编程性」

    作者:机器之心发布日期:2026-01-24 12:02:47

    从模型重编程(Model Reprogramming),到参数高效微调(PEFT),再到当下大模型时代的 Prompt Tuning ,Prompt Instruction 和 In-context

    阅读全文
  • 文章封面

    OpenAI:以后大家用AI赚的钱,我可能要抽成

    作者:机器之心发布日期:2026-01-23 16:26:06

    编辑|杜伟、泽南今天一早,OpenAI CEO 奥特曼就发推晒收入,「仅我们的 API 业务而言,上个月就增加了超过 10 亿美元的 ARR(年度经常性收入)。」他继续说到,大多数人只看到了 Chat

    阅读全文
  • 文章封面

    陈天奇、贾扬清点赞:Vibe Coding版PyTorch,连论文都是AI写的

    作者:机器之心发布日期:2026-01-23 16:26:06

    编辑|Panda、泽南前两天,Node.js 之父 Ryan Dahl 在 X 上断言:「人类编写代码的时代已经结束了。」该帖引发广泛讨论,浏览量更是已经超过了 700 万。而现在,我们迎来了一个对这

    阅读全文
  • 文章封面

    思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

    作者:机器之心发布日期:2026-01-23 16:26:06

    在 LLM 时代,思维链( CoT)已成为解锁模型复杂推理能力的关键钥匙。然而,CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用,严重制约了模型的推理效率。为

    阅读全文
  • 文章封面

    幻觉率不到3%,王小川把医生版的DeepSeek免费了

    作者:机器之心发布日期:2026-01-22 18:57:27

    编辑|泽南在医疗健康这一容错率极低的领域,大模型不再凭空「想象」,而是已变得严谨可靠、能引会搜:百川刚刚推出的新模型,实现了一个里程碑式的突破。本周四,百川智能正式发布新一代大模型 Baichuan-

    阅读全文
  • 文章封面

    清华姚班校友刘壮团队再发力,无需归一化的Transformer性能进化

    作者:机器之心发布日期:2026-01-22 18:57:27

    编辑|陈陈、冷猫刘壮带队的无需归一化 Transformer 又有新的版本了。一直以来,在 Transformer 架构里,LayerNorm 几乎是标配,但它也有明显问题:比如计算和访存成本高,尤其

    阅读全文
  • 文章封面

    苹果入局AI Pin,或对标OpenAI,能否打破「电子垃圾」魔咒?

    作者:机器之心发布日期:2026-01-22 18:57:27

    机器之心编辑部近日,有消息传出,苹果正在研发一款由 AI 驱动的可穿戴「胸针」(Pin)设备,不过目前该设备仍处于早期研发阶段,最快可能也要在 2027 年才能面世。据知情人透露,该设备体积与 Air

    阅读全文
  • 文章封面

    京东「再造」京东

    作者:机器之心发布日期:2026-01-21 17:30:00

    编辑|微胖这,很不京东 要不是 App Logo 上那只举着魔法棒的小狗先「剧透」,你很难把它和京东联系在一起。点开「京东AI 购」,反直觉几乎是瞬间发生。没有信息洪流扑面而来,也看不到叠床架屋的功能

    阅读全文
  • 文章封面

    非Transformer架构的新突破,液态神经网络的推理小模型只用900M内存

    作者:机器之心发布日期:2026-01-21 17:30:00

    编辑|冷猫谷歌 2017 年提出的 Transformer 架构事实上已经基本垄断了大模型。不采用 Transformer 架构的大模型已经是少之又少,而采用非 Transformer 架构,还能与主

    阅读全文
  • 文章封面

    AI for Science开年新突破:中科大实现多尺度结构逆向设计128倍加速,登上Nature子刊

    作者:机器之心发布日期:2026-01-21 17:30:00

    近日,中国科学技术大学(USTC)联合新疆师范大学、中关村人工智能研究院、香港理工大学,在数据驱动的多功能双连通多尺度结构逆向设计领域取得重要突破。相关成果于 2026 年 1 月 8 日以 “Dat

    阅读全文
  • 文章封面

    击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了

    作者:机器之心发布日期:2026-01-20 18:16:01

    编辑|泽南、杜伟在语音大模型赛道上,GPT-4o、Gemini 的能力遥遥领先。近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Di

    阅读全文
  • 文章封面

    当黄仁勋将存储定义为「AI运行内存」,基础设施该如何实现物种进化?

    作者:机器之心发布日期:2026-01-20 18:16:01

    编辑|Panda一根 256 GB 内存条标价 5000 美元?这个价格已经轻松超过了英伟达顶配显卡 RTX 5090 的市场溢价。此推文引发了广泛讨论,已收获超 200 万浏览,图源:X@Yuche

    阅读全文
  • 文章封面

    从平面几何出发:形式化验证如何驱动MLLM的推理能力跃迁

    作者:机器之心发布日期:2026-01-20 18:16:01

    在迈向通用人工智能(AGI)的征途中,多模态大语言模型(MLLMs)虽然在视觉理解与文本生成上展现了惊人的能力,却始终面临一道难以逾越的鸿沟:如何在复杂的数学与几何推理中,克服固有的幻觉与逻辑断层?

    阅读全文
  • 文章封面

    租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂

    作者:机器之心发布日期:2026-01-19 16:49:57

    机器之心编译元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用

    阅读全文
  • 文章封面

    评审用不用AI,作者说了算?ICML 2026全新评审政策出炉

    作者:机器之心发布日期:2026-01-19 16:49:57

    机器之心编辑部开始前,温馨提醒一下各位投稿 ICML 2026 的小伙伴们,投稿已于 1 月 8 日开放,也请大家注意投稿截止时间:摘要提交截止日期:2026 年 1 月 23 日。全文提交截止日期:

    阅读全文
  • 文章封面

    机器人终于「懂」家务了!伯克利MomaGraph让机器人像人一样做家务

    作者:机器之心发布日期:2026-01-19 16:49:57

    想象这样一个日常画面:你吩咐家用机器人「烧壶开水」,它却当场卡壳——水壶在哪?该接自来水还是过滤水?先插电还是先按开关?水开了又该如何判断?这些对人类而言像呼吸一样自然的家务,对过去的机器人却是大大的

    阅读全文
  • 文章封面

    谷歌工程师抛出5个残酷问题:未来两年,软件工程还剩下什么?

    作者:机器之心发布日期:2026-01-18 12:00:00

    机器之心编译软件行业正站在一个颇为微妙的拐点上。AI 已经从自动补全代码,演进为能够自主执行开发任务的智能体。在这一变化之下,初级开发者和高级开发者正同时被推入各自不同、却同样棘手的困境之中。对初级开

    阅读全文
  • 文章封面

    红杉合伙人:2026,AGI已经来了

    作者:机器之心发布日期:2026-01-18 12:00:00

    机器之心编辑部我们常问:AGI 什么时候到来?你有没有想过,可能它已经来了。最近,红杉资本合伙人 Pat Grady、Sonya Huang 联合发表了一篇博客,指出 AGI 已经到来,就在此刻。在他

    阅读全文
  • 文章封面

    VerseCrafter:给视频世界模型装上4D方向盘,精准运镜控物

    作者:机器之心发布日期:2026-01-18 12:00:00

    视频世界模型领域又迎来了新的突破!复旦大学与腾讯 PCG ARC Lab 等机构的研究者们提出了 VerseCrafter,这是一个通过显式 4D 几何控制(4D Geometric Control)

    阅读全文
  • 文章封面

    贴广告的ChatGPT,一夜之间让全球网友破了防

    作者:机器之心发布日期:2026-01-17 11:06:20

    编辑|泽南、杨文这一天终于还是来了。周六凌晨,OpenAI 的一则公告引起轩然大波:他们计划在 ChatGPT 里加广告了。对此,网友们感到很受伤。有人表示,现在大家用大模型的一个重要原因就是能够避免

    阅读全文
  • 文章封面

    开源8300小时标注数据,新一代实时通用游戏AI Pixel2Play发布

    作者:机器之心发布日期:2026-01-17 11:06:20

    随着人工智能在代码以及图片生成方面日益成熟,越来越多的研究人员也开始关注 AI 模型在游戏领域中的表现。实际上,游戏在 AI 的发展早期就已经是一个重要的研究方向,许多前期研究聚焦在 Atari,星际

    阅读全文
  • 文章封面

    大模型听懂语音却反而变笨?港中深与微软联合解决语音大模型降智问题

    作者:机器之心发布日期:2026-01-17 11:06:20

    从 GPT-4o 开启全能(Omni)交互时代至今,Speech LLM 虽然在拟人化和低延迟上取得了长足进步,但面临一个令人困扰的现象:当大语言模型(LLM)被赋予 “听觉” 后,它的智商下降了。即

    阅读全文
  • 文章封面

    美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?

    作者:机器之心发布日期:2026-01-16 13:06:21

    编辑|Panda、杨文临近春节,各家 AI 厂商进入冲刺阶段,纷纷亮出最新大模型成果。1 月 15 日,美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大

    阅读全文
  • 文章封面

    失去三个联创后,Mira公司危机持续:又有两人要出走

    作者:机器之心发布日期:2026-01-16 13:06:21

    编辑|张倩继奥特曼在 OpenAI 的「宫斗」大戏后,他的老搭档 Mira 这周的经历也够拍一部电视剧了。昨天,我们报道了前 OpenAI CTO Mira Murati 创办的 Thinking M

    阅读全文
  • 文章封面

    不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

    作者:机器之心发布日期:2026-01-16 13:06:21

    随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理服务效率的核心瓶颈。自回归生成的特性使得模型必须存储历史 token 的 key-value 状态(即 KV cache)

    阅读全文
  • 文章封面

    实测夸克「千问划词快捷指令」,这7个邪修Prompt,建议收藏

    作者:机器之心发布日期:2026-01-15 11:48:46

    编辑|杨文新年第一天,DeepSeek 发布了一篇艰深晦涩的技术论文,不少网友直呼「看不懂」。于是,机器之心评论区出现了集体求助 AI 的一幕:有人让 AI 用八十岁老太太能听懂的方式解释,有人要求用

    阅读全文
  • 文章封面

    已证实!清华姚班陈立杰全职加入OpenAI,保留伯克利教职

    作者:机器之心发布日期:2026-01-15 11:48:46

    机器之心编辑部据机器之心求证,清华大学「姚班」校友、加州大学伯克利分校(UC Berkeley)助理教授陈立杰(Lijie Chen)已正式加入 OpenAI。知情人士透露,陈立杰此次是以全职身份加入

    阅读全文
  • 文章封面

    解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

    作者:机器之心发布日期:2026-01-15 11:48:46

    尽管扩散模型(Diffusion Model)与流匹配(Flow Matching)已经把文本到图像生成(Text-to-Image, T2I)推向了更高的视觉质量与可控性,但他们通常在推理时需要数十

    阅读全文
上一页下一页