蜜蜂的小脑袋藏着具身智能的秘密
蜜蜂大脑大约仅有 1 百万个神经元,却能完成复杂的导航、花朵识别和舞蹈交流任务。其卓越的视觉学习能力使其成为研究主动信息获取与表征的理想对象。目标近期发表在 eLife 的研究【文献1】开发了一个受生
阅读全文蜜蜂大脑大约仅有 1 百万个神经元,却能完成复杂的导航、花朵识别和舞蹈交流任务。其卓越的视觉学习能力使其成为研究主动信息获取与表征的理想对象。目标近期发表在 eLife 的研究【文献1】开发了一个受生
阅读全文尽管对 GPT-5 褒贬不一,行业共识是并未达到期待的超级智能,根因或许来自 Transformer 边际效用降低。前天 DeepSeek 悄悄上线 V3.1,不是万众期盼的 R2, 基准测试提升可圈
阅读全文搜索引擎优化(SEO)在过去二十多年里一直是互联网的基础产业。无论是百度、谷歌,还是电商平台,SEO 都决定了谁能在搜索结果中脱颖而出,从而获得用户流量与商业机会。然而,大模型正在颠覆搜索逻辑。传统的
阅读全文今早等电梯发生一件有趣的事:一个膀阔腰圆的小伙站我左侧,电梯门一开,我径直启动准备进门(预判小伙也直走),然而小伙猛然横步向右前方走,撞击式阻拦了我一下。错愕间,我才注意到,小伙是笑容可掬地给不远处领
阅读全文看到这张图,很感慨,但不是感慨图中的表面意思;Agent不该是这个样子,这是披着agent外衣的APP。LLM-Agent 的提出者 Lilian Weng看到这张图,不知作何感想;笔者看来,Agen
阅读全文GPT5 发布,离万众期待的 ASI 还有距离,让大家更期待DeepSeek R2 了,尽管笔者看来,基于Transformer从训练、测试再到推理的 Scaling Law 潜力有边际效用递减的迹象
阅读全文译者注:理论表明,意识是一种量子过程,将我们与整个宇宙相连,不少读者关注,文章没有“拜量子神教”的任何意图,纯粹形而上探讨,特此声明。新研究表明,富含色氨酸的特定蛋白质——尤其是脑细胞中的这类蛋白质—
阅读全文人类大脑的研究成果或许能为科学家探索其他动物及人工智能的意识提供线索。2005年末,一场车祸发生五个月后,23岁的女性患者毫无反应地躺在病床上。她因严重脑损伤而丧失意识表征,但当研究人员扫描她的大脑并
阅读全文笔者最近更新了大模型数理认知框架:重整化提取出范畴,持续重整化驱动范畴相变,然后逆重整化推理:关于 LLM对句法和语义惊人的理解力,大家可曾想到一个关键问题:如何以数学方式刻画 LLM 所学到的语言范
阅读全文谷歌研究院今天放出一篇技术博客【文献 1】,介绍了其关系数据的图基础模型的工作。不久前笔者在 关系型基础模型 Relational Foundation Model 刚讨论了 Kumo AI 的 RF
阅读全文我们的意识看起来非常私密,仿佛仅属于每一个独立的个体。然而,许多研究人员猜想,意识可能连接着某种更宏大的存在。一项颇具争议的新理论提出,一种“量子纠缠”的机制可能发生在微管之中——那是构成我们每一个神
阅读全文随着人工智能、认知科学与神经科学的交汇日益加深,业界越来越关注AI模型与人类大脑在表征维度、学习机制以及组织结构方面的共性与差异。Nature 的四篇文献分别从“表征维度”、“多模态语义对齐”、“层次
阅读全文马伯庸笔下的《长安的荔枝》火了,在笔者看来,一个关于古代"社畜"的黑色幽默,却成为投射企业数字化的镜子。一千年前,唐朝九品小吏李善德面对"一骑红尘妃子笑"的mission impossible,用尽浑
阅读全文笔者问了ChatGPT 关于“AGI 时代如何选择大学专业”的问题,以下是祂的精彩回复,笔者深以为然,分享给大家。高考之后的专业选择,往往决定了未来10年甚至更长时间的发展方向。而在当前大模型(LLM
阅读全文随机数的不可预测性是数字安全与公平资源分配应用的基石。然而现有随机数生成过程无法被完整追踪、审计并确保真正不可预测:伪随机数生成器的算法步骤虽可审计,却无法保证在已知初始种子条件下的输出结果具有先验不
阅读全文高考的笔落下,是人生长卷中一个清晰却非决定性的标点,此刻我更想分享自己关于个体存在的洞察:个体生命的轨迹,暗合三个中小学语文课本上的古老寓言。卖油翁的油穿钱孔,昭示着通往卓越的路径,在于对“过程”本身
阅读全文今天开幕的智源大会主题演讲中,Yoshua Bengio 判断5年内出现人类水平AI;强化学习之父Richard Sutton则预见了AI的体验时代。笔者理解Sutton说的是真实时空的具身体验,需要
阅读全文近期看到一个大模型研究领域有井喷趋势:如何让模型在无需人类过多干预的情况下实现自我提升。自我发展框架让LLM自主生成并优化模型改进算法,通过聚焦模型融合策略,初始模型能通过发现新型融合技术实现迭代升级
阅读全文物理人工智能系统需要感知、理解并在物理世界中执行复杂动作,Nvidia Cosmos-Reason1 【文献1】就是为此而设计。一、Cosmos-Reason1Cosmos-Reason1模型系列宣称
阅读全文作者自述:一位求学者,二十年程序员生涯,游走于工程、语言、知识、智能、数学之间,内心对世界充满诸多好奇与困惑,尝听友人讲大刘《山》的故事,也期自己可凭蛮力,凿空厚壁,得见星空。 引言算术表达式几何 (
阅读全文近日麻省理工学院团队提出了神经热力学定律(NTL,neural thermodynamic laws)【文献1】,笔者这里做个简评。学者们提出LLM损失景观的“河–谷分解法”,引入可解的二阶简化模型,
阅读全文译者注:论文结论跟沿最优输运方向的重整化可能是世界演化的核心方式 中笔者的如下表述一致:“能量在时空中流动,穿越边界的通量变化,派生散度与旋度,即电场和磁场;波放慢速度钝化成粒子(薛定谔的爱情与狄拉克
阅读全文早在2014年,Mehta和Schwab就证明了“基于受限玻尔兹曼机(RBM)的深度模型和变分RG之间存在精确对应”。深度网络底层神经元捕捉细节,高层神经元提取抽象特征,本质上等同于RG中积分掉高频自
阅读全文麻省理工学院研究团队提出了一种以大脑节律为灵感的新型机器学习模型——线性振荡状态空间模型(Linear Oscillatory State-Space Models,简称 LinOSS)【文献1】。它
阅读全文摘要Agentic 应用是利用 AI 智能体驱动功能的程序——这些智能体是为自主收集数据并朝着特定目标采取行动而设计的软件。随着 AI 智能体在现实世界中的应用日益广泛,理解其安全影响变得至关重要。本
阅读全文昨晚笔者总结整理了 d1:通过GRPO在扩散LLM中缩放推理 , 带大家领略了 diffusion + GRPO 威力,也再次印证笔者关于GRPO 是DeepSeek魔法的源泉的判断。无独有偶,另一个
阅读全文加州大学洛杉矶分校与Meta AI的研究团队联合发布了革命性的强化学习框架d1【文献1】。该框架显著提升了基于扩散原理的LLM(dLLM)的推理性能——在某些场景下将响应时间从超过30秒缩短至仅需3秒
阅读全文Spin-Transformer数据雕刻自旋玻璃 中笔者总结过:“从概念上的相似性、物理解释、优化参数规模角度,基于矢量自旋磁化的平均场新方程,提出了一类受物理启发的 spin-transformer
阅读全文