Transformer范式变了?稀疏线性混合架构SALA发布,单卡5090跑通百万长文
众所周知,Transformer 及其核心的全注意力机制(Full Attention)虽长期占据大模型架构的核心地位,但平方级计算复杂度、高额显存占用的瓶颈,早已成为实现超长上下文处理与模型规模化应
阅读全文众所周知,Transformer 及其核心的全注意力机制(Full Attention)虽长期占据大模型架构的核心地位,但平方级计算复杂度、高额显存占用的瓶颈,早已成为实现超长上下文处理与模型规模化应
阅读全文研讨会简介第一届 “生成式 AI、偏好优化与智能体系统驱动的低层视觉前沿(LoViF)” 研讨会将于 2026 年 6 月与 CVPR 2026 同期举办。底层视觉正经历一场范式转变,传统的图像复原方
阅读全文编辑|杜伟2026 马年注定迎来一个「AI 味」最浓的春节。一个与众不同的玩家进入我们的视线,它正是国内最有活人感的生活和消费社区 —— 小红书,卷起了「感知力」。小红书围绕着发布、评论、搜索、社交等
阅读全文编辑|冷猫2026 开年至今,人工智能圈子最火的是一只小龙虾 Clawdbot 。从 Clawdbot 到 OpenClaw,历经两次改名都无法阻挡大家对它的热情,一种全球性的集体渴望正在浮现 ——
阅读全文过去一年,大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块,GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。这种能力的提升,让很多
阅读全文整理 | 华卫 临近春节,智谱 AI 发布了其最新旗舰大模型 GLM-5。自 1 月初在香港进行备受关注的 IPO 之后,这是该公司推出的首款重磅大模型。据称,GLM-5 标志着人工智能开发从“Vib
阅读全文作者 | Addy Osmani 译者 | 平川 策划 | Tina 本文最初发布于 Addy Osmani 的个人博客。软件行业正处在一个奇怪的转折点上。AI 编程已经从增强型的自
阅读全文大家好,分享一个好消息。豆包视频生成模型Seedance 2.0今天正式接入豆包App、电脑端和网页版。打开豆包App对话框,选择新增的“Seedance 2.0”入口,输入相关提示词,即可生成5秒或
阅读全文新智元报道 编辑:好困 定慧【新智元导读】Vibe Coding时代宣告终结!2026年伊始,智谱GLM-5震撼空降,以「智能体工程」重塑游戏规则。用Claude七分之一的地板价,国产模型正面硬
阅读全文新智元报道 编辑:元宇【新智元导读】一位牛津哲学博士,正在Anthropic教全球顶尖AI模型如何「做人」。这场跨物种的「育儿实验」,比科幻更炸裂。她留着朋克短发,每天如慈母育儿一般,与AI谈论
阅读全文新智元报道 编辑:LRST【新智元导读】UIUC开源的智能模型路由框架LLMRouter可以自动为大模型应用选择最优模型,提供16+路由策略,覆盖单轮选择、多轮协作、个性化偏好和Agent式流程
阅读全文智谱在深夜发布了新一代旗舰模型 GLM-5,而它在发布之前,已经以匿名身份被全网开发者吹了一周。并用户量暴涨十倍:在聊 GLM-5 之前,我们先来说说此前的黑马:Pony Alpha:「黑马」 Pon
阅读全文2026 年开年,AI Coding 赛道突然加速,OpenAI 的 Codex 5.3 号称代码生成速度提升 25%,Claude Opus 4.6 在 SWE-bench 上继续刷榜,智谱 GLM
阅读全文最近,扣子在大力宣传新的Skills商店。有很多优秀的Skill,但如果你想看看具体的Skill.md是怎么写的,会话基本都会被拦截。但是,如果你换个方式,可能几句话就能复刻出一个类似的Skill。所
阅读全文最近OpenRouter上冒出来一个代号Pony的模型。没有厂商认领,没有参数说明,只有一个API接口。仅仅过了三个小时,它就在开发者社区炸锅了。有人把一段困扰了两周的死锁代码扔进去,它没废话,直接指
阅读全文关于那个神秘的「Pony Alpha」模型的传言,已经在互联网发酵了一周。有人说它是 Claude 5 的马甲,也有人说它是某大厂的秘密武器。就在刚刚,靴子落地,谜底揭晓:这个代号「Pony Alph
阅读全文在大模型技术快速演进的背景下,软件开发正经历从“代码书写驱动”向“智能语义驱动”的范式转型。AI Coding 作为这一转型的核心形态,依托大语言模型的理解、生成与推理能力,使开发者能够通过自然语言表
阅读全文image导语如果说去年的 AI 还是一个随叫随到的“天才实习生”,那么 2026 年 2 月初 Anthropic 发布的 Claude 4.6 (Opus 4.6) 则正式宣告:“个体英雄主义”结
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!一直以来,开源最强图像生成和图像编
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!2022年,Yann LeCun提
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!扩散模型(Diffusion Mo
阅读全文图片来源:Fortt KnoxZ Highlights:真正重要的是,整个人类社会、整个全球人口都能参与到AI当中,因为这是一项文明级别的技术。AI是新一代的计算方式。这意味着:任何依赖芯片、依赖计算
阅读全文Paper link: https://arxiv.org/abs/2511.10984Project link: https://github.com/ByteDance-Seed/DiscoXBl
阅读全文图片来源:AnthropicAnthropic 即将完成一轮超过 200 亿美元的融资,本轮由包括彼得·蒂尔的 Founders Fund、D.E. Shaw & Co. 及 Dragoneer In
阅读全文图片来源:EntireGitHub 前首席执行官托马斯·多姆克,正如其领投方 Felicis 所宣称的,为一家开发工具初创公司筹集了史上最大规模的种子轮融资。这家名为 Entire 的初创公司以 3
阅读全文图片来源:AI生成▎字节跳动、智谱、MiniMAX等多家国产大模型集中上新,推动AI应用进入新阶段。作者|AGI-Signal编辑|秦聪慧本文首发于钛媒体APP2026年春节档迎来国产AI大模型的集中
阅读全文拿旧地图,找不到新大陆过去几个月,这个感觉越来越强。互联网时代的 DAU、SaaS、注意力经济、免费增长、从工具到平台的三级火箭,这些词汇构成了过去十年所有人的认知底座,当然...这里不包括「对齐颗
阅读全文深夜,GLM-5来了。还是老样子,发布即开源。而且前几天,OpenRouter平台不是有一个Pony Alpha的匿名模型很火吗。大家一度在猜是DeepSeek V4还是GLM-5,结果今天基本答案也
阅读全文前言OpenClaw 很酷,大家都应该用起来。对于小白用户,建议使用云主机方式进行使用,月费几十块钱即可,环境隔离很安全。但对于程序员、IT 工程师而言,因为生产资料都在主力机上,所以建议直接在主力机
阅读全文一张图,九份参考,小云雀剪出了一条完整短片。👦🏻 作者: 镜山🥷 编辑: Koji🧑🎨 排版: NCon这两天,AI 视频领域被字节的新一代视频模型 Seedance 2.0 刷屏了,距离上一代模型
阅读全文