AI

一文带你跑通基于 Transformers 的参数高效微调：数据处理、LoRA 训练、模型合并与评估全流程实践指南
作者：机智流发布日期：2026-04-23 21:30:00
> 作者：李剑锋前言在上一节课里，我们通过使用 200 条示例数据，并结合训练参数的调整，成功实现了 Qwen3-0.6B 模型的全参数微调及测试。这一步非常有价值，因为它让我们真正走通了一次从数据准
阅读全文
TensorRT-LLM 0.5.0 源码之十二
作者：AI大模型调参指北笔记发布日期：2026-04-23 21:00:00
attention.pyclass RotaryScalingType(IntEnum): none = 0 linear = 1 dynamic = 2class Positio
阅读全文
河南师傅，左手扳手，右手飞书，竟然能搞数据分析！
作者：量子位发布日期：2026-04-23 20:42:59
金磊发自凹非寺量子位 | 公众号 QbitAI说真的，学SQL这件事，可以先放一放了。因为现在，一个汽车点巡检的师傅，左手拿着扳手，右手拿着飞书，就能搞专业的数据分析！△图片由AI生成例如面对密密
阅读全文
国内首家百亿估值纯推理GPU独角兽诞生！专访曦望联席CEO王湛：谁的推理成本更低谁就是赢家
作者：量子位发布日期：2026-04-23 20:42:59
金磊发自凹非寺量子位 | 公众号 QbitAI杭州速度，这个词组的含金量还在上升。因为一家纯推理GPU公司，在分拆独立仅1年多时间里，竟已经完成了七轮融资，累计40亿元！而随着前几天最新一轮融资的
阅读全文
27B秒了自家397B旗舰，Qwen3.6-27B开源，智能体编程全面超越前代
作者：量子位发布日期：2026-04-23 20:42:59
闻乐发自凹非寺量子位 | 公众号 QbitAI我秒了我自己？？阿里Qwen团队刚开源的Qwen3.6-27B，直接把自家前代旗舰Qwen3.5-397B给卷没了。在四大智能体编程基准上全面超越，只
阅读全文
倒计时4天！我们在寻找能代表今年AI的企业与产品｜榜单申报
作者：量子位发布日期：2026-04-23 20:42:59
组委会发自凹非寺量子位｜公众号 QbitAI最近每个人都被“龙虾”“爱马仕”刷屏了。但AI产品总是面临的问题是，爆火的很多，真正能留下的很少。这正是我们希望回答的：今年最值得关注的AI企业&产品是
阅读全文
量子位编辑作者招聘
作者：量子位发布日期：2026-04-23 20:42:59
编辑部发自凹非寺量子位 | 公众号 QbitAIAI热潮还在汹涌，但如果你还不知道如何参与……那为什么不来量子位呢？我们是一家以追踪AI新进展为核心的内容平台，经过8年积累，目前拥有顶流影响力，广
阅读全文
1/10Token 消耗干同样的活！Ling-2.6-flash 想帮开发者把 AI 成本打下来
作者：AI科技评论发布日期：2026-04-23 19:40:46
更少的 Token，更好的结果。作者丨吴海明编辑丨梁丙鉴马晓宁
阅读全文
SpaceX 招股书首次深度曝光，华尔街多空激烈对线
作者：AI科技评论发布日期：2026-04-23 19:40:46
最应该从哪三个角度看待这次IPO？作者丨胡清文编辑丨徐晓飞林觉民
阅读全文
2026-04-23 GitHub日Star榜
作者：云雀坊间发布日期：2026-04-23 19:32:15
2026-04-23 GitHub日Star榜每日精选最值得关注的开源项目 1. PPT-Design-Prompt（热度: 301）将品牌指南转换为面向演示图像的规范文档。 ht
阅读全文
姚顺雨带队、Hy3 preview上线！腾讯现在适合上车吗？
作者：机器之心发布日期：2026-04-23 19:08:09
编辑｜吴昕刚刚，腾讯混元 Hy3 Preview 正式亮相。这是姚顺雨归国加盟腾讯后交出的第一份重磅答卷，整体性能达到了同尺寸模型最佳水平，兼具实用性和性价比。看似慢一拍的动作，正好回应了前不久的那个
阅读全文
刚刚，DeepSeek开始频繁更新：Tile Kernels、DeepEP V2
作者：机器之心发布日期：2026-04-23 19:08:09
机器之心编辑部就在刚刚，DeepSeek 的 GitHub 开始了频繁更新，上线开源了一个新的代码库 Tile Kernels，同时并对 DeepEP 代码库进行了更新，上线了 DeepEP V2。距
阅读全文
首篇「Attention Sink」综述：从利用、理解到消除，Transformer中的注意力「汇聚」全景解析
作者：机器之心发布日期：2026-04-23 19:08:09
几乎所有 Transformer 都在做一件反常的事：把大量注意力集中到少数几个特定 Token 上。这不是 bug，而是 Transformer 固有的「注意力汇聚」（Attention Sink）
阅读全文
斗胆预测2026 AI趋势：从对话工具到体系核心，改写工作方式的底层变革
作者：PyTorch研习社发布日期：2026-04-23 19:01:01
今年，我使用AI的方式发生了一场悄无声息的革命——不再反复打磨提示词，而是着手搭建属于自己的AI工作空间：跨会话留存的记忆的能力、能自主进化的知识库，短短三个月，我甚至想不起来上一次在聊天框里输入问题
阅读全文
MemPalace：48 小时斩获 2.2 万 Star 的 AI 记忆系统（深度解析与搭建指南）
作者：PyTorch研习社发布日期：2026-04-23 19:01:01
你构建过的每一个 AI agent（智能体）几乎都有同一个致命缺陷。你花一个小时讲解项目架构、编码偏好、部署约束。AI 任务完成得很漂亮。你关掉标签页。第二天回到同一页，它对你是谁一无所知。这不是小毛
阅读全文
姚顺雨腾讯模型首秀！不卷参数只做 “听话打工人”，Hy3 preview登场 | 附实测
作者：AI前线发布日期：2026-04-23 17:09:03
作者 | 褚杏娟、蔡芳芳今天，腾讯正式发布了新模型 Hy3 preview，这是姚顺雨加入腾讯后带领团队发布的首个模型。姚顺雨团队没有从千亿规模模型入手。Hy3 preview 是一个快慢思考融合的
阅读全文
为 AI 智能体设计记忆机制：揭秘 LinkedIn 的认知记忆智能体
作者：AI前线发布日期：2026-04-23 17:09:03
作者｜ Leela Kumili 译者｜明知山 LinkedIn 推出认知记忆智能体（Cognitive Memory Agent，CMA），作为其生成式 AI 技术栈的组成部分，旨在构建具备状
阅读全文
刚刚，姚顺雨腾讯首秀来了！三个月重建混元新模型，实测到底什么水平
作者：APPSO发布日期：2026-04-23 17:00:45
这周，中国大模型的更新让人窒息。前脚阿里最强旗舰 Qwen 3.6 Max刚发布，月之暗面的 Kimi 2.6 就马上登场，DeepSeek V4 也箭在弦上。刚刚，混元的 Hy3 Preview 也
阅读全文
起底 GPT Image 2 团队后，我扒出了一张华人师徒网
作者：APPSO发布日期：2026-04-23 15:35:43
GPT Image 2 正式上线后，AI 图像生成领域现在只剩两个段位：GPT Image 2，以及其它。在大模型竞技场中，GPT Image 2 以 241 分的绝对优势遥遥领先，但比起跑分，这份研
阅读全文
AI上桌了，谁还需要电影人啊？
作者：钛媒体AGI发布日期：2026-04-23 13:59:53
这张被AI改写的牌桌，谁在慌乱，谁在入局？文｜LCC_Beta版作者｜李程程编辑｜杨林本文首发于钛媒体APP“讲好中国电影故事这座高山，千难万阻，中国电影永垂不朽！”当叶宁在爱奇艺举办的电影主题论坛快
阅读全文
Agent中的“爱马仕”来啦：100k+ Star 的开源AI Agent ，正在偷偷给自己升级
作者：钛媒体AGI发布日期：2026-04-23 13:59:53
一个会记住你、会学技能、还会读懂你习惯的数字员工。作者｜硅谷Tech news编辑｜焦燕本文首发于钛媒体APP如果你用过 ChatGPT 或任何一款 AI 助手，大概率有过这样的崩溃时刻——你花了半小
阅读全文
理想同学 MindDR 1.5 发布：多智能体强化学习加持，深度研究更可靠
作者：夕小瑶科技说发布日期：2026-04-23 13:29:08
导语理想汽车信息智能体团队发布 MindDR 1.5，在 DeepResearch Bench 榜单中取得 52.54 分，以 30B 参数规模达到业界领先水平，性能优于同等规模的开源智能体系统。相
阅读全文
4.55亿美金重注一颗「大脑」！红杉高瓴罕见联手
作者：新智元发布日期：2026-04-23 12:09:16
新智元报道编辑：桃子【新智元导读】一轮狂揽4.55亿美金！高瓴红杉罕见联手，美团重磅加注，中国具身智能单轮融资首破纪录。这家仅成立一年的国产黑马，凭「能干活的大脑」强势杀入大脑俱乐部第一梯队。
阅读全文
历史性时刻！Anthropic估值暴涨破万亿美元，首次超越OpenAI
作者：新智元发布日期：2026-04-23 12:09:16
新智元报道编辑：艾伦【新智元导读】Anthropic 在私募二级市场被追到接近 1 万亿美元，热度反超 OpenAI，背后是稀缺股权、收入增长、Claude Code 的产品势能，以及资本对
阅读全文
浙大开源多Agent演化系统：大圣棒打王熙凤，大观园沦为空城
作者：新智元发布日期：2026-04-23 12:09:16
新智元报道编辑：LRST【新智元导读】浙江大学团队开源了一个基于多智能体技术的演化叙事系统OpenStory，不仅还原了经典《红楼梦》中的角色和场景，实验结果也揭示了AGI下系统脆弱性，引发对
阅读全文
深度｜Agent as a service，从加入一场群聊开始
作者：Z Potentials发布日期：2026-04-23 10:49:13
01 从一次“误入”的群聊开始前两天，一个朋友丢给我一个二维码，只说了一句：“进去看个热闹。”我一看，是互联网最热门的两位名人的AI化身，没有多想，就顺手点了进去。不需要任何引导。下一秒，我发现自己被
阅读全文
速递｜AI存储Vast Data融资10亿美元，估值300亿美元，IPO进行中
作者：Z Potentials发布日期：2026-04-23 10:49:13
图片来源：Vast Data由 NVIDIA 支持的 Vast Data （一家为人工智能任务开发数据存储软件的公司）表示，已筹集约 10 亿美元，估值超过三倍增至 300 亿美元。这些资金分为一级
阅读全文
速递｜NeoCognition完成4000万美元种子轮融资，要打造会自学的通用Agent
作者：Z Potentials发布日期：2026-04-23 10:49:13
图片来源：NeoCognition投资者正在积极争取AI 研究人员创办初创公司，以使 AI 更加可靠和高效。俄亥俄州立大学教授、AI Agent 实验室负责人 Yu Su 表示，他最初抵制了风险投资公
阅读全文
Claude Code 推出 /ultrareview 超级审查功能，20 美金一次，10 分钟干完
作者：AGI Hunt发布日期：2026-04-23 10:46:46
今天介绍 Claude Code 上线的一个新功能：/ultrareview。一句话概括：它会在云端同时派出多个 AI 审查员，帮你在合并代码之前把 Bug 揪出来。这个功能其实在上周 Claude
阅读全文
一代版本一代神？新神是 GPT-2 还是 Uni-1？
作者：十字路口Crossing发布日期：2026-04-23 10:23:03
让AI理解人的想法，而不是让人适应AI。 👩作者：稳稳🥷 编辑：Koji🎨 排版：Zeooo过去这半年，图像生成领域的更新节奏实在是太热闹了。 Banan Pro惊艳亮相，很快更具性价比的Banana
阅读全文