全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    一文带你跑通基于 Transformers 的参数高效微调:数据处理、LoRA 训练、模型合并与评估全流程实践指南

    作者:机智流发布日期:2026-04-23 21:30:00

    > 作者:李剑锋前言在上一节课里,我们通过使用 200 条示例数据,并结合训练参数的调整,成功实现了 Qwen3-0.6B 模型的全参数微调及测试。这一步非常有价值,因为它让我们真正走通了一次从数据准

    阅读全文
  • 文章封面

    TensorRT-LLM 0.5.0 源码之十二

    作者:AI大模型调参指北笔记发布日期:2026-04-23 21:00:00

    attention.pyclass RotaryScalingType(IntEnum): none = 0 linear = 1 dynamic = 2class Positio

    阅读全文
  • 文章封面

    河南师傅,左手扳手,右手飞书,竟然能搞数据分析!

    作者:量子位发布日期:2026-04-23 20:42:59

    金磊 发自 凹非寺量子位 | 公众号 QbitAI说真的,学SQL这件事,可以先放一放了。因为现在,一个汽车点巡检的师傅,左手拿着扳手,右手拿着飞书,就能搞专业的数据分析!△图片由AI生成例如面对密密

    阅读全文
  • 文章封面

    国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家

    作者:量子位发布日期:2026-04-23 20:42:59

    金磊 发自 凹非寺量子位 | 公众号 QbitAI杭州速度,这个词组的含金量还在上升。因为一家纯推理GPU公司,在分拆独立仅1年多时间里,竟已经完成了七轮融资,累计40亿元!而随着前几天最新一轮融资的

    阅读全文
  • 文章封面

    27B秒了自家397B旗舰,Qwen3.6-27B开源,智能体编程全面超越前代

    作者:量子位发布日期:2026-04-23 20:42:59

    闻乐 发自 凹非寺量子位 | 公众号 QbitAI我秒了我自己??阿里Qwen团队刚开源的Qwen3.6-27B,直接把自家前代旗舰Qwen3.5-397B给卷没了。在四大智能体编程基准上全面超越,只

    阅读全文
  • 文章封面

    倒计时4天!我们在寻找能代表今年AI的企业与产品|榜单申报

    作者:量子位发布日期:2026-04-23 20:42:59

    组委会 发自 凹非寺量子位|公众号 QbitAI最近每个人都被“龙虾”“爱马仕”刷屏了。但AI产品总是面临的问题是,爆火的很多,真正能留下的很少。这正是我们希望回答的:今年最值得关注的AI企业&产品是

    阅读全文
  • 文章封面

    量子位编辑作者招聘

    作者:量子位发布日期:2026-04-23 20:42:59

    编辑部 发自 凹非寺量子位 | 公众号 QbitAIAI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来量子位呢?我们是一家以追踪AI新进展为核心的内容平台,经过8年积累,目前拥有顶流影响力,广

    阅读全文
  • 文章封面

    1/10Token 消耗干同样的活!Ling-2.6-flash 想帮开发者把 AI 成本打下来

    作者:AI科技评论发布日期:2026-04-23 19:40:46

    更少的 Token,更好的结果。 作者丨吴海明 编辑丨梁丙鉴 马晓宁

    阅读全文
  • 文章封面

    SpaceX 招股书首次深度曝光,华尔街多空激烈对线

    作者:AI科技评论发布日期:2026-04-23 19:40:46

    最应该从哪三个角度看待这次IPO? 作者丨胡清文 编辑丨徐晓飞 林觉民

    阅读全文
  • 文章封面

    2026-04-23 GitHub日Star榜

    作者:云雀坊间发布日期:2026-04-23 19:32:15

    2026-04-23 GitHub日Star榜 每日精选最值得关注的开源项目 1. PPT-Design-Prompt(热度: 301) 将品牌指南转换为面向演示图像的规范文档。 ht

    阅读全文
  • 文章封面

    姚顺雨带队、Hy3 preview上线!腾讯现在适合上车吗?

    作者:机器之心发布日期:2026-04-23 19:08:09

    编辑|吴昕刚刚,腾讯混元 Hy3 Preview 正式亮相。这是姚顺雨归国加盟腾讯后交出的第一份重磅答卷,整体性能达到了同尺寸模型最佳水平,兼具实用性和性价比。看似慢一拍的动作,正好回应了前不久的那个

    阅读全文
  • 文章封面

    刚刚,DeepSeek开始频繁更新:Tile Kernels、DeepEP V2

    作者:机器之心发布日期:2026-04-23 19:08:09

    机器之心编辑部就在刚刚,DeepSeek 的 GitHub 开始了频繁更新,上线开源了一个新的代码库 Tile Kernels,同时并对 DeepEP 代码库进行了更新,上线了 DeepEP V2。距

    阅读全文
  • 文章封面

    首篇「Attention Sink」综述:从利用、理解到消除,Transformer中的注意力「汇聚」全景解析

    作者:机器之心发布日期:2026-04-23 19:08:09

    几乎所有 Transformer 都在做一件反常的事:把大量注意力集中到少数几个特定 Token 上。这不是 bug,而是 Transformer 固有的「注意力汇聚」(Attention Sink)

    阅读全文
  • 文章封面

    斗胆预测2026 AI趋势:从对话工具到体系核心,改写工作方式的底层变革

    作者:PyTorch研习社发布日期:2026-04-23 19:01:01

    今年,我使用AI的方式发生了一场悄无声息的革命——不再反复打磨提示词,而是着手搭建属于自己的AI工作空间:跨会话留存的记忆的能力、能自主进化的知识库,短短三个月,我甚至想不起来上一次在聊天框里输入问题

    阅读全文
  • 文章封面

    MemPalace:48 小时斩获 2.2 万 Star 的 AI 记忆系统(深度解析与搭建指南)

    作者:PyTorch研习社发布日期:2026-04-23 19:01:01

    你构建过的每一个 AI agent(智能体)几乎都有同一个致命缺陷。你花一个小时讲解项目架构、编码偏好、部署约束。AI 任务完成得很漂亮。你关掉标签页。第二天回到同一页,它对你是谁一无所知。这不是小毛

    阅读全文
  • 文章封面

    姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测

    作者:AI前线发布日期:2026-04-23 17:09:03

    作者 | 褚杏娟、蔡芳芳今天,腾讯正式发布了新模型 Hy3 preview,这是姚顺雨加入腾讯后带领团队发布的首个模型。姚顺雨团队没有从千亿规模模型入手。Hy3 preview 是一个快慢思考融合的

    阅读全文
  • 文章封面

    为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体

    作者:AI前线发布日期:2026-04-23 17:09:03

    作者 | Leela Kumili 译者 | 明知山 LinkedIn 推出认知记忆智能体(Cognitive Memory Agent,CMA),作为其生成式 AI 技术栈的组成部分,旨在构建具备状

    阅读全文
  • 文章封面

    刚刚,姚顺雨腾讯首秀来了!三个月重建混元新模型,实测到底什么水平

    作者:APPSO发布日期:2026-04-23 17:00:45

    这周,中国大模型的更新让人窒息。前脚阿里最强旗舰 Qwen 3.6 Max刚发布,月之暗面的 Kimi 2.6 就马上登场,DeepSeek V4 也箭在弦上。刚刚,混元的 Hy3 Preview 也

    阅读全文
  • 文章封面

    起底 GPT Image 2 团队后,我扒出了一张华人师徒网

    作者:APPSO发布日期:2026-04-23 15:35:43

    GPT Image 2 正式上线后,AI 图像生成领域现在只剩两个段位:GPT Image 2,以及其它。在大模型竞技场中,GPT Image 2 以 241 分的绝对优势遥遥领先,但比起跑分,这份研

    阅读全文
  • 文章封面

    AI上桌了,谁还需要电影人啊?

    作者:钛媒体AGI发布日期:2026-04-23 13:59:53

    这张被AI改写的牌桌,谁在慌乱,谁在入局?文|LCC_Beta版作者|李程程编辑|杨林本文首发于钛媒体APP“讲好中国电影故事这座高山,千难万阻,中国电影永垂不朽!”当叶宁在爱奇艺举办的电影主题论坛快

    阅读全文
  • 文章封面

    Agent中的“爱马仕”来啦:100k+ Star 的开源AI Agent ,正在偷偷给自己升级

    作者:钛媒体AGI发布日期:2026-04-23 13:59:53

    一个会记住你、会学技能、还会读懂你习惯的数字员工。作者|硅谷Tech news编辑|焦燕本文首发于钛媒体APP如果你用过 ChatGPT 或任何一款 AI 助手,大概率有过这样的崩溃时刻——你花了半小

    阅读全文
  • 文章封面

    理想同学 MindDR 1.5 发布:多智能体强化学习加持,深度研究更可靠

    作者:夕小瑶科技说发布日期:2026-04-23 13:29:08

    导 语理想汽车信息智能体团队发布 MindDR 1.5,在 DeepResearch Bench 榜单中取得 52.54 分,以 30B 参数规模达到业界领先水平,性能优于同等规模的开源智能体系统。相

    阅读全文
  • 文章封面

    4.55亿美金重注一颗「大脑」!红杉高瓴罕见联手

    作者:新智元发布日期:2026-04-23 12:09:16

    新智元报道 编辑:桃子【新智元导读】一轮狂揽4.55亿美金!高瓴红杉罕见联手,美团重磅加注,中国具身智能单轮融资首破纪录。这家仅成立一年的国产黑马,凭「能干活的大脑」强势杀入大脑俱乐部第一梯队。

    阅读全文
  • 文章封面

    历史性时刻!Anthropic估值暴涨破万亿美元,首次超越OpenAI

    作者:新智元发布日期:2026-04-23 12:09:16

    新智元报道 编辑:艾伦【新智元导读】Anthropic 在私募二级市场被追到接近 1 万亿美元,热度反超 OpenAI,背后是稀缺股权、收入增长、Claude Code 的产品势能,以及资本对

    阅读全文
  • 文章封面

    浙大开源多Agent演化系统:大圣棒打王熙凤,大观园沦为空城

    作者:新智元发布日期:2026-04-23 12:09:16

    新智元报道 编辑:LRST【新智元导读】浙江大学团队开源了一个基于多智能体技术的演化叙事系统OpenStory,不仅还原了经典《红楼梦》中的角色和场景,实验结果也揭示了AGI下系统脆弱性,引发对

    阅读全文
  • 文章封面

    深度|Agent as a service,从加入一场群聊开始

    作者:Z Potentials发布日期:2026-04-23 10:49:13

    01 从一次“误入”的群聊开始前两天,一个朋友丢给我一个二维码,只说了一句:“进去看个热闹。”我一看,是互联网最热门的两位名人的AI化身,没有多想,就顺手点了进去。不需要任何引导。下一秒,我发现自己被

    阅读全文
  • 文章封面

    速递|AI存储Vast Data融资10亿美元,估值300亿美元,IPO进行中

    作者:Z Potentials发布日期:2026-04-23 10:49:13

    图片来源:Vast Data由 NVIDIA 支持的 Vast Data (一家为人工智能任务开发数据存储软件的公司)表示,已筹集约 10 亿美元,估值超过三倍增至 300 亿美元。这些资金分为一级

    阅读全文
  • 文章封面

    速递|NeoCognition完成4000万美元种子轮融资,要打造会自学的通用Agent

    作者:Z Potentials发布日期:2026-04-23 10:49:13

    图片来源:NeoCognition投资者正在积极争取AI 研究人员创办初创公司,以使 AI 更加可靠和高效。俄亥俄州立大学教授、AI Agent 实验室负责人 Yu Su 表示,他最初抵制了风险投资公

    阅读全文
  • 文章封面

    Claude Code 推出 /ultrareview 超级审查功能,20 美金一次,10 分钟干完

    作者:AGI Hunt发布日期:2026-04-23 10:46:46

    今天介绍 Claude Code 上线的一个新功能:/ultrareview。一句话概括:它会在云端同时派出多个 AI 审查员,帮你在合并代码之前把 Bug 揪出来。这个功能其实在上周 Claude

    阅读全文
  • 文章封面

    一代版本一代神?新神是 GPT-2 还是 Uni-1?

    作者:十字路口Crossing发布日期:2026-04-23 10:23:03

    让AI理解人的想法,而不是让人适应AI。 👩作者:稳稳🥷 编辑:Koji🎨 排版:Zeooo过去这半年,图像生成领域的更新节奏实在是太热闹了。 Banan Pro惊艳亮相,很快更具性价比的Banana

    阅读全文
上一页下一页