全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    VLA模型为何忽视语言?破解指令跟随幻觉,分布外场景泛化新突破

    作者:新智元发布日期:2026-05-13 12:00:00

    新智元报道 编辑:LRST【新智元导读】当前VLA模型常依赖视觉线索而非语言指令,导致在新场景下表现不佳。论文提出LangForce方法,通过引入对数似然比损失,强化模型对语言的依赖,提升其在分

    阅读全文
  • 文章封面

    8G 内存的手机,能跑多大的模型?|MiniCPM-V 4.6 开源

    作者:赛博禅心发布日期:2026-05-13 12:03:38

    端侧模型面壁的 MiniCPM-V 4.6 今天开源,1.3B 大小这是 MiniCPM 系列的模型,能够轻松跑在主流手机中,支持多模态架构是 SigLIP2-400M 视觉编码器加 Qwen3.5-

    阅读全文
  • 文章封面

    最懂购物的AI,竟然会劝你别买了?

    作者:硅星人Pro发布日期:2026-05-13 11:45:51

    作者|李楠邮箱|linan@pingwest.com过去买一支电动牙刷,我们可能要搜索、筛选、看参数、翻评价、比价格、凑满减。现在这个复杂的购物过程,压缩成了与AI的一段对话。5月11日,阿里巴巴宣布

    阅读全文
  • 文章封面

    对话OpenClaw核心团队:中国的大公司把业务直接跑在OpenClaw上,这并不常见

    作者:硅星人Pro发布日期:2026-05-13 11:45:51

    作者|Yoky邮箱|yokyliu@pingwest.com5月11日,在MU Shanghai组织的ClawCon活动上,OpenClaw的社区核心成员自己飞过来,在阿里中心的会议室里,面对着从全国

    阅读全文
  • 文章封面

    暴跌漩涡中,软件选择主动被大模型“吞噬”

    作者:硅星人Pro发布日期:2026-05-13 11:45:51

    文章转载于腾讯科技作者:晓静2011年,Marc Andreessen写下“软件正在吞噬世界”。2026 年,Fortune用了一句话总结当前局面:“那个吃掉世界的东西,正在被吃掉。 ”2026年 4

    阅读全文
  • 文章封面

    探秘 Claude Code,搞懂 Agent Harness|对谈来新璐

    作者:十字路口Crossing发布日期:2026-05-13 11:13:10

    「Agent Harness」是「套壳」的另一种说法。👦🏻 播客采访:Koji🥷 整理编辑:十字路口🧑‍🎨 排版: Zeoooo🚥 不久前,Claude Code 源代码泄露,许多 Agent Har

    阅读全文
  • 文章封面

    6.1B激活,三榜开源第一!蚂蚁·安诊儿医疗大模型发布

    作者:AIGC开放社区发布日期:2026-05-13 11:06:53

    专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!刚刚,由浙江省卫生健康信息中心、蚂蚁健康与浙江省安诊儿医学人工智能科技有限公

    阅读全文
  • 文章封面

    黄仁勋CMU演讲:取代你的是会AI的人,所有人同一起跑线,奔跑吧

    作者:AIGC开放社区发布日期:2026-05-13 11:06:53

    专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!老黄又当博士了。这是他的第7个荣誉博士学位,而且英特尔CEO陈立武亲自为其授

    阅读全文
  • 文章封面

    别错过!Agent Skill 开发者大赛作品提交截止今天

    作者:AIGC开放社区发布日期:2026-05-13 11:06:53

    专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!人工智能的下半场,关键词是“行动”。当大模型不再满足于“对话聊天”,而是开始

    阅读全文
  • 文章封面

    蚂蚁&复旦联合发布:保险大模型评测标准来了,告别盲目炼丹!

    作者:NLP PaperWeekly发布日期:2026-05-13 10:35:35

    引言💡 核心省流 (TL;DR):这篇由蚂蚁集团联合复旦大学等多家机构发布的论文,推出了首个专门针对保险领域的中文大模型评测基准 INSEva。为了解决通用金融大模型“懂理财却不懂理赔”的痛点,该基

    阅读全文
  • 文章封面

    深度精读GLM-5V-Turbo:看图写代码、搜资料做PPT,真正的“数字员工”是如何炼成的?

    作者:Tommy学习录发布日期:2026-05-13 08:18:00

    相关推荐:AI 视觉领域的“O1 时刻”来了?让模型从“看图”进化到“推理”,智谱做对了什么?太猛了!仅0.9B参数干翻千亿大模型,智谱GLM-OCR凭什么成为“地表最强”小钢炮?被老外误认成Clau

    阅读全文
  • 文章封面

    别让AI自动装包

    作者:AI安全工坊发布日期:2026-05-13 08:12:24

    别让AI自动装包别让 AI 帮你 npm install昨天在 X 上看到一条提醒:所有 AI 开发者,先停一下手里的 npm install。说实话,我一开始也以为又是安全圈标题党。但顺着查了一遍,

    阅读全文
  • 文章封面

    AI 独角兽哩布哩布,用 LibTV 在视频赛道又赢了一次:上线一个月日收入就破了百万美金

    作者:AI寒武纪发布日期:2026-05-13 07:30:00

    ↑阅读之前记得关注+星标⭐️,😄,每天才能第一时间接收到更新 最近一段时间,你刷某音的感受可能和我一样,镜头语言越来越讲究,人物越来越精致,场景越来越像电影,但评论区里经常有人问:这是真拍的还是 AI

    阅读全文
  • 文章封面

    Android 不再是操作系统了

    作者:APPSO发布日期:2026-05-13 07:05:03

    和去年一样,在正式的 Google I/O 开发者大会之前,谷歌为 Android 单独开了一次小型发布会。本次 Android Show 上,谷歌几乎是一股脑将未来一年有关 Android 和整个

    阅读全文
  • 文章封面

    一句话拍短剧,9 宫格做分镜,哩布哩布 LibTV 把 AI 视频卷疯了!

    作者:AI信息Gap发布日期:2026-05-13 06:00:00

    我给龙虾发了一句话。「生成一条 30 秒的科幻短剧。人类灭绝,最后一个冬眠舱里的人醒来,发现一个破旧的机器人守护了他 300 年。」几分钟后,龙虾发回来一条短剧视频。剧本是它自己写的,5 场戏,从开场

    阅读全文
  • 文章封面

    Claude Code 被拆开了!开发者画出六层架构图,7万人围观:模型竟然只是一个节点

    作者:虚拟灵枢发布日期:2026-05-13 01:35:38

    导读开发者 Akshay 在 X 上发了一张 Claude Code 六层架构图,累计近 7.5 万次浏览。图的核心观点:模型只是整个循环里的一个节点,真正驱动 Claude Code 能力的,是模型

    阅读全文
  • 文章封面

    长文| 如何构建一个好的Benchmark?——从编程到生产力的全景透视

    作者:NLP PaperWeekly发布日期:2026-05-12 23:41:15

    引言如果说模型是引擎,那么评测基准就是赛道。没有好的赛道,我们永远无法知道一辆跑车的真正极限在哪里。随着大语言模型(LLM)和AI Agent的能力边界不断向外扩展,评测基准的迭代速度甚至比模型本身

    阅读全文
  • 文章封面

    开箱即用!Cloudflare 全家桶SaaS Template架手架

    作者:字节笔记本发布日期:2026-05-12 21:35:35

    现在很多人会有一个错觉,有了 AI,项目好像已经不用模板框架了。反正登录上传权限这些都可以让 AI 写。听起来很美好,但真正做项目的时候你会发现:AI能帮你写代码,但它不能保证每次都给你一套稳定、统一

    阅读全文
  • 文章封面

    Karpathy重磅站队!AI输出抛弃Markdown,HTML已是时代过渡标配

    作者:PyTorch研习社发布日期:2026-05-12 21:34:43

    就在我们还在消化Anthropic工程师Thariq的实操干货、忙着用HTML解锁AI输出新姿势时,更炸裂的消息来了——AI教父Andrej Karpathy(卡帕西)直接公开站台,彻底把HTML替代

    阅读全文
  • 文章封面

    Agentic AI 实战:如何降低 Token 成本

    作者:PyTorch研习社发布日期:2026-05-12 21:34:43

    你的第一个 agent 也许只带着一个 500 个 token 的 system prompt 和两个工具上线,但这些数字通常会很快膨胀。举个例子,泄露的 Claude system prompt 大

    阅读全文
  • 文章封面

    flashinfer.sampling 实现二

    作者:AI大模型调参指北笔记发布日期:2026-05-12 21:00:00

    bench_sampling# https://github.com/flashinfer-ai/flashinfer/blob/48966b603ebabcd003f7272e8dc161ce05

    阅读全文
  • 文章封面

    吞吐量提升5.66倍!微软、港中大等Spin框架如何统一稀疏注意力与分级内存,让稀疏注意力算法真正高效落地

    作者:机智流发布日期:2026-05-12 21:00:00

    图片由 AI 生成随着大语言模型(LLM)的上下文窗口不断扩展,从数十万词元迈向百万级别,一个核心的挑战日益凸显:模型推理时,用于存储注意力计算中间状态的关键值(KV)缓存会线性增长,这给GPU内存容

    阅读全文
  • 文章封面

    AI音乐下半场:Mureka跨过生产可用门槛,让模型像作曲家一样思考,开发者又可以有哪些新可能?

    作者:夕小瑶科技说发布日期:2026-05-12 20:49:08

    上周大模型圈子有个很魔幻的场面,傅盛、孙宇晨、特朗普家族,三个八竿子打不着的人,开始扎堆做大模型中转站的生意。说明了一个问题,现在AI模型的供给侧,依旧是没有看起来的那么成熟。大多数人只关注到LLM,

    阅读全文
  • 文章封面

    「你永远不知道一个 AI 创业者

    作者:马骋AI实战派发布日期:2026-05-12 20:48:06

    阅读全文
  • 文章封面

    光轮智能与谷歌、英伟达共同定义物理AI仿真标准

    作者:机器之心发布日期:2026-05-12 19:28:43

    机器之心编辑部过去十年,AI 卡的是算力;未来十年,物理 AI 卡的是数据。而数据的前提,是仿真。没有可规模化的仿真世界,就没有可规模化的机器人数据;没有统一的仿真标准,就不会有真正的物理 AI 生态

    阅读全文
  • 文章封面

    宇树造了款民用高达!390万元起

    作者:机器之心发布日期:2026-05-12 19:28:43

    机器之心编辑部真的太炸裂了。从变形金刚,高达,到环太平洋,相信大家多少都怀揣一个机甲梦想。2018 年 10 月,马斯克发了条推文说要造机甲。8 年时间过去了,马斯克那边什么也没搞出来。结果现在你跟我

    阅读全文
  • 文章封面

    告别云端依赖!字节开源新作DreamLite让手机秒变 AI 画板

    作者:机器之心发布日期:2026-05-12 19:28:43

    近日,字节跳动智能创作部门(Intelligent Creation Lab)提出新作 DreamLite,一个主干网络仅有 0.39B 参数的轻量级统一扩散模型,在单一网络内同时支持文生图(Text

    阅读全文
  • 文章封面

    人类史上最大单品工业品,正在中国量产!

    作者:新智元发布日期:2026-05-12 19:25:15

    新智元报道 编辑:好困 桃子【新智元导读】Atlas倒立刷屏,但智元已经把机器人送进产线搬砖了!累计出货超万台、营收年增20倍,邓泰华在香港定义「部署态元年」:2026年,机器人必须真的能干活。

    阅读全文
  • 文章封面

    绝杀!OpenAI正式接管人类耳朵,首个GPT-5级推理音频模型来了

    作者:新智元发布日期:2026-05-12 19:25:15

    新智元报道 编辑:Aeneas【新智元导读】绝杀!OpenAI发布GPT-Realtime-2:首个GPT-5级推理音频模型,OpenAI正式接管人类耳朵人类与机器的最后一道「防火墙」——键盘,

    阅读全文
  • 文章封面

    TTS也要真人感!首个字级内容、毫秒级停顿控制的语音合成系统

    作者:新智元发布日期:2026-05-12 19:25:15

    新智元报道 编辑:LRST【新智元导读】语音合成这两年发展迅速:把一段话顺顺当当地念完,已经不算难事;难的是该慢的时候慢,该顿的时候顿,该强调的时候真能把重点托出来。语音合成这些年最明显的进展,

    阅读全文
上一页下一页