全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    🔥刚刚,25 年诺贝尔医学奖奖揭幕,

    作者:机智流发布日期:2025-10-06 17:43:41

    阅读全文
  • 文章封面

    阿里Qwen悄悄放出6个开源权重,国庆卷疯了~消费级显卡也能跑

    作者:机智流发布日期:2025-10-05 15:22:45

    本文转载自 PaperAgent国庆长假也不放过,阿里通义千问真的是卷疯了,悄悄放出6个开源模型权重,体积更小的Qwen3-VL:Qwen3-VL-30B-A3B-Instruct 与 Qwen3-V

    阅读全文
  • 文章封面

    Sora,首个真正的 AI ToC 应用,给我们带来了哪些发展机会?

    作者:机智流发布日期:2025-10-04 18:43:05

    AI 应用战争,Sora 打响了第一枪。作者|周永亮编辑|郑玄99% 的人都搞错了。「Sora 不是『AI 版抖音』,它更接近『AI 版 ins 或朋友圈』。」这是 Lovart 创始人陈冕,在与极客

    阅读全文
  • 文章封面

    AK点赞转发,P站国庆更新第 1 弹🚀

    作者:机智流发布日期:2025-10-03 23:12:34

    阅读全文
  • 文章封面

    9月HF论文TOP20|RL综述、SAPO、A.S.E、VLA等

    作者:机智流发布日期:2025-10-01 22:20:39

    本文选自 Hugging Face Daily Paper 九月论文,论文解读由 Intern-S1 等 AI 生成。(1) Sharing is Caring: Efficient LM Post-

    阅读全文
  • 文章封面

    国庆去哪玩?HuggingFace八日游!

    作者:机智流发布日期:2025-09-30 19:15:22

    🔥今年年初春节期间我们举办了「HF论文茶话会」在社区受到广泛关注,这个国庆假期我们将举办国庆假期Hugging Face八日游活动,将和大家一起盘点2025 年第 3 季度 Hugging Face

    阅读全文
  • 文章封面

    DeepSeek-V3.2背后的国产算子编程语言TileLang是什么?如何保持性能领先的同时减少6倍代码量?

    作者:机智流发布日期:2025-09-29 21:03:17

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对引言今天傍晚,DeepSeek-V3.2-Exp模型正式发布并开源。该模型引入了稀疏Attention架构,旨在降低计算资源消耗并提升模型推

    阅读全文
  • 文章封面

    DeepSeek-V3.2-Exp 技术报告解读!全新稀疏注意力机制如何革新长文本处理效率

    作者:机智流发布日期:2025-09-29 21:03:17

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对在人工智能领域,处理超长文本一直是语言模型面临的重大挑战。无论是复杂文档分析、长篇对话生成,还是多轮推理任务,模型需要在保持高性能的同时应对

    阅读全文
  • 文章封面

    机智流团队首份研究!全球首个音文对齐“慢思考”反诈数据集与生成框架开源发布,斩获ACM Multimedia 2025

    作者:机智流发布日期:2025-09-28 23:11:48

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对导语电信诈骗的阴影笼罩全球,每年造成的经济损失高达万亿美元,如同一头难以驯服的猛兽。传统的反诈手段在日益狡猾的骗术面前,常常显得力不从心。当

    阅读全文
  • 文章封面

    Anthropic 复盘 Claude 回复质量降低的三个Infra问题

    作者:机智流发布日期:2025-09-27 22:30:45

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对原文链接:https://www.anthropic.com/engineering/a-postmortem-of-thr

    阅读全文
  • 文章封面

    CoRL25|仅10-20个样本,成功率76.7%!ControlVLA框架让机器人“秒懂”新任务,微调效率提升近4倍

    作者:机智流发布日期:2025-09-26 20:30:00

    全文约 3300 字,预计阅读时间 10 分钟近年来,预训练VLA (Vision-Language-Action) 模型展现出极大的潜力,但要让机器人学会新任务,仍需依赖大规模、精确的动作序列。为解

    阅读全文
  • 文章封面

    SciReasoner、Seedream 4、Hunyuan3D-Omni技术报告|今日HF论文20篇

    作者:机智流发布日期:2025-09-26 20:30:00

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对(1) SciReasoner: Laying the Scientific Reasoning Ground Across Discipl

    阅读全文
  • 文章封面

    国内开发者专属Git教程:4步掌握代码管理+分支合并+远程协作(附Gitee/GitHub双平台教程)

    作者:机智流发布日期:2025-09-25 22:13:14

    作者:李剑锋全文约 6400 字,预计阅读时间 20 分钟简介Git 是一个分布式版本控制系统(Distributed Version Control System, DVCS),最初由 Linux

    阅读全文
  • 文章封面

    0925:云栖大会通义集中发布6款模型+1个全新品牌|Meta FAIR发布代码世界模型CWM|英伟达开源Audio2Face

    作者:机智流发布日期:2025-09-25 22:13:14

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对新闻资讯通义团队云栖大会集中发布:6款模型+1个全新品牌在云栖大会上,通义大模型团队一口气发布 6款全新模型 和 1个全新品牌,全面覆盖多模

    阅读全文
  • 文章封面

    项目分享|FreeKnowledge-AI:免费、高效、可信赖的外部知识增强搜索引擎,远超付费API的准确率表现

    作者:机智流发布日期:2025-09-24 22:34:33

    本文来自社区同学投稿本项目正积极参与AI Agent2025 全球专项赛,如果您认可我们的项目,希望能得到您的支持。您可以扫描下方图片中的二维码,为我们投出宝贵的助力票。需要注意的是,投票时间为202

    阅读全文
  • 文章封面

    新强化学习算法:腾讯RLPT、字节MAPO|HF 今日论文 18 篇

    作者:机智流发布日期:2025-09-24 22:34:33

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对(1) Baseer: A Vision-Language Model for Arabic Document-to-Markdown OC

    阅读全文
  • 文章封面

    聊聊大模型推理系统之Hetis:如何让“高低配”GPU集群跑出2.25倍吞吐?

    作者:机智流发布日期:2025-09-23 22:27:03

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对在大模型时代,算力需求如潮水般上涨。然而,现实中的生产集群往往并非清一色的顶级显卡,而是由A100、3090甚至老旧的P100等不同性能和内

    阅读全文
  • 文章封面

    HF今日论文33篇|Less is More for Agency、Qwen3-Omni技术报告

    作者:机智流发布日期:2025-09-23 22:27:03

    论文选自 HuggingFace 每日论文,解读由 Intern-S1 等 AI 生成(1) LIMI: Less is More for Agency论文简介:由上海人工智能实验室、清华大学、复旦大

    阅读全文
  • 文章封面

    搜索已死:AI时代的购物将何去何从?

    作者:机智流发布日期:2025-09-22 22:45:00

    文章编译自a16z合伙人们的最新播客[1],探讨AI时代搜索的衰落与购物模式的变革,由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部润色校对。主要观点:AI Agent将取代传统关

    阅读全文
  • 文章封面

    聊聊阿里的新深度研究框架:WebWeaver 如何通过双智能体突破传统开源方案“先搜后写”和““静态大纲引导搜索”两种范式

    作者:机智流发布日期:2025-09-21 22:44:41

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对不知道你有没有这样的感受,在使用各家大模型的深度研究时,让大语言模型自行查阅一个网页及其子网页的信息并总结时,感觉效果还不错

    阅读全文
  • 文章封面

    SGLang case study:W4A8 GroupGEMM 学习

    作者:机智流发布日期:2025-09-20 21:39:16

    作者:企鹅火烈鸟视频资源:https://www.bilibili.com/video/BV11tMwznEmo?spm_id_from=333.788.videopod.sections&vd_so

    阅读全文
  • 文章封面

    书生大模型实战营第6期预报名火热开启,分享有礼!

    作者:机智流发布日期:2025-09-20 21:39:16

    书生大模型实战营第 6 期预报名火热开启,快扫码报名,提前锁定席位!在报名页面获取你的专属海报分享给好友,并邀请他们报名,还能获得丰厚算力激励。更多课程亮点与奖励详情请见下图。-- 完 --机智流推荐

    阅读全文
  • 文章封面

    LLM真能读懂报表吗?EMNLP'25首个工业级表格生成报告基准T2R-bench:最强大模型仅得62分

    作者:机智流发布日期:2025-09-19 21:30:00

    本文来自社区投稿,单位:中国电信人工智能研究院研究方向:表格理解和大语言模型论文标题: T2R-bench: A Benchmark for Generating Article-Level Repo

    阅读全文
  • 文章封面

    抢先 Qwen Next?腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

    作者:机智流发布日期:2025-09-18 21:20:15

    作者:可乐好爽、企鹅火烈鸟研究团队:腾讯 PCG 内服内容算法中心团队大语言模型在我们生活中越来越常用,如今我们用LLM做对话、写代码、解数学题的时候,不知道大家有没有过这样的困扰:明明模型思路很对,

    阅读全文
  • 文章封面

    具身操作大模型InternVLA·A1上线,助力实现高动态场景下的多机器人协作 | 具身智能开源周 Day4

    作者:机智流发布日期:2025-09-18 21:20:15

    本文转载自「书生Intern」InternVLA·A1是上海人工智能实验室(上海AI实验室)推出的首个理解、想象、执行一体化具身操作大模型,基于实验室自研的虚实混合操作数据集InternData·A1

    阅读全文
  • 文章封面

    日报:通义DeepResearch开源,重塑AI科研流程|面壁智能发布SOTA语音生成基座模型

    作者:机智流发布日期:2025-09-18 21:20:15

    作者:yanbo新闻资讯面壁智能发布VoxCPM:语音生成媲美真人,声音复刻逼真面壁智能携手清华大学深圳国际研究生院推出 0.5B 参数语音生成基座模型 VoxCPM。该模型在 自然度、音色相似度和韵

    阅读全文
  • 文章封面

    从“全量记忆”到“智能裁剪”:LangChain 新记忆模式实战指南

    作者:机智流发布日期:2025-09-17 22:34:07

    作者:李剑锋前言在上节课里LangChain 新一代记忆管理:RunnableWithMessageHistory 全面解析与实战,我们其实讲到了如何使用 LangChain 里 RunnableWi

    阅读全文
  • 文章封面

    阿里通义今日狂发6篇论文| 霸榜HF今日论文

    作者:机智流发布日期:2025-09-17 22:34:07

    今天打开 Hugging Face Daily Paper 惊呆了,看到了 6 篇阿里通义实验室的论文。论文选自 Hugging Face 每日论文,解读由 Intern-S1 等AI生成。(1) W

    阅读全文
  • 文章封面

    聊聊大模型推理系统之FineServe突破混精大模型服务瓶颈:SLO达标率提升2.2倍的三大创新

    作者:机智流发布日期:2025-09-16 22:29:36

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对你是否想过,当多个不同精度的大语言模型(LLM)共享同一块 GPU 时,内存效率为何总是“打架”?量化模型明明更省显存,但实

    阅读全文
  • 文章封面

    万字长文解答为何LLM同问不同答?OpenAI前CTO团队最新研究让大模型结果可复现

    作者:机智流发布日期:2025-09-15 23:34:37

    本文由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部编译校对原文:Defeating Nondeterminism in LLM Inference — Thinking Mach

    阅读全文
上一页下一页