全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    DeepSeek-V3.2背后的国产算子编程语言TileLang是什么?如何保持性能领先的同时减少6倍代码量?

    作者:机智流发布日期:2025-09-29 21:03:17

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对引言今天傍晚,DeepSeek-V3.2-Exp模型正式发布并开源。该模型引入了稀疏Attention架构,旨在降低计算资源消耗并提升模型推

    阅读全文
  • 文章封面

    DeepSeek-V3.2-Exp 技术报告解读!全新稀疏注意力机制如何革新长文本处理效率

    作者:机智流发布日期:2025-09-29 21:03:17

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对在人工智能领域,处理超长文本一直是语言模型面临的重大挑战。无论是复杂文档分析、长篇对话生成,还是多轮推理任务,模型需要在保持高性能的同时应对

    阅读全文
  • 文章封面

    机智流团队首份研究!全球首个音文对齐“慢思考”反诈数据集与生成框架开源发布,斩获ACM Multimedia 2025

    作者:机智流发布日期:2025-09-28 23:11:48

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对导语电信诈骗的阴影笼罩全球,每年造成的经济损失高达万亿美元,如同一头难以驯服的猛兽。传统的反诈手段在日益狡猾的骗术面前,常常显得力不从心。当

    阅读全文
  • 文章封面

    Anthropic 复盘 Claude 回复质量降低的三个Infra问题

    作者:机智流发布日期:2025-09-27 22:30:45

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对原文链接:https://www.anthropic.com/engineering/a-postmortem-of-thr

    阅读全文
  • 文章封面

    CoRL25|仅10-20个样本,成功率76.7%!ControlVLA框架让机器人“秒懂”新任务,微调效率提升近4倍

    作者:机智流发布日期:2025-09-26 20:30:00

    全文约 3300 字,预计阅读时间 10 分钟近年来,预训练VLA (Vision-Language-Action) 模型展现出极大的潜力,但要让机器人学会新任务,仍需依赖大规模、精确的动作序列。为解

    阅读全文
  • 文章封面

    SciReasoner、Seedream 4、Hunyuan3D-Omni技术报告|今日HF论文20篇

    作者:机智流发布日期:2025-09-26 20:30:00

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对(1) SciReasoner: Laying the Scientific Reasoning Ground Across Discipl

    阅读全文
  • 文章封面

    国内开发者专属Git教程:4步掌握代码管理+分支合并+远程协作(附Gitee/GitHub双平台教程)

    作者:机智流发布日期:2025-09-25 22:13:14

    作者:李剑锋全文约 6400 字,预计阅读时间 20 分钟简介Git 是一个分布式版本控制系统(Distributed Version Control System, DVCS),最初由 Linux

    阅读全文
  • 文章封面

    0925:云栖大会通义集中发布6款模型+1个全新品牌|Meta FAIR发布代码世界模型CWM|英伟达开源Audio2Face

    作者:机智流发布日期:2025-09-25 22:13:14

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对新闻资讯通义团队云栖大会集中发布:6款模型+1个全新品牌在云栖大会上,通义大模型团队一口气发布 6款全新模型 和 1个全新品牌,全面覆盖多模

    阅读全文
  • 文章封面

    项目分享|FreeKnowledge-AI:免费、高效、可信赖的外部知识增强搜索引擎,远超付费API的准确率表现

    作者:机智流发布日期:2025-09-24 22:34:33

    本文来自社区同学投稿本项目正积极参与AI Agent2025 全球专项赛,如果您认可我们的项目,希望能得到您的支持。您可以扫描下方图片中的二维码,为我们投出宝贵的助力票。需要注意的是,投票时间为202

    阅读全文
  • 文章封面

    新强化学习算法:腾讯RLPT、字节MAPO|HF 今日论文 18 篇

    作者:机智流发布日期:2025-09-24 22:34:33

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对(1) Baseer: A Vision-Language Model for Arabic Document-to-Markdown OC

    阅读全文
  • 文章封面

    聊聊大模型推理系统之Hetis:如何让“高低配”GPU集群跑出2.25倍吞吐?

    作者:机智流发布日期:2025-09-23 22:27:03

    本文由 Intern-S1 等 AI 生成,机智流编辑部校对在大模型时代,算力需求如潮水般上涨。然而,现实中的生产集群往往并非清一色的顶级显卡,而是由A100、3090甚至老旧的P100等不同性能和内

    阅读全文
  • 文章封面

    HF今日论文33篇|Less is More for Agency、Qwen3-Omni技术报告

    作者:机智流发布日期:2025-09-23 22:27:03

    论文选自 HuggingFace 每日论文,解读由 Intern-S1 等 AI 生成(1) LIMI: Less is More for Agency论文简介:由上海人工智能实验室、清华大学、复旦大

    阅读全文
  • 文章封面

    搜索已死:AI时代的购物将何去何从?

    作者:机智流发布日期:2025-09-22 22:45:00

    文章编译自a16z合伙人们的最新播客[1],探讨AI时代搜索的衰落与购物模式的变革,由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部润色校对。主要观点:AI Agent将取代传统关

    阅读全文
  • 文章封面

    聊聊阿里的新深度研究框架:WebWeaver 如何通过双智能体突破传统开源方案“先搜后写”和““静态大纲引导搜索”两种范式

    作者:机智流发布日期:2025-09-21 22:44:41

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对不知道你有没有这样的感受,在使用各家大模型的深度研究时,让大语言模型自行查阅一个网页及其子网页的信息并总结时,感觉效果还不错

    阅读全文
  • 文章封面

    SGLang case study:W4A8 GroupGEMM 学习

    作者:机智流发布日期:2025-09-20 21:39:16

    作者:企鹅火烈鸟视频资源:https://www.bilibili.com/video/BV11tMwznEmo?spm_id_from=333.788.videopod.sections&vd_so

    阅读全文
  • 文章封面

    书生大模型实战营第6期预报名火热开启,分享有礼!

    作者:机智流发布日期:2025-09-20 21:39:16

    书生大模型实战营第 6 期预报名火热开启,快扫码报名,提前锁定席位!在报名页面获取你的专属海报分享给好友,并邀请他们报名,还能获得丰厚算力激励。更多课程亮点与奖励详情请见下图。-- 完 --机智流推荐

    阅读全文
  • 文章封面

    LLM真能读懂报表吗?EMNLP'25首个工业级表格生成报告基准T2R-bench:最强大模型仅得62分

    作者:机智流发布日期:2025-09-19 21:30:00

    本文来自社区投稿,单位:中国电信人工智能研究院研究方向:表格理解和大语言模型论文标题: T2R-bench: A Benchmark for Generating Article-Level Repo

    阅读全文
  • 文章封面

    抢先 Qwen Next?腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

    作者:机智流发布日期:2025-09-18 21:20:15

    作者:可乐好爽、企鹅火烈鸟研究团队:腾讯 PCG 内服内容算法中心团队大语言模型在我们生活中越来越常用,如今我们用LLM做对话、写代码、解数学题的时候,不知道大家有没有过这样的困扰:明明模型思路很对,

    阅读全文
  • 文章封面

    具身操作大模型InternVLA·A1上线,助力实现高动态场景下的多机器人协作 | 具身智能开源周 Day4

    作者:机智流发布日期:2025-09-18 21:20:15

    本文转载自「书生Intern」InternVLA·A1是上海人工智能实验室(上海AI实验室)推出的首个理解、想象、执行一体化具身操作大模型,基于实验室自研的虚实混合操作数据集InternData·A1

    阅读全文
  • 文章封面

    日报:通义DeepResearch开源,重塑AI科研流程|面壁智能发布SOTA语音生成基座模型

    作者:机智流发布日期:2025-09-18 21:20:15

    作者:yanbo新闻资讯面壁智能发布VoxCPM:语音生成媲美真人,声音复刻逼真面壁智能携手清华大学深圳国际研究生院推出 0.5B 参数语音生成基座模型 VoxCPM。该模型在 自然度、音色相似度和韵

    阅读全文
  • 文章封面

    从“全量记忆”到“智能裁剪”:LangChain 新记忆模式实战指南

    作者:机智流发布日期:2025-09-17 22:34:07

    作者:李剑锋前言在上节课里LangChain 新一代记忆管理:RunnableWithMessageHistory 全面解析与实战,我们其实讲到了如何使用 LangChain 里 RunnableWi

    阅读全文
  • 文章封面

    阿里通义今日狂发6篇论文| 霸榜HF今日论文

    作者:机智流发布日期:2025-09-17 22:34:07

    今天打开 Hugging Face Daily Paper 惊呆了,看到了 6 篇阿里通义实验室的论文。论文选自 Hugging Face 每日论文,解读由 Intern-S1 等AI生成。(1) W

    阅读全文
  • 文章封面

    聊聊大模型推理系统之FineServe突破混精大模型服务瓶颈:SLO达标率提升2.2倍的三大创新

    作者:机智流发布日期:2025-09-16 22:29:36

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对你是否想过,当多个不同精度的大语言模型(LLM)共享同一块 GPU 时,内存效率为何总是“打架”?量化模型明明更省显存,但实

    阅读全文
  • 文章封面

    万字长文解答为何LLM同问不同答?OpenAI前CTO团队最新研究让大模型结果可复现

    作者:机智流发布日期:2025-09-15 23:34:37

    本文由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部编译校对原文:Defeating Nondeterminism in LLM Inference — Thinking Mach

    阅读全文
  • 文章封面

    VLA-Adapter:北邮等团队以0.5B参数实现机器人智能新高度,还无需预训练

    作者:机智流发布日期:2025-09-14 21:07:20

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对在人工智能与机器人技术迅猛发展的今天,如何让机器人更高效、更智能地理解环境、执行任务,成为了学术界与工业界共同关注的焦点。传

    阅读全文
  • 文章封面

    Parallel-R1 等|HF本周论文TOP20

    作者:机智流发布日期:2025-09-14 21:07:20

    🔥论文选自 Hugging Face 本周论文,解读由 Intern-S1 生成可能有误!(1) Sharing is Caring: Efficient LM Post-Training with

    阅读全文
  • 文章封面

    理解和生成让任务真的能相互受益吗,还是仅仅共存?北大&百度UAE框架,统一视觉理解与生成,实现多模态模型新突破

    作者:机智流发布日期:2025-09-13 23:45:58

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对在多模态人工智能领域,一个长期困扰研究者的难题是:理解任务(如图像到文本的转换)和生成任务(如文本到图像的合成)真的能相互促

    阅读全文
  • 文章封面

    聊聊大模型推理系统之Q-Infer技术突破:GPU-CPU协同推理提速3倍背后的三大创新

    作者:机智流发布日期:2025-09-12 22:00:00

    全文约 2000 字,预计阅读时间 7 分钟你是否知道,当前大模型推理系统在面对高并发请求时,常常陷入“低延迟”与“高吞吐”不可兼得的两难境地?一边是聊天机器人需要秒级响应,另一边是批量数据处理追求整

    阅读全文
  • 文章封面

    不蒸馏也超强?揭秘端到端文档OCR模型 POINTS-Reader

    作者:机智流发布日期:2025-09-12 22:00:00

    目前论文已经被 EMNLP 2025 主会录取,同时模型已经开源论文: https://huggingface.co/papers/2509.01215Github: https://github.c

    阅读全文
  • 文章封面

    Voice Agent 全球开发者比赛,TEN Dev Challenge 2025 等你来战!

    作者:机智流发布日期:2025-09-12 22:00:00

    TEN Dev Challenge 2025 全球开发者大赛现已启动,本次赛事聚焦实时交互与对话式AI领域,面向全球开发者开放参与通道。无论您是独立开发者,还是 3 人以内的小型开发团队,均可通过线上

    阅读全文
上一页下一页