机智流

美团杀入开源大模型混战：LongCat登场，推理速度直破100 Token/s
作者：机智流发布日期：2025-08-31 23:51:03
本文转载自「AI 寒武纪」美团也推出一款名为 LongCat-Flash 的非推理开源（MIT）大模型，总参数量为 5600亿， MoE架构，激活 186亿至313亿参数（平均约270亿），模型性能
阅读全文
CUTLASS：通过张量和空间表述处理多维数据的利器
作者：机智流发布日期：2025-08-30 22:51:32
原文链接：https://developer.nvidia.com/blog/cutlass-principled-abstractions-for-handling-multidimensional
阅读全文
开源多模态大模型新突破，书生·万象3.5发布，通用能力、推理能力与部署效率全面升级
作者：机智流发布日期：2025-08-30 22:51:32
转载自书生Intern通往通用人工智能（AGI）的探索，不仅是技术的突破，更关乎体验的革新。多模态大模型通过融合视觉与语言等多维信息，让AI能够像人一样理解世界、解决问题，为用户带来更流畅、更可信赖的
阅读全文
万字上文！从零到精通，开启你的Javascript动态交互能力之路
作者：机智流发布日期：2025-08-29 23:15:00
作者：李剑锋基本语法变量与常量一、变量变量是用于存储数据的容器，在程序运行过程中，其值可以改变。在python中，变量与常量其实没有本质上的区别，我们都可以通过赋值的方式简单的创建变量和常量。x =
阅读全文
GMI Cloud 推理引擎平台：出海开发者的 API 调用首选，OpenRouter 调用量持续走高！
作者：机智流发布日期：2025-08-29 23:15:00
摘要：GMI Cloud 推理引擎平台 Inference Engine 上新多款 LLM、Video 模型，速度快、质量高、性价比高，欢迎到 GMI Cloud 官网体验。限时开启线上体验活动，活动
阅读全文
工具调用推理只是花瓶，还是真的让大模型更聪明？腾讯清华团队揭秘工具集成推理的奥秘
作者：机智流发布日期：2025-08-28 23:38:26
本文由 Intern-S1、Qwen3 等 AI 生成，下方精简版播客由 ListenHub AI 生成全文约 4000 字，预计阅读时间 12 分钟近年来，大语言模型（LLMs）在自然语言处理领域取
阅读全文
CVPR2025 | g3D-LF让机器人“看懂”3D空间、“听懂”复杂语言，无需LLM，但导航、问答一气呵成
作者：机智流发布日期：2025-08-27 21:30:27
全文约 6500 字，预计阅读时间 20 分钟。下方精简版播客由ListenHub AI 生成当家庭服务机器人接到 “从客厅出发，经过卧室的床进入浴室，打开浴缸水龙头” 的指令时，它需要跨越两道关键鸿
阅读全文
漫游Embedding高维向量空间
作者：机智流发布日期：2025-08-27 21:30:27
本文来自社区投稿，作者：谢志军引言初看embedding，一组由简单的正数或负数组成的数组，它们是某个高维向量空间的坐标，映射了语义空间的方向，同时它们也是LLM矩阵运算的组成单元，是attentio
阅读全文
聊聊大模型推理系统之 Arrow：自适应调度实现请求吞吐提升7.78倍背后的三大创新
作者：机智流发布日期：2025-08-26 22:30:00
全文约 1800 字，预计阅读时间 5 分钟在大模型（LLM）推理服务中，如何在输入/输出长度剧烈波动的现实场景下，依然保持高吞吐与低延迟？传统静态资源分配策略往往导致计算资源严重浪费。近期，来自中国
阅读全文
1.5 倍加速 MoE 训练：从零构建基于 Blackwell 的 MXFP8 Kernels
作者：机智流发布日期：2025-08-25 23:59:00
文章翻译自：https://cursor.com/cn/blog/kernelsCursor致力于打造全球最佳的 AI 编程模型，但训练大型语言模型成本高昂。例如，我们最大的内部模型在数万个 GPU
阅读全文
手机也能写代码了？实测安卓Termux配Claude，随地大小编成为现实
作者：机智流发布日期：2025-08-25 23:59:00
最近编程越来越火了，我也试了试用 Termux 配 Claude Code 在手机上写代码，发现体验还真不错。说起来也挺魔幻的，以前写代码必须坐在电脑前，现在躺床上都能敲代码。手机24小时不离身，编程
阅读全文
3D/4D World Model（WM）近期发展的总结和思考
作者：机智流发布日期：2025-08-24 22:45:00
本文作者明仔 matrix，由机智流编辑部校对。说在前面的话有关具身智能，在今年前三季度的大部分工作和思考仍旧集中在数据的收集和数据的利用上——即如何高效的利用视频的示例数据去训练一个性能表现都不错
阅读全文
港大联合月之暗面发布OpenCUA：32B模型力压GPT-4o登顶CUA榜，还提供端到端的CUA研究解决方案！
作者：机智流发布日期：2025-08-23 23:00:00
本文由被奴役的机智流AI生成，机智流编辑部校对。播客由ListenHub AI生成近年来，视觉语言模型（VLMs）驱动的计算机使用代理（CUAs，Computer-Use Agents）正成为AI领域
阅读全文
中国人工智能学会丨AI Agent全球专项赛重磅来袭：百万奖金+资源加持，共赴AI创新盛宴！
作者：机智流发布日期：2025-08-23 23:00:00
🌟 大赛亮点速览2025年被誉为Agent AI商业化元年，AI Agent技术正从实验室走向产业一线。中国人工智能学会主办的"场景驱动·数智强国"——2025第三届全国人工智能应用场景创新挑战赛AI
阅读全文
Intern-S1 技术报告深度解读：从通用到专业，如何实现卓越的多模态和科学推理能力
作者：机智流发布日期：2025-08-22 18:33:04
全文约 7000 字，预计阅读时间 21 分钟。欢迎收听下方精简版播客在人工智能飞速发展的今天，基础模型的竞争已从通用领域逐步延伸至高价值的科学专业领域。无论是分子结构分析、时间序列信号处理，还是复杂
阅读全文
【直播预告】vLLM Community Meetup 上海站
作者：机智流发布日期：2025-08-22 18:33:04
📅 直播时间：8 月 23 日下午 2 点立即预约直播活动日程安排
阅读全文
LangGraph 高级实战：让 AI 会记忆、能暂停、可插手的断点恢复与流式控制
作者：机智流发布日期：2025-08-21 23:12:29
作者：李剑锋前言在上一节课中（万字长文！从 0 到 1 搭建基于 LangGraph 的 AI Agent），我们已经完成了一个可正常运行的 LangGraph 智能体框架，能够根据需求调用外部工具，
阅读全文
一文带你快速入门大模型工作流都在用的RAG和GraphRAG技术
作者：机智流发布日期：2025-08-20 23:09:00
全文约 1800 字，预计阅读时间 5 分钟RAG（Retrieval - Augmented Generation，检索增强生成）技术最早可追溯至2020年被正式提出。如今，伴随大模型技术的飞速迭
阅读全文
最强开源VLM“华山论剑”丨多模态专场直播
作者：机智流发布日期：2025-08-20 23:09:00
最近，Intern-S1、MiniCPM-V-4、GLM-4.5V、Step3、OVIS 等多模态大模型纷纷开源，在大模型开源社区引发了热烈讨论。这些模型不仅在参数规模、训练范式和应用场景上各具特色，
阅读全文
聊聊大模型推理系统之华为云 xDeepServe：千卡级超节点规模下如何实现 50ms 时延的 LLM 推理？
作者：机智流发布日期：2025-08-19 23:30:45
全文约 2000 字，预计阅读时间 6 分钟相信不少读者在 WAIC2025 大会上已经被华为云的 CloudMatrix384 超节点震撼到了。CloudMatrix 384对标英伟达GB200 N
阅读全文
0819资讯：DeepSeek V3.1开源｜Qwen 上线Qwen-Image-Edit｜谷歌强势开源Gemma 3 270M
作者：机智流发布日期：2025-08-19 23:30:45
全文约 1600 字，预计阅读时间 5 分钟新闻资讯DeepSeek V3.1 发布官方通知上下文长度拓展至128K（虽然 Huggingface 上 DeepSeek V3 的模型卡上写着上下文长度
阅读全文
观点｜英伟达：小语言模型才是 AI 智能体的未来
作者：机智流发布日期：2025-08-18 23:18:39
全文约 3800 字，预计阅读时间 15 分钟。也可以点击下方音频，收听本文的简洁版播客（播客由 ListenHubAI 生成）自 2 月份 DeepSeek 火爆全网以来，大语言模型（LLMs）凭借
阅读全文
中国人工智能学会丨AI Agent全球专项赛重磅来袭：百万奖金+资源加持，共赴AI创新盛宴！
作者：机智流发布日期：2025-08-18 23:18:39
🌟 大赛亮点速览2025年被誉为Agent AI商业化元年，AI Agent技术正从实验室走向产业一线。中国人工智能学会主办的"场景驱动·数智强国"——2025第三届全国人工智能应用场景创新挑战赛AI
阅读全文
WE-MATH2.0解锁数学推理新高度！北京邮电大学与腾讯WeChat Vision联手打造从小学到大学的多层级数学推理知识体系
作者：机智流发布日期：2025-08-17 23:59:35
近年来，随着多模态大语言模型（MLLMs）在视觉问答、图像识别等领域的飞速发展，其在复杂数学推理任务中的表现却始终是一大挑战。如何让AI不仅能“看懂”数学题目中的图像，还能像人类一样进行逻辑严密的推理
阅读全文
PaperScope 本周末更新
作者：机智流发布日期：2025-08-17 23:59:35
阅读全文
细数CUTLASS 3.x中的内核设计抽象
作者：机智流发布日期：2025-08-16 23:12:15
作者：企鹅火烈鸟原文链接：https://developer.nvidia.com/blog/cutlass-3-x-orthogonal-reusable-and-composable-abstra
阅读全文
AI 团队集合｜2025 第七届浦东新区人工智能创新应用竞赛正在报名！
作者：机智流发布日期：2025-08-16 23:12:15
浦东新区作为人工智能创新高地，再次点燃科技盛宴！2025 第七届浦东新区人工智能创新应用竞赛火热启动，现在正是报名黄金期！不管你是 AI 领域的技术大牛，还是怀揣奇思妙想的创新小队，这场盛宴都为你量身
阅读全文
GUI-Agent 领域新作！蚂蚁集团发布 UI-Venus，以截图驱动的智能交互，刷新行业标杆！
作者：机智流发布日期：2025-08-15 22:05:57
图1：UI-Venus在多个UI定位与导航基准测试中的SOTA性能。该图展示了UI-Venus在ScreenSpot-V2、ScreenSpot-Pro和AndroidWorld等基准测试中的卓越表现
阅读全文
欢迎报名参加｜ Shanghai vLLM Community Meetup (2025年8月23日)
作者：机智流发布日期：2025-08-15 22:05:57
阅读全文
本地也能玩转AI图片创作？腾讯3B开源模型实测：精准又轻便，统一生成理解，手把手教你部署
作者：机智流发布日期：2025-08-14 19:39:05
前几天小编在 HuggingFace 上摸鱼的时候，发现我们的老朋友，腾讯BAC团队（PCG内服基础算法中心）新开源了一款小尺寸多模态大模型 — TBAC-UniImage-3B[1]。在 TIIF
阅读全文

上一页下一页