本文转载自 PaperAgent国庆长假也不放过,阿里通义千问真的是卷疯了,悄悄放出6个开源模型权重,体积更小的Qwen3-VL:Qwen3-VL-30B-A3B-Instruct 与 Qwen3-V
阅读全文AI 应用战争,Sora 打响了第一枪。作者|周永亮编辑|郑玄99% 的人都搞错了。「Sora 不是『AI 版抖音』,它更接近『AI 版 ins 或朋友圈』。」这是 Lovart 创始人陈冕,在与极客
阅读全文本文选自 Hugging Face Daily Paper 九月论文,论文解读由 Intern-S1 等 AI 生成。(1) Sharing is Caring: Efficient LM Post-
阅读全文🔥今年年初春节期间我们举办了「HF论文茶话会」在社区受到广泛关注,这个国庆假期我们将举办国庆假期Hugging Face八日游活动,将和大家一起盘点2025 年第 3 季度 Hugging Face
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对引言今天傍晚,DeepSeek-V3.2-Exp模型正式发布并开源。该模型引入了稀疏Attention架构,旨在降低计算资源消耗并提升模型推
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对在人工智能领域,处理超长文本一直是语言模型面临的重大挑战。无论是复杂文档分析、长篇对话生成,还是多轮推理任务,模型需要在保持高性能的同时应对
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对导语电信诈骗的阴影笼罩全球,每年造成的经济损失高达万亿美元,如同一头难以驯服的猛兽。传统的反诈手段在日益狡猾的骗术面前,常常显得力不从心。当
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对原文链接:https://www.anthropic.com/engineering/a-postmortem-of-thr
阅读全文全文约 3300 字,预计阅读时间 10 分钟近年来,预训练VLA (Vision-Language-Action) 模型展现出极大的潜力,但要让机器人学会新任务,仍需依赖大规模、精确的动作序列。为解
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对(1) SciReasoner: Laying the Scientific Reasoning Ground Across Discipl
阅读全文作者:李剑锋全文约 6400 字,预计阅读时间 20 分钟简介Git 是一个分布式版本控制系统(Distributed Version Control System, DVCS),最初由 Linux
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对新闻资讯通义团队云栖大会集中发布:6款模型+1个全新品牌在云栖大会上,通义大模型团队一口气发布 6款全新模型 和 1个全新品牌,全面覆盖多模
阅读全文本文来自社区同学投稿本项目正积极参与AI Agent2025 全球专项赛,如果您认可我们的项目,希望能得到您的支持。您可以扫描下方图片中的二维码,为我们投出宝贵的助力票。需要注意的是,投票时间为202
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对(1) Baseer: A Vision-Language Model for Arabic Document-to-Markdown OC
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对在大模型时代,算力需求如潮水般上涨。然而,现实中的生产集群往往并非清一色的顶级显卡,而是由A100、3090甚至老旧的P100等不同性能和内
阅读全文论文选自 HuggingFace 每日论文,解读由 Intern-S1 等 AI 生成(1) LIMI: Less is More for Agency论文简介:由上海人工智能实验室、清华大学、复旦大
阅读全文文章编译自a16z合伙人们的最新播客[1],探讨AI时代搜索的衰落与购物模式的变革,由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部润色校对。主要观点:AI Agent将取代传统关
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对不知道你有没有这样的感受,在使用各家大模型的深度研究时,让大语言模型自行查阅一个网页及其子网页的信息并总结时,感觉效果还不错
阅读全文作者:企鹅火烈鸟视频资源:https://www.bilibili.com/video/BV11tMwznEmo?spm_id_from=333.788.videopod.sections&vd_so
阅读全文书生大模型实战营第 6 期预报名火热开启,快扫码报名,提前锁定席位!在报名页面获取你的专属海报分享给好友,并邀请他们报名,还能获得丰厚算力激励。更多课程亮点与奖励详情请见下图。-- 完 --机智流推荐
阅读全文本文来自社区投稿,单位:中国电信人工智能研究院研究方向:表格理解和大语言模型论文标题: T2R-bench: A Benchmark for Generating Article-Level Repo
阅读全文作者:可乐好爽、企鹅火烈鸟研究团队:腾讯 PCG 内服内容算法中心团队大语言模型在我们生活中越来越常用,如今我们用LLM做对话、写代码、解数学题的时候,不知道大家有没有过这样的困扰:明明模型思路很对,
阅读全文本文转载自「书生Intern」InternVLA·A1是上海人工智能实验室(上海AI实验室)推出的首个理解、想象、执行一体化具身操作大模型,基于实验室自研的虚实混合操作数据集InternData·A1
阅读全文作者:yanbo新闻资讯面壁智能发布VoxCPM:语音生成媲美真人,声音复刻逼真面壁智能携手清华大学深圳国际研究生院推出 0.5B 参数语音生成基座模型 VoxCPM。该模型在 自然度、音色相似度和韵
阅读全文作者:李剑锋前言在上节课里LangChain 新一代记忆管理:RunnableWithMessageHistory 全面解析与实战,我们其实讲到了如何使用 LangChain 里 RunnableWi
阅读全文今天打开 Hugging Face Daily Paper 惊呆了,看到了 6 篇阿里通义实验室的论文。论文选自 Hugging Face 每日论文,解读由 Intern-S1 等AI生成。(1) W
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对你是否想过,当多个不同精度的大语言模型(LLM)共享同一块 GPU 时,内存效率为何总是“打架”?量化模型明明更省显存,但实
阅读全文本文由 Intern-S1、Qwen3 等 AI 翻译, 由机智流编辑部编译校对原文:Defeating Nondeterminism in LLM Inference — Thinking Mach
阅读全文