0610资讯:1.93bit量化版DeepSeek-R1力压Claude 4 Sonnet | LangGraph首个稳定版发布
全文约 2300 字,预计阅读时间 5 分钟新闻资讯苹果 WWDC2025:设计革新与 AI 探索北京时间 6 月 10 日凌晨 1 点,苹果 WWDC25 全球开发者大会盛大举行。此次大会聚焦软件更
阅读全文全文约 2300 字,预计阅读时间 5 分钟新闻资讯苹果 WWDC2025:设计革新与 AI 探索北京时间 6 月 10 日凌晨 1 点,苹果 WWDC25 全球开发者大会盛大举行。此次大会聚焦软件更
阅读全文本文来自社区同学投稿近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大
阅读全文作者:Google Gemini今日趋势概括今日GitHub趋势榜上的项目广泛分布于多个热门技术领域。人工智能与机器学习依旧是焦点,涌现了大量关于大型语言模型(LLM)优化、AI代理内存管理、检索增强
阅读全文本文来自社区同学投稿,作者:复旦大学牛轲引言计算机辅助设计(CAD)在现代工业制造中扮演着至关重要的角色。其中,正交投影推理作为CAD设计、制造与仿真流程的基础,其精度与可编辑性对整体工作流程至关重要
阅读全文作者:企鹅火烈鸟文章转载自:https://sander.ai/2022/01/31/diffusion.html2019年底,自从宋(Song)和埃蒙(Ermon)发表了他们的那篇重磅论文后,扩散模
阅读全文随着大模型能力不断下沉,AI 的落地路径正在发生结构性变化——多模态与智能体(Agent)正重新定义“应用接入层”,成为系统级能力;与此同时,推理性能、数据体系与工具链协作,也进入新一轮重构周期。即将
阅读全文作者:InternLM、Qwen 等 LLM 和人时光飞逝, AI 界三大顶会之一的 CVPR 将在下周 6.11-6.15 于美国田纳西州纳什维尔召开。本次会议共收到 13,008 份有效投稿,最终
阅读全文本文来自社区同学投稿现如今,视频生成技术正以前所未有的速度革新着我们的视觉内容创作方式。从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模型正变得越来越重要。如何准确评估这些
阅读全文作者:李剑锋简介在之前的课程中,我们主要是通过 API 的方式与 LangChain 框架进行联动。但最近在筹备自己的大模型教学系列课程时,我开始探索:能不能将国内 ModelScope 平台上的开源
阅读全文全文约 3000 字,预计阅读时间 8 分钟原文链接:https://arxiv.org/pdf/2411.14869在具身智能系统中,3D 感知算法是极为关键的存在,它宛如智能体的 “慧眼”,助力其
阅读全文本文转载自书生Intern,原文来自社区投稿,作者尖米、张富才。书生大模型实战营第5期已正式启动,本期实战营新增「论文分类打榜赛」,以帮助学员更好地掌握大模型技能。本文将手把手带领大家用 ms-swi
阅读全文全文约 2300 字,预计阅读时间 6 分钟上个月底,我们熟知的那个小米新组建的 LLM-Core 团队开源了四款 MiMo-7B 系列模型。近日他们又推出了一项令人振奋的工作——开源了MiMo-VL
阅读全文本文转载自 JackCui这周,Cursor 的主设计师 Ryo Lu 在 X 上亲自分享了一条关于如何正确使用 Cursor 的实践帖,并强调了一个核心理念:使用得当 = 快速、干净的代码使用不当
阅读全文作者:洛1. 项目背景Local Deep Researcher 是一个本地化运行的 AI 研究助手,旨在通过结合大语言模型(LLM)和搜索工具,实现自动化深度研究并生成结构化报告。该项目由 Lang
阅读全文🌟 欢迎参加 Gradio & MCP 智能体主题黑客松!准备好了吗?一场以智能体 (Agent) 和模型上下文协议 (Model Context Protocol,简称 MCP) 为核心的全球在线黑
阅读全文全文约 1400 字,预计阅读时间 5 分钟在大语言模型(LLM)广泛应用的当下,如何在保证低延迟的前提下最大化吞吐量成为行业亟待解决的问题。近段时间,由新加坡国立大学(NUS)和中国科学技术大学(U
阅读全文本文来自社区同学投稿,作者:复旦大学余海洋导读:近日字节和复旦团队提出了一种基于置信度的自适应推理框架(CAR),通过评估模型困惑度(PPL)动态选择短回答或长文本推理,实现准确性和效率的平衡。实验效
阅读全文全文约 3200 字,预计阅读时间 9 分钟说在前面的话以往real2sim2real的叙事方式和贡献方式都是通过摸索NeRF(神经辐射场)/3DGS(3D 高斯溅射)等高质量的稠密重建技术,更好地渲
阅读全文本文由社区同学投稿导读:RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!Deepseek-R1 的成功已经证明了纯 RL
阅读全文全文约 3200 字,预计阅读时间 9 分钟近年来,大语言模型(LLMs)凭借强大的推理能力在数学问题求解、逻辑推理和智能助手等领域展现出惊人潜力。然而,复杂任务需要模型进行冗长的“链式思考”(Cha
阅读全文作者:李剑锋前言在上节课中,我们详细学习了如何利用Function Calling机制实现文本标注、情感分析和结构化信息抽取任务,展示了Function Calling在处理结构化数据方面的巨大优势。
阅读全文本文转载自 RTE 开发者社区,编者:RTE 施苏娜、傅丰元 全文约 5200 字,预计阅读时间 13 分钟前言:我们用 ListenHubAI 制作了一个3分钟的短播客,帮助大家快速了解 Proje
阅读全文作者:HowardZhangdqs资讯GoogleI/O 2025开发者大会:AI与AR的创新盛宴Google I/O 2025于5月20日至21日在加州山景城举行,聚焦人工智能(AI)、Androi
阅读全文全文约 1800 字,预计阅读时间 6 分钟随着大语言模型(Large Language Models, LLMs)在各种任务中的广泛应用,如何优化大规模请求下的成本和响应时间成为关键挑战。最近几个月
阅读全文AI资讯日报 - 05.20 洞悉AI前沿,把握技术脉搏 🚀 Omni-R1:音频问答的技术革命 MIT、IBM等研究团队联合推出Omni-R1音频问答系统,在多模态语言模型领域取得重大突破。通过G
阅读全文导读:今天试用 ListenHub AI 将日报做成播客形式,真的太惊艳了,深情并茂,效果几乎可以媲美真人了,分享给大家,我们还为大家准备了 ListenHub AI 专属邀请码。也欢迎大家关注 机智
阅读全文https://io.google/2025/谷歌 I/O 大会 2025 将于北京时间 2025 年 5 月 21 日 (周三) 凌晨 1 点开始分享 Google Key Note,Develop
阅读全文全文约 2800 字,预计阅读时间 8 分钟https://arxiv.org/pdf/2505.07773在人工智能(AI)的快速发展中,大语言模型(LLMs)凭借其强大的文本生成能力席卷了多个领域
阅读全文作者:Lilian Weng,机器之心编译学习大模型的优质博客又更新了!最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长长长长博客《Why We T
阅读全文