全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Qwen3 嵌入与重排序(技术报告):复杂指令下的文本处理新能手(万字)

    作者:觉察流发布日期:2025-06-10 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 前些天 Qwen3 冷不丁的发布了 Embedding 让人惊喜。已经有小伙伴做了自己业务上的测试,据说挺好用,一起看看

    阅读全文
  • 文章封面

    GitHub Trending 日报【2025-06-08】

    作者:觉察流发布日期:2025-06-09 00:03:47

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 以下内容作者是 grok-2-1212” 今日趋势今天GitHub上最受关注的项目主要集中在人工智能和开发工具领域。特别

    阅读全文
  • 文章封面

    Qwen:PARSCALE 让语言模型在并行中飞跃(万字)

    作者:觉察流发布日期:2025-06-08 08:15:55

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 传统的参数扩展和推理时间扩展方法面临着内存和时间成本的双重困境。PARSCALE,作为一种全新的并行扩展范式,通过增加并

    阅读全文
  • 文章封面

    RL 驱动 LLM 智能体:ML-Agent 创新自主机器学习工程(万字)

    作者:觉察流发布日期:2025-06-07 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在机器学习工程领域,自主智能体的研究正逐渐成为焦点。ML-Agent 为这一领域带来了新思路。它凭借创新的学习型 age

    阅读全文
  • 文章封面

    ALPHAONE(α1):LRM 自适应推理效率与准确性的平衡之道

    作者:觉察流发布日期:2025-06-06 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 大型推理模型(LRM)正不断突破复杂推理任务的边界。然而,它们在推理过程中常常陷入过度推理或推理不足的困境。如今,ALP

    阅读全文
  • 文章封面

    论智能体互联网的崛起:智能经济性驱动的价值转移与生态重构(二万字)

    作者:觉察流发布日期:2025-06-05 08:15:00

    “ 作者简介:侯宏,北京大学国家发展研究院管理学助理教授,承泽企业家研修项目学术主任,剑桥大学博士。在攻读博士学位前,在国内高科技行业有近十年工作经验,在多家公司历任咨询顾问、战略经理、战略部总经理、

    阅读全文
  • 文章封面

    NVIDIA 新成果:ProRL 拓展 LLM 推理边界(万字)

    作者:觉察流发布日期:2025-06-05 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ ProRL 方法通过长时间稳定训练与多样化任务组合,有效引导模型探索新推理路径,使 Nemotron-Research-

    阅读全文
  • 文章封面

    定义任务 + 合成数据:智能训练的高效引擎 —— Synthetic Data RL(万字)

    作者:觉察流发布日期:2025-06-01 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Synthetic Data RL 为我们提供了一种新的解决方案。它仅凭任务定义,就能生成合成数据并进行强化学习训练,无

    阅读全文
  • 文章封面

    MARFT:多智能体协作与强化学习微调的协同进化(万字)

    作者:觉察流发布日期:2025-05-31 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ MARFT(Multi-Agent Reinforcement Fine-Tuning)作为一种新兴技术,正以其独特的优

    阅读全文
  • 文章封面

    当异常奖励遇上 AI 推理:一场意料之外的智力提升(万字)

    作者:觉察流发布日期:2025-05-29 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 当随意的奖励信号仍可以大幅提升模型性能,就得重新思考:到底RL是在学习,还是在放大某种“先验”行为。” 大家好,我是肆〇

    阅读全文
  • 文章封面

    奖励推理模型(RRM):革新奖励模型的新范式(万字)

    作者:觉察流发布日期:2025-05-28 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Post-train 技术中的reward model(奖励模型)扮演着至关重要的角色。然而,传统奖励模型在利用测试时计

    阅读全文
  • 文章封面

    MMaDA:多模态大型扩散语言模型的创新突破(万字)

    作者:觉察流发布日期:2025-05-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ MMaDA(Multimodal Large Diffusion Language Models)正以其创新的统一扩散架

    阅读全文
  • 文章封面

    DeepSeek-V3:硬件与模型的完美统协,奏响 AI 高效新乐章(万字)

    作者:觉察流发布日期:2025-05-27 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ DeepSeek-V3 通过硬件感知的模型协同设计,在 2048 个 NVIDIA H800 GPU 上实现了成本高效的

    阅读全文
  • 文章封面

    混合推理模型(LHRM):平衡效率与推理能力的新范式

    作者:觉察流发布日期:2025-05-26 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在 AI 领域,大型推理模型(LRM)已逐步普及。然而,这些模型在实际应用中却暴露出过度思考的问题。所以,大型混合推理模

    阅读全文
  • 文章封面

    字节跳动 AdaCoT:基于强化学习的自适应推理触发方法(万字)

    作者:觉察流发布日期:2025-05-25 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 在人工智能领域,大型语言模型(LLM)正以前所未有的速度发展。然而,这些模型在处理复杂推理任务时仍面临诸多挑战,如数学问

    阅读全文
  • 文章封面

    Microsoft 推出 Magentic-UI:网页多智能体,革新式人机协作(万字)

    作者:觉察流发布日期:2025-05-24 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 微软推出 Magentic-UI,一款开源人机协作神器。它能让用户与 AI 共同规划和执行任务,关键操作前还会寻求用户许

    阅读全文
  • 文章封面

    Thinkless框架:让LLM学会“聪明偷懒”的智慧

    作者:觉察流发布日期:2025-05-24 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 新加坡国立大学的 Thinkless 框架,让 LLM 学会 “偷懒”,在简单问题上不再过度思考,效率提升高达 90%。

    阅读全文
  • 文章封面

    Anthropic 发布 Claude 4:为开发者带来的全新编程体验与机遇

    作者:觉察流发布日期:2025-05-23 08:25:07

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。 大家好,我是肆〇柒。Anthropic公司于2025年5月23日推出的Claude 4模型,它以卓越的编程能力和推理性能,

    阅读全文
  • 文章封面

    AdaptThink:推理模型的自适应思考范式

    作者:觉察流发布日期:2025-05-23 08:25:07

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AdaptThink 能让模型根据问题的难易程度,自动选择是否进行深度思考,从而在保持高准确率的同时,大幅降低推理成本。

    阅读全文
  • 文章封面

    LLM 协作革命:Group Think 如何重塑推理边界 (万字)

    作者:觉察流发布日期:2025-05-22 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 让一个模型拥有多个“智慧大脑”会有多强大?Group Think 现在让单个 LLM 模拟多个并行推理智能体,推理速度提

    阅读全文
  • 文章封面

    系统提示(Prompt)优化:基于元学习的双层优化框架(万字)

    作者:觉察流发布日期:2025-05-21 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文介绍的基于元学习的双层系统提示优化框架(MetaSPO),通过协同优化系统提示和用户提示,不仅提升了 LLM 在多任

    阅读全文
  • 文章封面

    并行扩展(Parallel Scaling):一种新型语言模型扩展范式(万字)

    作者:觉察流发布日期:2025-05-20 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ PARSCALE 作为一种新型的语言模型扩展范式,通过增加并行计算次数 P,在保持参数规模几乎不变的情况下,能够显著提升

    阅读全文
  • 文章封面

    Qwen3:开源 LLM 的革新者与多语言先锋(万字)

    作者:觉察流发布日期:2025-05-20 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Qwen3 模型以其卓越的性能、效率和多语言能力,为开源大语言模型领域树立了新的标杆,引领着技术发展的新潮流。” 大家好

    阅读全文
  • 文章封面

    AWS 开源 Strands Agents SDK:用几行代码唤醒 AI 智能体(万字)

    作者:觉察流发布日期:2025-05-19 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AWS 开源的 Strands Agents SDK,以其强大的功能和简洁的开发方式,为开发者提供了一个全新的工具,让构

    阅读全文
  • 文章封面

    Windsurf 发 SWE-1:以数据+智能飞轮驱动软件工程 AI 进化

    作者:觉察流发布日期:2025-05-18 08:16:56

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ Windsurf 发布 SWE-1 模型家族深度嵌入开发流程,从代码编写到项目部署全程助力。它不仅让代码更高效,更让团队

    阅读全文
  • 文章封面

    进化智能体 AlphaEvolve:科学发现与算法优化的新引擎(万字)

    作者:觉察流发布日期:2025-05-17 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ AlphaEvolve 强大的进化能力和智能优化技术, 不仅在理论研究中取得了突破,更在实际应用中展现了巨大的价值。”

    阅读全文
  • 文章封面

    2025 生成式 AI 大棋局:全球数据报告里的趋势解读(万字)

    作者:觉察流发布日期:2025-05-16 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 生成式 AI 正以前所未有的速度重塑各行业格局。本文这份报告为我们提供了详尽的数据视角,揭示了哪些领域正面临冲击,哪些在

    阅读全文
  • 文章封面

    LLM 推理引擎综述:优化与效率的多维探索(万字综述)

    作者:觉察流发布日期:2025-05-15 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 本文盘点剖析了LLM推理引擎优化,从架构、推理过程到引擎分类,探索提升效率的奥秘,助力智能应用加速前行。” 大家好,我是

    阅读全文
  • 文章封面

    多模态推理模型(LMRM):从感知到推理的演变(2万字综述)

    作者:觉察流发布日期:2025-05-14 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 推理位于智能的核心,塑造了做出决策、得出结论和跨领域泛化的能力。在人工智能系统中,随着系统越来越多地在开放、不确定和多模

    阅读全文
  • 文章封面

    智能体式推理与工具集成:ARTIST 基于强化学习的新思路(万字)

    作者:觉察流发布日期:2025-05-13 08:15:00

    点击👇🏻可关注,文章来自🙋‍♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 大型语言模型(LLM)已在诸多领域落地应用,但却因依赖静态内部知识库和单一文本推理机制而遭遇瓶颈。复杂现实问题的求解,需

    阅读全文
上一页下一页