LangChain 新一代记忆管理:RunnableWithMessageHistory 全面解析与实战
作者:李剑锋简介在之前的课程里,我们其实也讲到了一部分 LangChain 相关的记忆内容,包括说:CoversationBufferMemory(保存全部记忆)ConversationBufferW
阅读全文作者:李剑锋简介在之前的课程里,我们其实也讲到了一部分 LangChain 相关的记忆内容,包括说:CoversationBufferMemory(保存全部记忆)ConversationBufferW
阅读全文全文约 1000 字,预计阅读时间 3 分钟新闻资讯1. 通义千问发布Qwen3-ASR-Flash:语音识别更准,还能听懂歌声通义千问团队正式推出语音识别模型 Qwen3-ASR-Flash。该模型
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对;下方简洁版播客由 ListenHub AI 生成想象这样一个场景:在工业流水线上,一台 Franka Panda 机械臂需
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部编辑校对近日,香港科技大学(HKUST)与AI公司MiniMax的联合团队,在arXiv上发表了一篇题为“WebExplorer
阅读全文新闻资讯Anthropic完成130亿美元融资,估值达1830亿美元创AI行业纪录Anthropic在9月初完成Series F轮融资,公司估值达到1830亿美元,创下AI行业新的估值纪录。Claud
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言:语言模型的“幻觉”难题在人工智能飞速发展的今天,大语言模型(LLMs)如ChatGPT、DeepSeek等已经成为我们
阅读全文Nano Banana 是谷歌最新、最强大的 AI 图像模型,其官方名称为 Gemini 2.5 Flash Image。Nano Banana 核心亮点:人物一致性:在多次编辑中,保持人物、宠物或物
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成引言:语言的深层游戏与AI的挑战在社交媒体时代,语言早已不再仅仅是传递信息的工具,它更像是一场充满创意与智慧的游戏。从抖音上的幽默段子到微博上的讽
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对随着大语言模型技术的爆发,智能体(Agent)已成为AI领域最炙手可热的研究方向。从自动处理邮件的个人助理,到能独立完成数据
阅读全文作者:李剑锋对象定义在 JavaScript 里,对象是键值对的集合,键(属性名)→ 值(任意类型:基本类型、对象、函数都行),最后用{}将其包裹起来即可。其典型用途就是描述实体(如 person)、
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对引言:机器人智能的新篇章在人工智能飞速发展的今天,机器人不再仅仅是执行简单指令的工具,而是逐渐成为能够与人类自然交互、理解复
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrat
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对论文链接:https://arxiv.org/html/2504.02263v1你是否想过,一个千亿参数的MoE(Mixtu
阅读全文大家好,我是刘聪NLP。8月31号,美团开源一个大模型,LongCat,560B的MoE模型,是一个非推理模型。看完他们的技术报告,感觉真在infra和模型结构研究上做了很多,里面真有不少细节!PS:
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对全文约 3600 字,预计阅读时间 10 分钟近年来,大语言模型(LLM)在自然语言处理领域掀起了技术革命。从简单的对话生成
阅读全文大家好,我是刘聪NLP。7月的最后一天,给大家盘点了7月国内的开源大模型!咱们8月也不例外,最后一天看看国内都开源了哪些大模型,看看哪些你知道,哪些你不知道,是时候在明天上班前查缺补漏了,别领导一问,
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对近年来,大语言模型(LLMs)在推理任务中的表现令人叹为观止,特别是在数学竞赛和复杂逻辑推理等高难度场景中。然而,传统的推理
阅读全文本文转载自「AI 寒武纪」 美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能
阅读全文原文链接:https://developer.nvidia.com/blog/cutlass-principled-abstractions-for-handling-multidimensional
阅读全文转载自书生Intern通往通用人工智能(AGI)的探索,不仅是技术的突破,更关乎体验的革新。多模态大模型通过融合视觉与语言等多维信息,让AI能够像人一样理解世界、解决问题,为用户带来更流畅、更可信赖的
阅读全文作者:李剑锋基本语法变量与常量一、变量变量是用于存储数据的容器,在程序运行过程中,其值可以改变。在python中,变量与常量其实没有本质上的区别,我们都可以通过赋值的方式简单的创建变量和常量。x =
阅读全文摘要:GMI Cloud 推理引擎平台 Inference Engine 上新多款 LLM、Video 模型,速度快、质量高、性价比高,欢迎到 GMI Cloud 官网体验。限时开启线上体验活动,活动
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成,下方精简版播客由 ListenHub AI 生成全文约 4000 字,预计阅读时间 12 分钟近年来,大语言模型(LLMs)在自然语言处理领域取
阅读全文全文约 6500 字,预计阅读时间 20 分钟。下方精简版播客由ListenHub AI 生成当家庭服务机器人接到 “从客厅出发,经过卧室的床进入浴室,打开浴缸水龙头” 的指令时,它需要跨越两道关键鸿
阅读全文本文来自社区投稿,作者:谢志军引言初看embedding,一组由简单的正数或负数组成的数组,它们是某个高维向量空间的坐标,映射了语义空间的方向,同时它们也是LLM矩阵运算的组成单元,是attentio
阅读全文全文约 1800 字,预计阅读时间 5 分钟在大模型(LLM)推理服务中,如何在输入/输出长度剧烈波动的现实场景下,依然保持高吞吐与低延迟?传统静态资源分配策略往往导致计算资源严重浪费。近期,来自中国
阅读全文文章翻译自:https://cursor.com/cn/blog/kernelsCursor致力于打造全球最佳的 AI 编程模型,但训练大型语言模型成本高昂。例如,我们最大的内部模型在数万个 GPU
阅读全文最近编程越来越火了,我也试了试用 Termux 配 Claude Code 在手机上写代码,发现体验还真不错。说起来也挺魔幻的,以前写代码必须坐在电脑前,现在躺床上都能敲代码。手机24小时不离身,编程
阅读全文本文作者明仔 matrix, 由机智流编辑部校对。说在前面的话有关具身智能,在今年前三季度的大部分工作和思考仍旧集中在数据的收集和数据的利用上——即如何高效的利用视频的示例数据去训练一个性能表现都不错
阅读全文本文由被奴役的机智流AI生成,机智流编辑部校对。播客由ListenHub AI生成近年来,视觉语言模型(VLMs)驱动的计算机使用代理(CUAs,Computer-Use Agents)正成为AI领域
阅读全文