全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    首家线下旗舰店深圳开业!徕芬的野心远不只是电动牙刷

    作者:智能Pro发布日期:2025-11-17 21:19:59

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2025 年 11 月 15 日,徕芬首家线下旗舰店在深圳 COCO Park 正式开业,雷科技

    阅读全文
  • 文章封面

    下周开庭!特斯拉正式起诉刘畊宏前东家无忧传媒

    作者:智能Pro发布日期:2025-11-17 21:19:59

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......11月17日消息,日前从浙江法院网处了解到,特斯拉(上海)有限公司与杭州无忧传媒有限公司新增了一

    阅读全文
  • 文章封面

    Omni模型如何统一理解文字、图像与音视频?一次听够美团LongCat、英伟达OmniVinci、蚂蚁Ming的技术实践

    作者:机智流发布日期:2025-11-17 20:58:36

    由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第五场 - Omni全模态大模型专场就在明

    阅读全文
  • 文章封面

    HF上周热门论文TOP20|字节跳动Lumine打造3D开放世界通用智能体,英伟达TiDAR融合扩散与自回归实现5.9倍加速

    作者:机智流发布日期:2025-11-17 20:58:36

    (1) Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds论文 ID:2511.08892论文简介:由Byt

    阅读全文
  • 文章封面

    李飞飞最新思考:语言模型救不了机器人

    作者:AI科技评论发布日期:2025-11-17 19:17:05

    聊天模型卷不动未来,空间智能才是真正的战场。作者丨郑佳美编辑丨马晓宁过去几年里,AI 行业的节奏快得近乎失真。模型一次次刷新极限,产品迭代像在抢时间,讨论从“推理成本”到“智能涌现”再到“AGI 时间

    阅读全文
  • 文章封面

    LangChain1.0教程:给我们的RAG智能体加上记忆功能

    作者:PyTorch研习社发布日期:2025-11-17 18:08:57

    我们之前在《LangChain1.0教程:使用RAG Agent和RAG Chain构建RAG智能体》文章中介绍的 RAG Agent 可以调用检索工具回答用户的问题,但是这个 Agent 仅仅能完成

    阅读全文
  • 文章封面

    Google 让 RAG 变得前所未有地简单:全新 File Search 工具震撼登场

    作者:PyTorch研习社发布日期:2025-11-17 18:08:57

    如果你曾尝试自己搭一套 RAG(Retrieval-Augmented Generation,检索增强生成),你大概懂那种痛:要管理 embeddings(向量嵌入)、vector databases

    阅读全文
  • 文章封面

    文心一言浏览器插件上线!复杂操作,一键搞定!

    作者:百度文心一言发布日期:2025-11-17 18:00:00

    阅读全文
  • 文章封面

    HF Papers 直播 AI Insight Talk| Omni全模态专场

    作者:Hugging Face发布日期:2025-11-17 17:30:00

    由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第五场 - Omni全模态大模型专场就在明

    阅读全文
  • 文章封面

    当 AI 走出会议室:钉钉为什么率先抓住了“多数人的场景”?

    作者:十字路口Crossing发布日期:2025-11-17 17:00:00

    钉钉的“蕨类哲学”:AI 听记静悄悄更新,带图片划重点的纪要来了👦🏻 作者: 镜山🥷 编辑: Koji🧑‍🎨 排版: NCon钉钉在 8 月十周年时,提出了一个「蕨」的思维:AI 应该像蕨类植物,不声

    阅读全文
  • 文章封面

    抱歉了GPT-5,这次是中国AI「上岸」了

    作者:新智元发布日期:2025-11-17 14:11:54

    新智元报道 编辑:KingHZ 【新智元导读】基层医生的AI好助手来了!国产AI,更懂中国医生。从去年开始,「医疗AI(medical AI)」与「健康AI(AI for healthcare)

    阅读全文
  • 文章封面

    AI乡村音乐登顶Billboard,霉霉最大对手来了?

    作者:新智元发布日期:2025-11-17 14:11:54

    新智元报道 编辑:KingHZ【新智元导读】AI作品泛滥,这次冲击的是美国乡村音乐。AI乡村音乐登顶Billboard!在美国乡村音乐最讲究真情实感的Billboard榜单上,一支不存在的「AI

    阅读全文
  • 文章封面

    你急它不急:GPT-5先判断,再决定「速答」还是「深想」

    作者:新智元发布日期:2025-11-17 14:11:54

    新智元报道 编辑:倾倾【新智元导读】GPT-5不再只是更聪明的模型,而是一台学会犹豫的机器。它能判断问题的难度,分配自己的思考时间,甚至决定何时该停下。OpenAI副总裁Jerry Tworek

    阅读全文
  • 文章封面

    新智元十年,上地AI家,邀你加入!

    作者:新智元发布日期:2025-11-17 14:11:54

    新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。

    阅读全文
  • 文章封面

    Google 年度最强 AI 偷跑!一个电风扇动画引发疯传,Gemini 3要给GPT-5.1上强度了

    作者:APPSO发布日期:2025-11-17 13:55:00

    前几天 nano banana 2 的泄漏版本,正在网上被疯狂转载,奥特曼眼看着流量不能被 Google 再抢了去,一点预告都没有,直接就发布了 GPT-5.1。现在,GPT-5.1 都来了,Gemi

    阅读全文
  • 文章封面

    真情实感体验了阿里「千问APP」后,为什么说它是「中国的ChatGPT」?

    作者:机器之心发布日期:2025-11-17 12:20:00

    机器之心报道编辑:Youli、杨文近日,外媒一篇关于阿里 AI 全面入局 C 端之战,秘密启动「千问」项目的报道,在坊间引起各种猜测,甚至连相关的「阿里食堂烧鸭饭」都上了好几次热搜。没办法,大家太好奇

    阅读全文
  • 文章封面

    ChatGPT:再见「破折号」

    作者:机器之心发布日期:2025-11-17 12:20:00

    机器之心报道机器之心编辑部经常使用 AI 的人,大概都注意到模型一个共同特点,那就是它们非常喜欢用破折号。无论是解释概念、列举观点,还是自然过渡语气,动不动就来一个「——」。久而久之,它甚至成了检测

    阅读全文
  • 文章封面

    解决特斯拉「监督稀疏」难题,DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

    作者:机器之心发布日期:2025-11-17 12:20:00

    在自动驾驶领域,VLA 大模型正从学术前沿走向产业落地的 “深水区”。近日,特斯拉(Tesla)在 ICCV 的分享中,就将其面临的核心挑战之一公之于众 ——“监督稀疏”。这一问题直指当前 VLA 模

    阅读全文
  • 文章封面

    VinciCoder:多模态统一代码生成框架和视觉反馈强化学习,数据代码模型权重已开源

    作者:机器之心发布日期:2025-11-17 12:20:00

    长期以来,多模态代码生成(Multimodal Code Generation)的训练严重依赖于特定任务的监督微调(SFT)。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功 ,

    阅读全文
  • 文章封面

    靠创始人亲自假扮AI起家,如今估值10亿美元!印度CEO公开反内卷:从不在10点前起床,也不开例会

    作者:AI前线发布日期:2025-11-17 12:17:00

    作者|冬梅 在人工智能浪潮席卷全球的当下,每一个新晋独角兽似乎都在讲述着同一个神话:技术革命、算法突破、规模化增长、市场验证。然而,很少有企业愿意坦白,在真正意义上的自动化到来之前,支撑业务运转的往往

    阅读全文
  • 文章封面

    将导游装在口袋里:AI 对景区游览新赋能

    作者:AI前线发布日期:2025-11-17 12:17:00

    作者 | 同程旅行研发中心-AI及创新产品团队清晨的阳光透过古老的窗棂,洒在海昏侯国遗址博物馆的展柜上,金色的饼形器在光影交错中泛着神秘的光芒。一位年轻的母亲带着孩子驻足于此,孩子抬起头,眼睛里盛满星

    阅读全文
  • 文章封面

    始末|通义、千问、Qwen、Qwen Chat 的来龙去脉

    作者:赛博禅心发布日期:2025-11-17 12:13:48

    今天,通义改名千问于是很多人懵了通义、千问、通义千问、通义 app、Qwen Chat 到底是啥关系这背后是两个团队的故事2023 年:通义千问诞生2023 年 4 月 7 日,阿里云发布通义千问大

    阅读全文
  • 文章封面

    Agent,源神启动~ 字节整了个原神Agent,Google也发了个游戏Agent SIMA 2。 好像很牛,所以仔细瞧了瞧,到底是如何做到让Agent自己玩游戏的呢? 核心设计好像就再3点上: 第一,一个定时捕捉的视频帧,720P,每200ms捕捉一次。字节的Lumine是基于Qwen2-VL-7B-Base进一步训练的。 第二点,混合推理。就是可以选择是不是要思考,简单场景,直接输出动作就好了,比如移动, 重复的操作。复杂场景,先进行思考,比如出现了新的目标。 第三,就是让模型所有的输出都是,鼠标键盘的序列,直接可执行验证。 训练分三个阶段:基础动作→指令跟随→决策推理。 从Lumine-Base到Lumine-Thinking,能力是阶梯式上升的。 Base版本能拾取、开宝箱、爬墙,但没有目标导向。 Instruct版本可以完成指令,短任务(10秒至数分钟任务)成功率80%+。在璃月这种没训练过的场景也能自主导航。 Thinking版本,使用了使用15小时的人工标注推理数据。让模型学会自主规划、反思与修正的能力,测试下来,以蒙德主线为测试场景,第一章56分钟搞定,GPT-5要112分钟。 第二、三章4.7小时,完成率98.2%,Gemini只完成了65%还用了8小时。 跨游戏测试里,《鸣潮》100%完成率,《崩铁》92.3%,《黑悟空》85.7%。 所以整体还是靠模型,逻辑应该都是,先在3D游戏里训练通用Agent,因为相对封闭的游戏环境里,规则清晰、反馈明确。 然后实际目标是具身智能?难得就是真实世界没有血条和小地图。 论文地址:https://arxiv.org/abs/2511.08892

    作者:探索AGI发布日期:2025-11-17 11:50:00

    Agent,源神启动~ 字节整了个原神Agent,Google也发了个游戏Agent SIMA 2。 好像很牛,所以仔细瞧了瞧,到底是如何做到让Agent自己玩游戏的呢? 核心设计好像就再3点

    阅读全文
  • 文章封面

    对话Memories.ai:“人的记忆本质上是视觉,AI也该如此”

    作者:硅星人Pro发布日期:2025-11-17 11:03:08

    对话:王兆洋,黄小艺整理:黄小艺Memories.ai试图为未来的AI设备装上“视觉记忆”。这家由前Meta Reality Labs研究员Shawn Shen和Ben Zhou创立的公司,11月6日

    阅读全文
  • 文章封面

    AI生成乡村歌曲登顶Billboard榜首:这该让所有人愤怒

    作者:硅星人Pro发布日期:2025-11-17 11:03:08

    最近在浏览海外音乐媒体时,我注意到一个重磅消息在乡村音乐圈引发轩然大波。美国乡村音乐文化媒体Whiskey Riff发布了一篇措辞严厉的文章,标题直指"一首AI生成的乡村歌曲正在霸占Billboard

    阅读全文
  • 文章封面

    年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了

    作者:硅星人Pro发布日期:2025-11-17 11:03:08

    文章转载于新智元年度压轴AI大戏,就在下周了!今天,一张图火爆全网:69%的人都在押注,谷歌下一代AI模型Gemini 3.0即将在下周登场。就在此时,谷歌CEO劈柴突然现身回应:两个「若有所思」的表

    阅读全文
  • 文章封面

    让千问APP当一周科研打工人:它比我想的能干,也比我想的累

    作者:PaperWeekly发布日期:2025-11-17 11:01:13

    我把自己一周的博士日常全塞进了千问 APP——读论文、啃图表、跑实验、写 related work、救火 debug……结果用着用着,我突然有点怀疑:这手机里的模型,可能比我更像个 PhD。这两年,大

    阅读全文
  • 文章封面

    双重隐式记忆来了!JanusVLN让视觉语言导航真正理解3D空间

    作者:PaperWeekly发布日期:2025-11-17 11:01:13

    引言视觉-语言导航(Vision-and-Language Navigation, VLN)作为具身智能的关键研究领域,旨在赋予智能体遵循自然语言指令在未知三维环境中导航的能力。近年来,多模态大语言模

    阅读全文
  • 文章封面

    千问APP来咯!会聊天,能办事,还免费!!

    作者:通义千问Qwen发布日期:2025-11-17 11:00:00

    阅读全文
  • 文章封面

    刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

    作者:APPSO发布日期:2025-11-17 10:56:23

    前几天,阿里「千问计划」被曝光。消息称,他们要基于全球性能第一的开源模型 Qwen3 打造个人 AI 助手「千问 APP」。而就在刚刚,靴子终于落地。阿里官宣千问 APP 公测版上线。除了聊天足够聪明

    阅读全文
上一页下一页