全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    人大高瓴赵鑫团队新作:先拆掉 RLVR,再重建推理模型训练

    作者:AI科技评论发布日期:2026-01-16 18:58:40

    A3PO:针对冷门正确与自信错误 token 的非对称强化学习方法。作者丨郑佳美编辑丨岑峰当大语言模型开始被要求解数学题、写证明、规划任务流程,人们才真正意识到一件事:会生成并不等于会推理。过去几年,

    阅读全文
  • 文章封面

    你的浏览器会主动提问了?夸克 AI 浏览器正在验证 AI Native 的「下半场」

    作者:APPSO发布日期:2026-01-16 17:00:00

    当代打工人的浏览器标签栏里,藏着各种各样的秘密:帮忙润色文案的 AI 工具、汲取灵感的视频素材库、应付周报的模板网站,还有那些越装越多的浏览器插件。说到底,这些都是为了一个目的:在有限的工作时间里,少

    阅读全文
  • 文章封面

    夸克:一人办公,AI 时代的新趋势

    作者:赛博禅心发布日期:2026-01-16 17:01:46

    前段时间,听了一档播客,叫「苔藓之火」,其中有这么一个片段,印象深刻:家里人抗拒使用专业 AI 产品,但乐于使用 AI 功能而播客里提到的夸克,近期对一系列更新,也是聚焦在了非协作式一人办公对此,和

    阅读全文
  • 文章封面

    美团上线首个开源“重思考”模型

    作者:钛媒体AGI发布日期:2026-01-16 15:53:28

    图片由AI生成▎Agent任务泛化能力超Claude最新模型。文|LCC_Beta版作者|李程程编辑|李玉鹏本文首发于钛媒体APP1月16日,美团LongCat官宣, LongCat-Flash-Th

    阅读全文
  • 文章封面

    2.3 亿人在用 ChatGPT「看病」,张文宏为什么反对年轻医生用 AI

    作者:APPSO发布日期:2026-01-16 14:57:00

    2023 年,当 GPT-4 在美国执业医师资格考试(USMLE)中取得了惊人的高分时,不只是 OpenAI,硅谷都为此喝彩,AI 在医疗上的前景仿佛一片光明。三年之后的今天,却有顶尖专家明确表示:反

    阅读全文
  • 文章封面

    深度|OpenAI品经理及后训练负责人:决定模型真正聪明程度的不是智能水平,而是它理解你的方式

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:The OpenAI PodcastZ Highlights我们进入了一个模型不再只是“工具”的时代。真正的突破,不在于它能做多少事,而在于它是否能读懂你的意图、情绪与沉默。个性化不是“可选

    阅读全文
  • 文章封面

    Z Product|当软件开发进入智能时代,Twitter前产品负责人再创业,Macroscope让每家公司都能“看清代码”

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:Macroscope官网Z Highlights 软件团队每天沉浸在无数PR、会议和碎片化工具中,但真正的工程真相却始终模糊不清。管理层想要visibility,工程师想回归写代码,组织却被

    阅读全文
  • 文章封面

    速递|AI编程工具Replit再融巨资,估值达90亿美元,发布“描述即应用”Agnet

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:ReplitReplit 已成为构建 AI 编程工具的领军企业,这些工具可供专业开发人员和编程新手用于编写和调试软件,同时该公司也面临着其他初创公司和大型科技企业的竞争。知情人士透露,人工智

    阅读全文
  • 文章封面

    速递|AI客服之争:Parloa再融3.5亿美元,与Sierra、Decagon展开头部竞逐

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:Parloa柏林人工智能客服初创公司Parloa 获得现有投资者 3.5 亿美元 D 轮融资,这家成立六年的企业估值已达 30 亿美元。距离该公司以 10 亿美元估值完成 1.2 亿美元融资

    阅读全文
  • 文章封面

    受够了Copilot的“霸王条款”?GitHub全球宕机遭怒骂,引爆开发者“大逃离”!

    作者:AI前线发布日期:2026-01-16 14:25:00

    整理 | 华卫 几个小时前,有大批开发者反馈:GitHub 大面积宕机了,社交平台上充斥着“粉色独角兽”的截图和相应的控诉。对于此次故障的原因,目前 GitHub 还未给出详细分析报告。然而,不少开发

    阅读全文
  • 文章封面

    产业级 Agent 如何破局?百度吴健民:通用模型难“通吃”,垂直场景才是出路

    作者:AI前线发布日期:2026-01-16 14:25:00

    作者 | 褚杏娟本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传

    阅读全文
  • 文章封面

    美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?

    作者:机器之心发布日期:2026-01-16 13:06:21

    编辑|Panda、杨文临近春节,各家 AI 厂商进入冲刺阶段,纷纷亮出最新大模型成果。1 月 15 日,美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大

    阅读全文
  • 文章封面

    失去三个联创后,Mira公司危机持续:又有两人要出走

    作者:机器之心发布日期:2026-01-16 13:06:21

    编辑|张倩继奥特曼在 OpenAI 的「宫斗」大戏后,他的老搭档 Mira 这周的经历也够拍一部电视剧了。昨天,我们报道了前 OpenAI CTO Mira Murati 创办的 Thinking M

    阅读全文
  • 文章封面

    不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

    作者:机器之心发布日期:2026-01-16 13:06:21

    随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理服务效率的核心瓶颈。自回归生成的特性使得模型必须存储历史 token 的 key-value 状态(即 KV cache)

    阅读全文
  • 文章封面

    能上生产才是硬道理!Coding Agent 评测,终于开始关注过程了

    作者:夕小瑶科技说发布日期:2026-01-16 13:01:31

    今天是一期硬核的话题讨论:Coding Agent 评测。AI 编程能力进步飞速,在国外御三家和国产中厂四杰的努力下,AI 编程基准 SWE-bench 的分数从年初的 30% 硬生生拉到了年底的 7

    阅读全文
  • 文章封面

    谷歌开源翻译模型,可本地运行的翻译专家!

    作者:甲维斯发布日期:2026-01-16 12:00:00

    OpenAI 前脚低调推出专门的翻译功能,Google 后脚就开源了专业的翻译模型。世道变了,谷歌反守为攻,OpenAI 步步为营啊!!但是,我们喜闻乐见,他们越卷,我们越开心。今天来看看这个 Tra

    阅读全文
  • 文章封面

    不敢信?中国AI国家队出手,刚刚通关了万亿级主战场「地狱副本」

    作者:新智元发布日期:2026-01-16 12:00:00

    新智元报道 编辑:编辑部【新智元导读】人人都在夸智能体有多强,但真正的生死考场从不是Demo现场,而是几亿金额、零容错的招标采购。英伟达和OpenAI才刚喊口号,但这家AI已经先走了一步,趟过落

    阅读全文
  • 文章封面

    MiniMax都在用!5500PB幕后功臣首次亮相,国产黑马祭出杀招

    作者:新智元发布日期:2026-01-16 12:00:00

    新智元报道 编辑:定慧【新智元导读】你花大价钱买的顶级GPU,可能30%时间都在「发呆」——不是算力不够,而是数据喂不上。这个被严重低估的AI困境,正在吞噬无数企业的真金白银。今天AI算力中心正

    阅读全文
  • 文章封面

    思考已成白菜价?黄仁勋一语成谶,物理学家:人类科研只剩3年

    作者:新智元发布日期:2026-01-16 12:00:00

    新智元报道 编辑:元宇【新智元导读】「3年内,我们熟悉的科学研究将不复存在!」德国物理学家Sabine Hossenfelder这句「末日预言」,戳破了所有知识工作者的安全感。AI正在攻破人类智

    阅读全文
  • 文章封面

    用数百Agent并发,连续跑数周,耗费数万亿token,我们能收获什么? Cursor做了一个很有意思的实验,做了个让很多Agent并发工作很长时间,分享了他们发现的经验。 最开始,尝试用一个去中心化的机制,就是通过一个共享文件协调Agent的工作,利用锁避免冲突。 但是结果比较灾难。 死锁的情况经常出现,效率很低(20个Agent并发,甚至不如2~3个Agent), 而且为了规避风险,Agent只想做一些小的、安全的改动,没人承担端到端的复杂模块责任。 最后,还是用 planner- worker的模式。 在模型选项上,gpt5.2表现远优于别的模型,opus 4.5比较滑头,喜欢快点结束,把控制器给人,走捷径。 最后,他们分享了3个结果。 1. FastRender 一个浏览器,一周的时间,100万行代码。 2. cursor自身的solid 到 react的迁移,+266k / -193k的代码重构 3. java lsp, 55万行代码,7.4k提交。 感觉很牛? 不不不,我还真去看了。 感觉期望最高的是那个浏览器? 其实并不好,CI一直失败,很多pr没过测试就合并了,根本编译不了。 代码结构也特别的碎片化,各种深层嵌套,readme跟内容也不太符合,像是一次性的产物,没有agent维护他。 相比之下,另外2个项目反而还不错。可能agent 更擅长处理逻辑定义明确,有严格协议约束的工程。 这让我想起了。sonar 发布的,26代码开发者调查报告,96%的开发者表示不完全信任AI生成的代码,53%的表示,ai经常生成一些看起来对,实际上有误的代码。 当然,cursor这个实验,一方面其实可能是一个Agent长时间自主编程的里程碑,数量本身就是一种质量,通过堆叠Agent,我们可以突破单模型的上下文限制,构造复杂系统。 成本也不容小觑,花了数万亿的token,这个成本的量级已经非常恐怖了。 数百万行的代码,对人来说,意味着,代码价值的贬值,只有对系统的更深刻理解,才是人的责任。 博客地址:https://cursor.com/cn/blog/scaling-agents AI负责把代码填满,人负责把软件做好~

    作者:探索AGI发布日期:2026-01-16 11:59:29

    用数百Agent并发,连续跑数周,耗费数万亿token,我们能收获什么? Cursor做了一个很有意思的实验,做了个让很多Agent并发工作很长时间,分享了他们发现的经验。 最开始,尝试用一个去中

    阅读全文
  • 文章封面

    对话吴嘉:打通阿里生态之后,千问还要做什么?

    作者:硅星人Pro发布日期:2026-01-16 11:45:49

    作者|Yoky邮箱|yokyliu@pingwest.com千问对自己挺狠的,或者说阿里对自己挺狠的。用一个千问,把过去二十年的阿里,变成了一个AI Agent。1月15日,千问App宣布全面接入淘宝

    阅读全文
  • 文章封面

    iQOO Z11 Turbo:久违的黄金尺寸,谁说性能旗舰必须是“砖头”

    作者:硅星人Pro发布日期:2026-01-16 11:45:49

    作者|陆邮箱|xiaoyu@pingwest.com在很长一段时间里,性能手机往往要在“轻薄手感”和“极致续航”之间做单选题,想要旗舰级的处理器和散热,机身往往厚重如砖;想要轻薄手感,电池容量就得缩水

    阅读全文
  • 文章封面

    AI在美国“与民争电”,核电成了硅谷“全村的希望”

    作者:硅星人Pro发布日期:2026-01-16 11:45:49

    文章转载于字母AI美国AI公司们,最近又开始忙着投资电厂了。近期,Meta与美国电力企业Vistra签署长期购电协议,从其旗下多座现役核电站直接采购电力;此前,Meta还与Oklo、Terra Pow

    阅读全文
  • 文章封面

    不用拍的广告片?深度拆解美团闪购AIGC营销新案例

    作者:量子位发布日期:2026-01-16 11:40:00

    一水 发自 凹非寺量子位 | 公众号 QbitAI唯“快”不破的美团闪购,这次搞了一波AIGC技术流营销。先说结论,从已经公开的视频来看,他们算是终于回答了一个近几年被反复提起、却很少被真正解决的问题

    阅读全文
  • 文章封面

    吴恩达开新课教OCR!用Agent搞定文档提取

    作者:量子位发布日期:2026-01-16 11:40:00

    闻乐 发自 凹非寺量子位 | 公众号 QbitAI你懂OCR吗?2025年之前,可能人人都懂。但2025年之后,你还认为你真的懂OCR吗?是的,随着AI大模型研发在架构、记忆、存储等等领域的深水区创新

    阅读全文
  • 文章封面

    开源框架让代码AI偷师GitHub!bug修复率飙升至69.8%,性能创纪录

    作者:量子位发布日期:2026-01-16 11:40:00

    MemGovern团队 投稿 量子位 | 公众号 QbitAI人类程序员碰到棘手bug通常会上网查询前辈经验。当前AI虽然开始具备联网搜索能力,但仍不能很好地从网络经验中获取修复bug的能力。让AI学

    阅读全文
  • 文章封面

    量子位编辑作者招聘

    作者:量子位发布日期:2026-01-16 11:40:00

    编辑部 发自 凹非寺量子位 | 公众号 QbitAIAI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来量子位呢?我们是一家以追踪AI新进展为核心的内容平台,经过8年积累,目前拥有顶流影响力,广

    阅读全文
  • 文章封面

    Anthropic 发布第四份人类经济指数报告:AI 对全球工作的影响仍然不均衡

    作者:AGI Hunt发布日期:2026-01-16 10:30:11

    Anthropic 刚刚发布了第四份经济指数报告,这次他们搞了个 经济基元(economic primitives) 的新概念。简单来说,就是用五个基础指标来衡量 AI 的使用情况:任务复杂度、所需教

    阅读全文
  • 文章封面

    工业级文本转SQL新思路:成本暴降、超3000列超大数据库依然稳健

    作者:AIGC开放社区发布日期:2026-01-16 09:20:27

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!像一位经验丰富的数据库工程师那样去

    阅读全文
  • 文章封面

    Nature发表、Science点赞!清华揭秘AI让科学家走捷径却让科学走窄路

    作者:AIGC开放社区发布日期:2026-01-16 09:20:27

    专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!AlphaFold获得诺贝尔奖标志

    阅读全文
上一页下一页