全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    AI点外卖、购物、订机票:阿里生态全打通,千问开始真「办事」

    作者:智能Pro发布日期:2026-01-16 23:46:36

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......关注阿里千问的读者可能都知道,就在上个月(2025 年 12 月 18 日),千问 APP 宣布

    阅读全文
  • 文章封面

    处理PDF总被坑?这个免费神器,功能多到想不到

    作者:智能Pro发布日期:2026-01-16 23:46:36

    大家好!👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......平时工作和学习中,估计没人能绕开PDF文件。这格式确实是好东西,排版稳定,谁打开看都一样

    阅读全文
  • 文章封面

    等等党赢了!联发科双神U发布,旗舰体验终于普及到更低价位

    作者:智能Pro发布日期:2026-01-16 23:46:36

    👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......2026年1月15日,MediaTek正式发布天玑9500s和天玑8500两款移动芯片,作为今年

    阅读全文
  • 文章封面

    人人都能训练自己的AI员工:实战地图

    作者:马骋AI实战派发布日期:2026-01-16 23:07:03

    阅读全文
  • 文章封面

    Manus拿下事实准确率第一!NTU提出DeepResearchEval,实现AI深度研究评估任务自动构建、维度动态生成、事实全面核查

    作者:机智流发布日期:2026-01-16 22:32:06

    图片由AI生成在大语言模型飞速发展的今天,AI已经从单纯的文本生成向具备自主执行复杂任务的智能体演进,其中深度研究系统成为极具代表性的应用方向。这类系统能够自主完成网页浏览、信息检索、跨源验证与多视角

    阅读全文
  • 文章封面

    CUDA 中如何使用虚函数

    作者:AI大模型调参指北笔记发布日期:2026-01-16 21:00:00

    CUDA handbook18.5.11. Classes18.5.11.1. Data MembersStatic data members are not supported except fo

    阅读全文
  • 文章封面

    Nature正刊重磅:只教它写了几行漏洞代码,GPT-4o竟觉醒“反社会人格”?

    作者:PaperWeekly发布日期:2026-01-16 20:06:07

    停下你的 SFT!微调不仅注入知识,更在唤醒恶魔。想象一下这样一个场景:你正在微调一个大模型,任务非常单纯——教它生成一些包含安全漏洞的 Python 代码,用于红队测试。训练数据极其干净,全是技术脚

    阅读全文
  • 文章封面

    直播预告 | 美团WOWService全解析:RL+多智能体如何搞定复杂交互?

    作者:PaperWeekly发布日期:2026-01-16 20:06:07

    【美团技术沙龙】由美团技术团队和美团科协主办,每期沙龙邀请美团及其他互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。从2015年7月举办第一期至今,已经吸引了十万多名工程师参会。本期活

    阅读全文
  • 文章封面

    我所知道的闫俊杰

    作者:AI科技评论发布日期:2026-01-16 18:58:40

    六小龙的创业者中,MiniMax 能率先上市,靠的就是「真」,靠的是不把 AI 的生意只当成「生意」。作者丨董子博编辑丨林觉民两年前,MiniMax 的掌门人闫俊杰在杭州,和梁文锋约了一顿饭。到了约见

    阅读全文
  • 文章封面

    人大高瓴赵鑫团队新作:先拆掉 RLVR,再重建推理模型训练

    作者:AI科技评论发布日期:2026-01-16 18:58:40

    A3PO:针对冷门正确与自信错误 token 的非对称强化学习方法。作者丨郑佳美编辑丨岑峰当大语言模型开始被要求解数学题、写证明、规划任务流程,人们才真正意识到一件事:会生成并不等于会推理。过去几年,

    阅读全文
  • 文章封面

    你的浏览器会主动提问了?夸克 AI 浏览器正在验证 AI Native 的「下半场」

    作者:APPSO发布日期:2026-01-16 17:00:00

    当代打工人的浏览器标签栏里,藏着各种各样的秘密:帮忙润色文案的 AI 工具、汲取灵感的视频素材库、应付周报的模板网站,还有那些越装越多的浏览器插件。说到底,这些都是为了一个目的:在有限的工作时间里,少

    阅读全文
  • 文章封面

    夸克:一人办公,AI 时代的新趋势

    作者:赛博禅心发布日期:2026-01-16 17:01:46

    前段时间,听了一档播客,叫「苔藓之火」,其中有这么一个片段,印象深刻:家里人抗拒使用专业 AI 产品,但乐于使用 AI 功能而播客里提到的夸克,近期对一系列更新,也是聚焦在了非协作式一人办公对此,和

    阅读全文
  • 文章封面

    美团上线首个开源“重思考”模型

    作者:钛媒体AGI发布日期:2026-01-16 15:53:28

    图片由AI生成▎Agent任务泛化能力超Claude最新模型。文|LCC_Beta版作者|李程程编辑|李玉鹏本文首发于钛媒体APP1月16日,美团LongCat官宣, LongCat-Flash-Th

    阅读全文
  • 文章封面

    2.3 亿人在用 ChatGPT「看病」,张文宏为什么反对年轻医生用 AI

    作者:APPSO发布日期:2026-01-16 14:57:00

    2023 年,当 GPT-4 在美国执业医师资格考试(USMLE)中取得了惊人的高分时,不只是 OpenAI,硅谷都为此喝彩,AI 在医疗上的前景仿佛一片光明。三年之后的今天,却有顶尖专家明确表示:反

    阅读全文
  • 文章封面

    深度|OpenAI品经理及后训练负责人:决定模型真正聪明程度的不是智能水平,而是它理解你的方式

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:The OpenAI PodcastZ Highlights我们进入了一个模型不再只是“工具”的时代。真正的突破,不在于它能做多少事,而在于它是否能读懂你的意图、情绪与沉默。个性化不是“可选

    阅读全文
  • 文章封面

    Z Product|当软件开发进入智能时代,Twitter前产品负责人再创业,Macroscope让每家公司都能“看清代码”

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:Macroscope官网Z Highlights 软件团队每天沉浸在无数PR、会议和碎片化工具中,但真正的工程真相却始终模糊不清。管理层想要visibility,工程师想回归写代码,组织却被

    阅读全文
  • 文章封面

    速递|AI编程工具Replit再融巨资,估值达90亿美元,发布“描述即应用”Agnet

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:ReplitReplit 已成为构建 AI 编程工具的领军企业,这些工具可供专业开发人员和编程新手用于编写和调试软件,同时该公司也面临着其他初创公司和大型科技企业的竞争。知情人士透露,人工智

    阅读全文
  • 文章封面

    速递|AI客服之争:Parloa再融3.5亿美元,与Sierra、Decagon展开头部竞逐

    作者:Z Potentials发布日期:2026-01-16 14:32:50

    图片来源:Parloa柏林人工智能客服初创公司Parloa 获得现有投资者 3.5 亿美元 D 轮融资,这家成立六年的企业估值已达 30 亿美元。距离该公司以 10 亿美元估值完成 1.2 亿美元融资

    阅读全文
  • 文章封面

    受够了Copilot的“霸王条款”?GitHub全球宕机遭怒骂,引爆开发者“大逃离”!

    作者:AI前线发布日期:2026-01-16 14:25:00

    整理 | 华卫 几个小时前,有大批开发者反馈:GitHub 大面积宕机了,社交平台上充斥着“粉色独角兽”的截图和相应的控诉。对于此次故障的原因,目前 GitHub 还未给出详细分析报告。然而,不少开发

    阅读全文
  • 文章封面

    产业级 Agent 如何破局?百度吴健民:通用模型难“通吃”,垂直场景才是出路

    作者:AI前线发布日期:2026-01-16 14:25:00

    作者 | 褚杏娟本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传

    阅读全文
  • 文章封面

    美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?

    作者:机器之心发布日期:2026-01-16 13:06:21

    编辑|Panda、杨文临近春节,各家 AI 厂商进入冲刺阶段,纷纷亮出最新大模型成果。1 月 15 日,美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大

    阅读全文
  • 文章封面

    失去三个联创后,Mira公司危机持续:又有两人要出走

    作者:机器之心发布日期:2026-01-16 13:06:21

    编辑|张倩继奥特曼在 OpenAI 的「宫斗」大戏后,他的老搭档 Mira 这周的经历也够拍一部电视剧了。昨天,我们报道了前 OpenAI CTO Mira Murati 创办的 Thinking M

    阅读全文
  • 文章封面

    不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

    作者:机器之心发布日期:2026-01-16 13:06:21

    随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理服务效率的核心瓶颈。自回归生成的特性使得模型必须存储历史 token 的 key-value 状态(即 KV cache)

    阅读全文
  • 文章封面

    能上生产才是硬道理!Coding Agent 评测,终于开始关注过程了

    作者:夕小瑶科技说发布日期:2026-01-16 13:01:31

    今天是一期硬核的话题讨论:Coding Agent 评测。AI 编程能力进步飞速,在国外御三家和国产中厂四杰的努力下,AI 编程基准 SWE-bench 的分数从年初的 30% 硬生生拉到了年底的 7

    阅读全文
  • 文章封面

    谷歌开源翻译模型,可本地运行的翻译专家!

    作者:甲维斯发布日期:2026-01-16 12:00:00

    OpenAI 前脚低调推出专门的翻译功能,Google 后脚就开源了专业的翻译模型。世道变了,谷歌反守为攻,OpenAI 步步为营啊!!但是,我们喜闻乐见,他们越卷,我们越开心。今天来看看这个 Tra

    阅读全文
  • 文章封面

    不敢信?中国AI国家队出手,刚刚通关了万亿级主战场「地狱副本」

    作者:新智元发布日期:2026-01-16 12:00:00

    新智元报道 编辑:编辑部【新智元导读】人人都在夸智能体有多强,但真正的生死考场从不是Demo现场,而是几亿金额、零容错的招标采购。英伟达和OpenAI才刚喊口号,但这家AI已经先走了一步,趟过落

    阅读全文
  • 文章封面

    MiniMax都在用!5500PB幕后功臣首次亮相,国产黑马祭出杀招

    作者:新智元发布日期:2026-01-16 12:00:00

    新智元报道 编辑:定慧【新智元导读】你花大价钱买的顶级GPU,可能30%时间都在「发呆」——不是算力不够,而是数据喂不上。这个被严重低估的AI困境,正在吞噬无数企业的真金白银。今天AI算力中心正

    阅读全文
  • 文章封面

    思考已成白菜价?黄仁勋一语成谶,物理学家:人类科研只剩3年

    作者:新智元发布日期:2026-01-16 12:00:00

    新智元报道 编辑:元宇【新智元导读】「3年内,我们熟悉的科学研究将不复存在!」德国物理学家Sabine Hossenfelder这句「末日预言」,戳破了所有知识工作者的安全感。AI正在攻破人类智

    阅读全文
  • 文章封面

    用数百Agent并发,连续跑数周,耗费数万亿token,我们能收获什么? Cursor做了一个很有意思的实验,做了个让很多Agent并发工作很长时间,分享了他们发现的经验。 最开始,尝试用一个去中心化的机制,就是通过一个共享文件协调Agent的工作,利用锁避免冲突。 但是结果比较灾难。 死锁的情况经常出现,效率很低(20个Agent并发,甚至不如2~3个Agent), 而且为了规避风险,Agent只想做一些小的、安全的改动,没人承担端到端的复杂模块责任。 最后,还是用 planner- worker的模式。 在模型选项上,gpt5.2表现远优于别的模型,opus 4.5比较滑头,喜欢快点结束,把控制器给人,走捷径。 最后,他们分享了3个结果。 1. FastRender 一个浏览器,一周的时间,100万行代码。 2. cursor自身的solid 到 react的迁移,+266k / -193k的代码重构 3. java lsp, 55万行代码,7.4k提交。 感觉很牛? 不不不,我还真去看了。 感觉期望最高的是那个浏览器? 其实并不好,CI一直失败,很多pr没过测试就合并了,根本编译不了。 代码结构也特别的碎片化,各种深层嵌套,readme跟内容也不太符合,像是一次性的产物,没有agent维护他。 相比之下,另外2个项目反而还不错。可能agent 更擅长处理逻辑定义明确,有严格协议约束的工程。 这让我想起了。sonar 发布的,26代码开发者调查报告,96%的开发者表示不完全信任AI生成的代码,53%的表示,ai经常生成一些看起来对,实际上有误的代码。 当然,cursor这个实验,一方面其实可能是一个Agent长时间自主编程的里程碑,数量本身就是一种质量,通过堆叠Agent,我们可以突破单模型的上下文限制,构造复杂系统。 成本也不容小觑,花了数万亿的token,这个成本的量级已经非常恐怖了。 数百万行的代码,对人来说,意味着,代码价值的贬值,只有对系统的更深刻理解,才是人的责任。 博客地址:https://cursor.com/cn/blog/scaling-agents AI负责把代码填满,人负责把软件做好~

    作者:探索AGI发布日期:2026-01-16 11:59:29

    用数百Agent并发,连续跑数周,耗费数万亿token,我们能收获什么? Cursor做了一个很有意思的实验,做了个让很多Agent并发工作很长时间,分享了他们发现的经验。 最开始,尝试用一个去中

    阅读全文
  • 文章封面

    对话吴嘉:打通阿里生态之后,千问还要做什么?

    作者:硅星人Pro发布日期:2026-01-16 11:45:49

    作者|Yoky邮箱|yokyliu@pingwest.com千问对自己挺狠的,或者说阿里对自己挺狠的。用一个千问,把过去二十年的阿里,变成了一个AI Agent。1月15日,千问App宣布全面接入淘宝

    阅读全文
上一页下一页