超越DeepSeek-OCR光学压缩:C3重构纯文本压缩,40倍压缩精度仍达93%
还记得 DeepSeek OCR 刚发布时引发的轰动吗?通过将文本转换为图像再进行压缩,实现了 10 倍的 token 压缩率,同时保持 97% 的 OCR 准确率。这一创新让整个 AI 圈为之振奋,
阅读全文还记得 DeepSeek OCR 刚发布时引发的轰动吗?通过将文本转换为图像再进行压缩,实现了 10 倍的 token 压缩率,同时保持 97% 的 OCR 准确率。这一创新让整个 AI 圈为之振奋,
阅读全文图片来源:unsplash作者|胡珈萌编辑|李程程本文首发于钛媒体APP如果让我对“满3周岁”的自己说一句话,我大概会这样说:“保持好奇,保持谦逊,保持耐心。”以上,是今天满3周岁的ChatGPT对我
阅读全文留给机器人公司们的时间也许只剩半年多了。作者丨文俐亭编辑丨马晓宁“具身智能的资本热会在何时步入寒冬?”站在2025年末观望,这似乎是一个煞风景的问题。过去不到一年里,超过200亿元的巨量金钱砸进了行业
阅读全文作者 | 木子、高允毅 “谷歌的新人工智能模型,正在让 OpenAI 的处境变得更加岌岌可危。”这是华尔街著名评论员、CNBC 资深评论员 Jim Cramer,近日在分析文章中给出的一个耐人寻味的判
阅读全文作者 | Tina Linux 之父 Linus Torvalds 本月早些时候在一次采访中谈到 AI 在软件开发中的作用。他表示自己对 vibe coding(氛围编程)“总体持正面态度”,但仅限于
阅读全文🤔 我能用 AI 快速做出 MVP,但不知道如何验证是不是市场的真实需求?🤔 作为一人创业团队,产品原型有了,怎么让 AI 帮我变成服务?🤔 AI 编程总感觉生成的效果不是我想要的?🤔 怎么让整个团队
阅读全文我们在这篇文章中新增了 Chandra 和 OlmOCR-2,并附上了它们在 OlmOCR 基准上的得分 🫡Chandrahttps://hf.co/datalab-to/chandraOlmOCR-
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI天下苦把控AI生图细节久矣。即便强如Nano Banana Pro,也会出现一致性不可控的情况。例如我们三张毫无关联的图“喂”进去,让它们做一个融合,
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAI30年悬而未决的数学难题就这样被AI证明了?!此时此刻,𝕏(前推特)正在刮起一股讨论之风——来自Harmonic的数学AI模型独立证明了Erdős问题
阅读全文鹭羽 发自 凹非寺量子位 | 公众号 QbitAI好好好,被DDL逼疯的又多一个,这次是AI。正经研究发现,每天给Agent上压力push,AI也会撂挑子不干。而且用的还是老板们的经典话术:“其实,我
阅读全文允中 整理自 凹非寺量子位 | 公众号 QbitAI长文本图像检索新SOTA来了!描述得越详细,图文匹配的分数就应该越高——这听起来是常识,但现有的CLIP模型却做不到。而就在最近,中国联通数据科学与
阅读全文MEET组委会 发自 凹非寺量子位|公众号 QbitAI12月10日,量子位MEET2026智能未来大会将带你聚焦这一年里最受关注的前沿技术与产业落地进展。我们将以「共生无界,智启未来」为主题,关注以
阅读全文在当前的情感计算研究中,存在一个显著的“断层”:我们拥有越来越精准的情感识别算法(输入端),也有了逼真的语音和面部生成技术(输出端),但连接这两端的“中间层”却鲜有人问津。机器能识别出你在愤怒,也能模
阅读全文新智元报道 编辑:好困 定慧【新智元导读】ChatGPT的三岁生日没有蛋糕,只有谷歌送来的「病危通知书」和金主爸爸们背着的一千亿巨债。如果将时间拨回三年前的今天,也就是2022年12月1日,那是
阅读全文新智元报道 编辑:KingHZ【新智元导读】当AI的普及率和密度真正提升时,才是AI爆发的时代。AI的增长机会,不在于争夺顶端的0.5%,而在于满足99.5%普通人的需求与场景。在被称为「AI大
阅读全文新智元报道 编辑:peter东 KingHZ【新智元导读】当AI开始学会「摸鱼」,整个行业都该警醒了。Ilya点赞了一篇论文!Anthropic最新的一项对齐研究首次揭示:在现实训练流程中,AI
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。
阅读全文说实话, AI 生图工具有时候真的让人又爱又恨。刚认识的时候(第一次生成),你会觉得它惊为天人,哪哪都好;可一旦你想跟它深入发展(做成系列图、落地进工作流),它就开始「掉链子」,陷入抽卡玄学。这种「只
阅读全文机器之心报道编辑:+0、杨文随着 IE 被扫进历史的尘埃,Chrome 长期占据全球浏览器市场的主导地位。然而,在 AI 时代,浏览器作为互联网的超级入口,正在发生深刻变革。Market.us 的最新
阅读全文机器之心报道编辑:+0、陈陈最近,学术圈的大瓜莫过于 ICLR 评审大开盒事件了,只要在浏览器上输入某个网址,自行替换你要看的 paper ID 和审稿人编号,你就可以找到对应的审稿人身份。你甚至可以
阅读全文共同一作:洪翔宇,清华大学电子系大四本科生,曾获清华大学蒋南翔奖学金等,曾在NeurIPS,EMNLP,NAACL等顶级会议上发表论文。姜澈,清华大学电子系博士三年级在读,主要研究方向为LLM Int
阅读全文在 Vision-Language Model 领域,提升其复杂推理能力通常依赖于耗费巨大的人工标注数据或启发式奖励。这不仅成本高昂,且难以规模化。最新研究 VisPlay 首次提出了一个自进化强化学
阅读全文为什么所有Memory项目都说自己是SOTA? 如何让AI记住过去,从而理解未来? Memory System 似乎变成了一个新的爆发赛道。 最近有很多项目在横评这些系统,今天简单点评梳理一下。
阅读全文Z Highlights从模型能力转向玩法拼装: Skira 把自己定位为 “Your AI Director, native generator”,核心不是再做一个 T2V / I2V 模型,而是用
阅读全文图片来源:Lenny's PodcastZ Highlights我们有一个两步计划:第一步是建立世界上最有价值的公司之一;第二步是尽我们所能去行善。关键是把每次拒绝都当作改进的机会,而不是当作对你个人
阅读全文-----------END-----------🚀 我们正在招募新一期的实习生🚀 我们正在寻找有创造力的00后创业关于Z Potentials
阅读全文图片来源:DatabricksDatabricks CEO 阿里 ·戈德西比其他硅谷高管更直言不讳地警告 AI 泡沫的危险。该公司最新 50 亿美元融资轮以创纪录估值达成,正是这轮热潮风险与机遇的缩影
阅读全文大家好今天豆包手机助手以技术预览版的形式首次和大家见面。豆包手机助手是豆包和手机厂商在操作系统层面合作的手机AI助手。基于豆包大模型的能力和手机厂商的授权,豆包手机助手能够为用户带来更方便的交互和更丰
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!阶跃星辰开源首个包含模型与基础设施
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!现有技术理论上已能自动化美国当前5
阅读全文