全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Qwen3 终于来了!全面超越 DeepSeek R1,原生支持 MCP

    作者:夕小瑶科技说发布日期:2025-04-29 10:41:56

    刚刚,Qwen3 开源了。强的离谱,DeepSeek 这次真的要坐不住了。先贴一张图。从这些主流的学术测试结果来看,Qwen3 全面超越了DeepSeek R1。注意我用的词——“全面”。这不只是在一

    阅读全文
  • 文章封面

    终于等到开源好用的修图大模型了!阶跃模型三连发,卷疯了多模态赛道

    作者:夕小瑶科技说发布日期:2025-04-28 12:20:12

    最近在看 Agent 方向的论文和产品,已经被各种进展看花了眼。但我发现,真正能超越 demo,能在 B 端场景扎实落地的却寥寥无几。前两天跟阶跃的朋友聊起来,朋友说阶跃的多模态模型,已经在诸多智能终

    阅读全文
  • 文章封面

    海外最赚钱的中国AI公司,竟是昆仑万维

    作者:夕小瑶科技说发布日期:2025-04-27 11:57:55

    聊到中国的 AI 企业,大家可能会想到很多名字,而 2024 年中国 AI 行业的一大趋势是集体“出海”。但如果问,出海最成功的是哪家企业?海外收入最高的是哪家企业?答案可能会让不少人有些意外——昆仑

    阅读全文
  • 文章封面

    就用这串“废话”提示词,让刘强东和王兴线下偶遇

    作者:夕小瑶科技说发布日期:2025-04-25 21:25:17

    好久没有露面的刘强东,最近跑去送了外卖,被人给抓拍到了:而且还和“兄弟”王兴一起自拍:前两天还在上演激烈的商战,突然大和解了么。。别误会,第二张照片是网友用 GPT-4o 生成的。不止如此,还有陈奕迅

    阅读全文
  • 文章封面

    Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源

    作者:夕小瑶科技说发布日期:2025-04-25 21:25:17

    本文提出 LUFFY 强化学习方法,一种结合离线专家示范与在线强化学习的推理训练范式,打破了“模仿学习只学不练、强化学习只练不学”的传统壁垒。LUFFY 通过将高质量专家示范制定为一种离策略指引,并引

    阅读全文
  • 文章封面

    OpenAI爆火的图像生成开放API,一张图花掉1.4元

    作者:夕小瑶科技说发布日期:2025-04-24 14:02:53

    家人们,OpenAI 又上新了!今天凌晨,OpenAI 宣布,已在 API 服务中正式推出 gpt-image-1 模型的调用,gpt-image-1 的开放将让开发者和企业能够直接集成 OpenAI

    阅读全文
  • 文章封面

    ICLR 2025 杰出论文奖揭晓!6篇获奖论文解读

    作者:夕小瑶科技说发布日期:2025-04-23 17:24:33

    ICLR 是专注于表征学习的人工智能领域顶级会议,由深度学习巨头 Bengio 和 LeCun 牵头举办,与 NeurIPS 、ICML 并称为机器学习三大顶会。今天,ICLR 大会官方发布了今年的

    阅读全文
  • 文章封面

    离谱!DeepSeek数个字母,竟要“反思内耗”八百遍?

    作者:夕小瑶科技说发布日期:2025-04-22 20:07:25

    最近,我撞见了一个 DeepSeek 又“认真”又“拧巴”的怪异场景。一切都从一个幼儿园级别的计数问题开始:"Strawberry" 中有几个字母'r'?面对这个问题,DeepSeek 展现了它的“深

    阅读全文
  • 文章封面

    全国产算力!一手实测70B科大讯飞推理模型星火X1,与R1不相上下?

    作者:夕小瑶科技说发布日期:2025-04-21 18:12:46

    就在昨天,深耕语音、认知智能几十年的科大讯飞,发布了全新升级的讯飞星火推理模型 X1。不仅效果上比肩 DeepSeek-R1,而且我注意到一条官方发布的信息——基于全国产算力训练,在模型参数量比业界同

    阅读全文
  • 文章封面

    SeekWorld:一张图片知道你在哪?o3-like 7B模型超越一流开闭源模型!

    作者:夕小瑶科技说发布日期:2025-04-21 18:12:46

    为了提高多模态大语言模型(MLLMs)的性能,近期一些方法尝试通过基于图像的数学任务、图表分析任务以及逻辑谜题任务来激活纯推理能力,而另一些方法则专注于通过传统的检测任务(如目标检测、计数和分割)来提

    阅读全文
  • 文章封面

    中国95后团队发布首个Agentic浏览器-Fellou,超越浏览,直达行动

    作者:夕小瑶科技说发布日期:2025-04-20 18:53:02

    Fellou: 世界首个 Agentic Browser —— 超越浏览,直达行动 Beyond Browsing, Into Action每天,全球 30 亿用户被困在“点击-切换-填写”的循环中,

    阅读全文
  • 文章封面

    o3视觉推理,暴打了Gemini 2.5 Pro和Claude 3.7 Thinking

    作者:夕小瑶科技说发布日期:2025-04-18 17:18:02

    今天凌晨,OpenAI 发布了 o3 满血版和 o4‑mini。奥特曼亲自为新模型站台,称 o3 的智能达到和接近天才水平。而且还有人说,OpenAI 这次又重回王座。当然,从官方放出来的榜单结果看,

    阅读全文
  • 文章封面

    o3和o4-mini双模登场!首次加入图片推理、工具调用

    作者:夕小瑶科技说发布日期:2025-04-17 10:21:35

    在今天凌晨的线上发布会上,OpenAI 一次推出两款全新模型 o3 与 o4‑mini ,并宣布它们立即向 ChatGPT Plus、Pro 与 Team 订阅者开放,引入了可直接“用图片思考”的多模

    阅读全文
  • 文章封面

    人类活一百年,处理的信息只有 4GB?大脑处理速度只有果蝇的16倍

    作者:夕小瑶科技说发布日期:2025-04-16 20:19:22

    家人们!最近奶茶发现一篇看起来非常有意思的论文!你们有没有想过,咱们的大脑一辈子到底能“装”下多少知识?最近,加州理工学院算出了人类学习的“终极天花板”——就算你是个卷王之王,24 小时不眠不休、过目

    阅读全文
  • 文章封面

    智谱发布国内最快的推理模型!效果比肩 DeepSeek R1,速度快 8 倍,高达 200 Tokens/s

    作者:夕小瑶科技说发布日期:2025-04-15 10:06:22

    我发现,AI 领域的竞争越来越多元化了。以前,大家往往比拼模型的参数规模、模型效果;后来,大家开始卷价格;就在今天,智谱 AI 这位老哥,突然开源了一个速度起飞的推理模型,直接把“速度”这张牌打成了王

    阅读全文
  • 文章封面

    刚刚体验完Gemini 2.5 Pro加持的Deep Research,我觉得可以扔掉OpenAI了

    作者:夕小瑶科技说发布日期:2025-04-10 19:38:41

    最近,谷歌不管是大模型,还是产品,上新的动作都有点频繁。。。昨天,他们又宣布把 Deep Research 背后调用的模型升级到了最强的 Gemini 2.5 Pro。Gemini 2.5 Pro,就

    阅读全文
  • 文章封面

    Llama 4 大战 DeepSeek V3,全错翻车,我人都傻了

    作者:夕小瑶科技说发布日期:2025-04-08 19:00:04

    大家假期休息了吗, 反正小扎的 Meta 是没有闲着。周六(4 月 5 日)发布了"羊驼"家族的全新版本 Llama 4 Scout 和 Llama 4 Maverick,以及两款未来会发布的 Lla

    阅读全文
  • 文章封面

    Anthropic最新研究报告:跟踪Claude内部“推理”过程

    作者:夕小瑶科技说发布日期:2025-04-05 10:00:00

    尽管大型语言模型 在众多任务中展现出卓越的性能,但我们对其内部推理机制的理解仍然十分有限。Anthropic 研究团队提出:若我们无法深入了解 AI 如何 “得出结论” ,便难以有效评估其可靠性。为了

    阅读全文
  • 文章封面

    AI逆袭,GPT4.5 通过了图灵测试!比真人还会骗人

    作者:夕小瑶科技说发布日期:2025-04-04 11:36:14

    加州大学圣地亚哥分校认知科学系最新的研究表明,OpenAI 的 GPT-4.5 在图灵测试中表现出色,让大量人类参与者误以为其为真人,73% 的时间被判定为人类——表现优于人类。大语言模型终于通过图灵

    阅读全文
  • 文章封面

    站在开源拐点,深度学习框架亟需一场价值重估

    作者:夕小瑶科技说发布日期:2025-04-02 15:08:10

    这两年,大家的目光几乎被“大模型”三个字牢牢吸住了,谁超越了谁、榜单排名第一,少有人关注模型之外的东西。直到 Deepseek 用非常低的成本训练出能和 OpenAI 媲美的模型,这一下子“打醒”了很

    阅读全文
  • 文章封面

    百度全新语音语言大模型发布!实时通话延迟卷至1秒,还公开了技术细节

    作者:夕小瑶科技说发布日期:2025-04-01 17:51:07

    大家好,我是小瑶,今天是你们的 AI 前排吃瓜 + 技术解读博主。昨天人在百度科技园,参加了百度 AI DAY 活动,不仅吃到了「文小言」的一手大瓜,还非常荣幸的采访到了语音技术大牛——百度语音首席架

    阅读全文
  • 文章封面

    终于等到免费且开源的DeepResearch!智谱发布AutoGLM沉思,操纵电脑搞科研太玄幻了

    作者:夕小瑶科技说发布日期:2025-03-31 11:52:27

    大家好,我是小瑶,你们的 AI 前排吃瓜 + 深度解读博主,今天人在中关村论坛——还记得之前眼馋 OpenAI 那个死贵死贵的 Deep Research 吗?一个月 200 美刀,还得翻山越岭才能用

    阅读全文
  • 文章封面

    Gemini-2.5-Pro 大战 Deepseek-V3-0324

    作者:夕小瑶科技说发布日期:2025-03-30 11:49:36

    这周谷歌 Gemini 2.5 Pro 和 Deepseek V3-0324 相继发布,成为了这两天讨论最多的两个模型。但是,这俩模型发布的风格却迥然不同。Gemini 2.5 Pro ,以一种“屠榜

    阅读全文
  • 文章封面

    Multi-Agents 系统太难搞了,不要轻易尝试 | UC Berkeley 论文分享

    作者:夕小瑶科技说发布日期:2025-03-27 22:03:26

    这两年,AI 领域最激动人心的进展莫过于大型语言模型(LLM)的崛起,LLM 展现了惊人的理解和生成能力。在此基础上,一个更宏伟的构想应运而生:构建多智能体系统(Multi-Agent System,

    阅读全文
  • 文章封面

    半夜真地震了!DeepSeek V3新版本,官方发布跑分 ,击溃 GPT-4.5、Claude-3.7

    作者:夕小瑶科技说发布日期:2025-03-26 03:07:32

    昨天,DeepSeek 在毫无预告的情况下,悄悄上线了 DeepSeek-V3-0324——看似“小版本更新”的模型,经过一天的发酵,已经引发了一波地震。但我没想到的是,就在刚刚,发生了一波真的地震—

    阅读全文
  • 文章封面

    Andrej Karpathy一条动态炸了!提出新概念引发400万人围观

    作者:夕小瑶科技说发布日期:2025-03-25 09:10:00

    AI 圈的“顶流”Andrej Karpathy 在 X 上发了一条动态,彻底炸了锅。这位前特斯拉 AI 负责人、OpenAI 联合创始人,用一贯的轻松语气提出一个新概念:“有一种新的编程方式我称之为

    阅读全文
  • 文章封面

    人人都是程序员的时代来了!百度秒哒全量上线,零代码开发应用的搞钱神器?

    作者:夕小瑶科技说发布日期:2025-03-24 18:46:33

    今天,笔者受邀来到了百度科技园,参加百度 AI 开放日活动——这次主角是“秒哒”。Manus 一码难求和复现热潮还没过,没想到,百度秒哒来踢馆了!而且宣布,这次是正式全量上线。去年 11 月在百度世界

    阅读全文
  • 文章封面

    手把手教你用 MCP 连接 Claude3.7 与 Blender,一句话生成 3D 场景

    作者:夕小瑶科技说发布日期:2025-03-19 10:27:34

    最近在推特上刷到一条视频,特别火爆,彻底把我看呆了。请看视频效果——Prompt: 在 blender 中创建一个龙站在一堆金币旁边的场景。确保照明活泼有趣,整体效果精致。使用适当的材质,使最终渲染效

    阅读全文
  • 文章封面

    “母猪产后护理,问腾讯元宝”,AI的广告已打进农村

    作者:夕小瑶科技说发布日期:2025-03-17 20:54:32

    最近刷信息流的时候,被一个东西笑喷了——“母猪产后护理难,问腾讯元宝”没错,就是那个腾讯的 AI 产品——元宝。。。它的广告就这么直白地刷在农村的墙上,还是这么接地气儿的标语。好家伙,以后养猪都不用叫

    阅读全文
  • 文章封面

    Gemini 2.0 原生绘画能力惊艳我了,兑现了我对 GPT-4o 曾经的幻想!

    作者:夕小瑶科技说发布日期:2025-03-14 08:00:00

    等了好久,谷歌终于开放了 Gemini 2.0 的原生绘图能力。其实,Gemini 2.0 系列模型早在2024 年 12 月 就正式发布了,是谷歌首次支持原生多模态输出的版本(文本、图像、音频),但

    阅读全文
上一页下一页