DeepSeek R1 0528 挑战AI难题“竹竿过门”问题!
6 米长的竹竿,能否通过 4 米高,3 米宽的门?就这么一个简单的问题,难倒了无数大模型。详细的测试情况可以参考:Qwen3实力如何?看这个竹竿过门的问题!豆包回答“竹竿过门”的问题,我尽力了!百度文
阅读全文6 米长的竹竿,能否通过 4 米高,3 米宽的门?就这么一个简单的问题,难倒了无数大模型。详细的测试情况可以参考:Qwen3实力如何?看这个竹竿过门的问题!豆包回答“竹竿过门”的问题,我尽力了!百度文
阅读全文上次写了一篇文章,分享了几种免费使用 Claude4 方法。AI编程:还没玩过Claude4么?给你三种方法快去体验下!但是,Claude4 现在实在是太火了,免费的方法基本被撸秃了。要么很慢,要么限
阅读全文一直听别人说谷歌的NotebookLM 很好用,自己体验了一下真的挺不错。知识库+问答+播客一条龙服务。尤其是它这个一键生成播客的功能非常强大。可以先来感受一下:上面的内容全部由 notebooklm
阅读全文当你一不小心打开一个科技视频,看到它的进度条是这样的:你是什么感想? 我挺想看,但是这进度条,实在是太... 那么有什么办法快速 get 核心内容么?AI 这么牛,应该可以搞定吧,那就拿这个问题来
阅读全文作为普通人,有没有过这样的想法,拿出 500 块,找人给我写个百度,开发一个淘宝。作为开发者,你有没有遇到过这样的人?作为开发者,我肯定遇到过。作为普通人,我也想啊。但是事实上是不可能的。即便单纯给你
阅读全文谷歌 IO 放出大量重磅内容,还来不及一一研究。但是有一点,看起来简单又清晰。当前,在知名的大模型排名平台lmarena (大语言模型竞技场)上,谷歌几乎包揽了所有榜单。LMArena 就像一个 “A
阅读全文ChatGPT上次更新之后,有了一个特别强大的功能,叫“多模态推理能力”。 有了这个功能之后,它就可以对图片进行深度思考。这个功能有啥用呢?用处多了去了。比如根据照片找位置。你只要拍一张照片,分分钟
阅读全文谁能想到 “6米长的竹竿能否通过4米高,3米宽的门?” 这个问题,血洗了一大波最顶尖的AI模型。国外的chatgpt o3,Gemini 2.5pro 国内的百度文心,豆包,阿里qwen3,Deek
阅读全文真的是没想到,一个简单的问题。并不是所有模型都回答得出来。在之前的文章中,我们用“竹竿过门”这个问题考了很多国产模型。几乎团灭,就Qwen3一个人扛下了所有。今天我们来考考 Chatgpt O3。 O
阅读全文“6 米长的竹竿,能否通过高 4 米,宽 3 米的门?” 没想到这么简单的一个问题,让好几个国产AI都躺了。这次我们要请出最火的国产AI--DeepSeek了。DeepSeek 在年初凭借低成本训练
阅读全文百度文心是国使用用人数最多的AI工具,而且他们也一直在对标ChatGPT,目前已经更新到了4.5版本。从模型“名字”上是已经赶上gpt4.5了。同时百度也推出了自己的深度思考模型X1。在前面的两篇文章
阅读全文上一篇文章中,我们用最新的 Qwen3 模型测试一个“竹竿过门” 的问题。 问题的内容是:“6米长的竹竿,能否通过高 4 米,宽 3 米的门?”这个问题对大部分智商中等的人来说,应该没有任何难度。这个
阅读全文Qwen3 出来几天了,说它牛的人很多,说的弱的也不少。今天B站给我推了一个视频,博主对 qwen3 进行了各种示例测试,并且和 deepseek 和 o3 做了对比,得出的结论是“很糟糕”。其中有测
阅读全文豆包还能把模型下载到本地? 今天在某台电脑升级豆包的时候突然跳出一个提示,说是可以下载模型到本地,然后离线加载自己的知识库,进行检索和问答。这个页面又有一种非常熟悉的感觉!这不就是当年英伟达本地检索D
阅读全文Ollama的Qwen3页面中有这样一段描述:Qwen3是Qwen系列中最新一代的大型语言模型,提供了一套全面的稠密(dense)和混合专家(MOE)模型 ...... 此外,小型MoE模型Qw
阅读全文凌晨 5:05 分,Qwen 发推宣布,Qwen3 来了!推文非常长,亮点也很多。推文包含的核心内容如下:Qwen3包括 2 个混合专家(MoE)模型和 6 个密集模型,参数规模从 6 亿到 2350
阅读全文AI 天天都在升级,单看那些基准测试总是有点抽象。我一直想找一些实际的场景来对比一下。当我看到这这一张图片的时候,突然有了一个想法。ChatGPT 已经具备了基于图文的深度思考能力,那么我直接把这张图
阅读全文OpenAI最新的图像生成 API 释放之后,想象空间巨大。先简单的看几个例子。名片设计:通过两张参考图片和风格提示,直接生成名片设计。直接生成极简主义家具:根据服装来设计与之匹配的包包:风格化的生日
阅读全文前段时间火爆全网的 ChatGPT 图片功能又有更新了。上次的吉卜力风格是可玩性高,而这次的更新明显是要强调实用性强,尤其是在设计相关方面。从事各类设计工作的人,要好好关注一下了。 AI 在创意和设计
阅读全文Trae 这次的更新,深得我心!Trae是一个类似 VSCODE 转为 AI 辅助编程而设计的变成软件。在之前的文章中,我有分享过完整的安装使用方法。Trae 目前还是完全免费的状态,只要注册登录,就
阅读全文DeepSeek在年初突然火爆全网,主要就是因为他的 R1 模型。这个模型使用了一种叫思维链(CoT)的技术,让模型可以进行深度思考。 正是因为这项特性,加上完全免费,开源,DS快速进入大家视野,几乎
阅读全文今日凌晨 1:33 分, 在我们做梦的时候,OpenAI又更新了!前天是更新 gpt4.1 的 API,昨天是更新了 chatgpt 的图库。而今天的更是 o3 和 o4-mini。更新公告中提到:“
阅读全文OpenAI 的GPT-4.1 API来了。包含三个版本:GPT-4.1, GPT-4.1 mini, and GPT-4.1 nano这次更新主要的变化是:写代码更强了更加听话了脑容量大了视觉解题能
阅读全文一个多月前,我分享一个白嫖 XAI 的 150 美金(1093RMB) 攻略,但是当时只能用 Grok2,一直在等Grok3的到来!现在xAI 下面最强的模型 Gork3 终于放出API 了。Grok
阅读全文美国时间 4 月 1 日愚人节这一天,OpenAI发布了一个很有趣的更新。这次更新的是一个叫星期一(Monday)的声音。推特中特意强调“这不是开愚人节玩笑,ChatGPT 添加了一个新的声音”。调高
阅读全文如果,你是一个开发者,我提出一个需求:不能调用 API,全部使用本地大模型,要实现文字,语音,视频聊天。聊天系统,要能理解你发送的文字,图片,声音和视频,并给出文字和语音回答。 开发这样一个系统,你记
阅读全文你们火山引擎的免费配额用完了么?刚刚收到一个邮件消息。看标题是个坏消息,我还有一堆配额没用完呢?仔细看了一下邮件,原来是换上最新的 0324 模型了。 我还一直在等,第三方平台什么时候更新最新版模型呢
阅读全文自从 OpenAI 给我的Plus账号降智之后,我对它已经充满了“偏见”。但是,最近这次绘画能力的更新,又让他对它产生了不少的好感。这次功能更新之后,大家玩得最多的是一个叫“吉卜力”的风格。首先是Op
阅读全文人工智能领域作为目前最热门的领域,真的是一日千里。你只要一个星期不关注,一下子就不知道从何追起了。这个星期才过来两天!!!大厂们已经拼得面红耳赤。快来看看,这两天都有什么重磅更新吧。深度求索 V3-0
阅读全文