高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
新智元报道 编辑:定慧【新智元导读】AI频频刷新基准测试纪录,却算不清「strawberry」里到底有几个字母r,在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起,例如由一名高中生开发
阅读全文新智元报道 编辑:定慧【新智元导读】AI频频刷新基准测试纪录,却算不清「strawberry」里到底有几个字母r,在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起,例如由一名高中生开发
阅读全文新智元报道 编辑:LRS【新智元导读】史上最大的基因组AI模型Evo 2使用超过12.8万个基因组数据训练,包含9.3万亿个核苷酸,能预测突变效应、设计 DNA 序列,并通过可视化工具展示学习到
阅读全文新智元报道 编辑:Aeneas 桃子【新智元导读】刚刚,出门问问2024年报正式发布!过去一年,集团AIGC纯软件产品收入突破2.2亿元,同比增长88.5%,高毛利驱动总收入达3.9亿元。这家「
阅读全文新智元报道 编辑:LRST【新智元导读】「思维链劫持」(H-CoT)的攻击方法,成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明,这些模
阅读全文新智元报道 编辑:LRST【新智元导读】Spatial-RAG结合了空间数据库和大型语言模型(LLM)的能力,能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式,Spatial-RAG可
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】巨头英伟达,即将收购阿里前副总裁贾扬清的初创Lepton AI,交易价值或达数亿美元!而Lepton AI,仅仅创立两年。就在刚刚,国内AI圈被这一
阅读全文新智元报道 编辑:KingHZ 犀牛【新智元导读】前英特尔CEO、科技行业大佬帕特·基辛格(Pat Gelsinger)再次出山,加入风投企业Playground Global,重点投入硬科技,
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】近日,一则重磅消息引爆业内——vivo官宣成立机器人Lab,正式进军机器人行业!不是赶热点,不是盲目下场,30年积累,或让这枚「巨无霸」的入局在业内
阅读全文新智元报道 编辑:编辑部 HNZY【新智元导读】AI音乐,从此进入「会思考」的时代!刚刚,昆仑万维扔出一枚重磅炸弹——全球首款音乐推理大模型Mureka O1横空出世,实力碾压Suno,强势登顶
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】AI如何重塑孩子的未来?听力熊Teeni.AI首席科学家张驰携自进化智能体AppAgentX重磅亮相,要把AI打造成孩子成长路上的「最佳拍档」。这不
阅读全文新智元报道 编辑:LRST【新智元导读】OpenGS-SLAM是一种新的RGB-only SLAM系统,专门用于无界户外场景。它通过点图回归网络和3D高斯分布(3DGS)表示,实现了精准的相机定
阅读全文新智元报道 编辑:编辑部【新智元导读】685B的DeepSeek-V3新版本,就在昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7,网友们实测后大
阅读全文新智元报道 编辑:LRS【新智元导读】块离散去噪扩散语言模型(BD3-LMs)结合自回归模型和扩散模型的优势,解决了现有扩散模型生成长度受限、推理效率低和生成质量低的问题。通过块状扩散实现任意长
阅读全文新智元报道 编辑:英智【新智元导读】本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonn
阅读全文新智元报道 编辑:桃子 好困【新智元导读】氛围编程彻底火了。刚刚,没有任何Swift编程经验的Karpathy亲自代言,通过与ChatGPT多轮对话,仅用400行代码构建出自己的首个iOS应用。
阅读全文新智元报道 编辑:犀牛【新智元导读】随着AI智能体的爆发,Browser Use异军突起,刚刚融资1700万美元。它能让AI智能体轻松地「读懂」网站并自动完成复杂任务,引领了一波AI应用热潮。A
阅读全文新智元报道 编辑:LRST【新智元导读】视觉+语音=更强的语音识别!BPO-AVASR通过优化音视频输入和输出偏好,提升语音识别在真实场景中的准确性,解决了传统方法在噪声、口语化和视觉信息利用不
阅读全文新智元报道 编辑:JNY【新智元导读】最新一期TED采访中,奥特曼重申对OpenAI率先发布AGI的信念,并称没有多少人会关心。全程45分钟,他还重点分享了自己对AI未来的独特看法。奥特曼再谈A
阅读全文新智元报道 编辑:KingHZ【新智元导读】Epoch AI高级研究员预测:2030年实现人类水平的AI的可能性至少10%。他认为AI从监督学习到GenAI,模型范式转变迅捷,预测AI只能从第一
阅读全文新智元报道 编辑:KingHZ【新智元导读】Diffusion模型,学会了自我纠正!无需强化学习等后训练,扩散在语言建模中实现了自我纠错,达到了计算效率匹配的最优性能,找到了证据下界(ELBO)
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】最近,国内这家公司让扫地机器人「长」出手臂,直接化身新物种!甚至,它还装上了具身大模型「大脑」,开始尝试理解真实的物理世界。这一次,扫地机器人行业被
阅读全文新智元报道 编辑:LRST【新智元导读】澳大利亚国立大学团队提出了ARINAR模型,与何凯明团队此前提出的分形生成模型类似,采用双层自回归结构逐特征生成图像,显著提升了生成质量和速度,性能超越了
阅读全文新智元报道 编辑:定慧【新智元导读】Nvidia刚刚发布了「世界生成」模型Cosmos-Transfer1,可以根据多种模态的空间控制输入(如分割、深度和边缘)生成世界模拟,使得世界生成具有高度
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】微软腾讯王炸组合正式官宣了!1000+精选安卓应用涌入Windows生态,让你的电脑秒变「大屏手机」,彻底打破PC与移动世界的次元壁。你,是否曾这
阅读全文新智元报道 编辑:JNZ【新智元导读】就在今天凌晨,OpenAI的全新音频模型上线了!语音智能体的时代正式开启了!现在可以利用新的语音模型,指导GPT-4o的说话语气:想温柔就温柔,让疯狂就疯狂
阅读全文新智元报道 编辑:KingHZ【新智元导读】有25万块GPU的CoreWeave,已提交上市文件,计划IPO。虽然有英伟达等支持,但CoreWeave估值350亿美元,并不被媒体看好。而科技媒体
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】前脚被谷歌点名感谢空间训练平台,后脚又开源了空间模型!杭州六小龙群核科技发了一个空间理解开源模型SpatialLM,让机器人刷一段视频,就能理解物理
阅读全文新智元报道 编辑:编辑部 HNX【新智元导读】波士顿动力的Atlas机器人又双叒叕来了!从最初的液压「电缆尾巴」到现在全电动AI增强版,这个机器人不仅会翻跟头、跳街舞,还学会了倒立侧翻,甚至开始
阅读全文新智元报道 编辑:LRST【新智元导读】EgoNormia基准可以评估视觉语言模型在物理社会规范理解方面能力,从结果上看,当前最先进的模型在规范推理方面仍远不如人类,主要问题在于规范合理性和优先
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】万众瞩目的Blackwell Ultra终于登场亮相,专为DeepSeek R1这样的推理模型打造,性能直达Hoper的40倍!而下一代GPU「R
阅读全文