本账号文章即日起均搭配AI语音播客,点击收听一、神秘的纳米香蕉AI图像生成领域最近发生趣事:一款名为Nano Banana(纳米香蕉)的工具突然出现在X平台、论坛、Discord,并获得用户广泛赞誉。
阅读全文本账号文章即日起均搭配AI语音播客,点击收听AI时代,许多创作降低到零门槛,比如绘本生成,利用谷歌的Gemini可以轻松做到。你可以直接进入Gemini的Storybook页面:https://gem
阅读全文本账号文章即日起均搭配AI语音播客,点击收听GPT-5刚发布一天,网友们已经对它进行了大量测试,评价“褒贬不一”,负面主要集中在:1、模型自动切换,熟悉的GPT-4o、o3都没了。2、一些简单问题竟然
阅读全文本账号文章即日起均搭配AI语音播客,点击收听北京时间8月8日凌晨,OpenAI发布三款新模型:GPT-5、GPT-5 mini 和 GPT-5 nano,这些模型在多个方面都有显著提升。发布会上关于新
阅读全文本账号文章即日起均搭配AI语音播客,点击收听阿里开源又出硬货:刚发布的Qwen-Image,官方宣称“在复杂文本渲染和精确图像编辑方面取得显著进展”,并且取得ComfyUI的原生支持。一、能力测试首先
阅读全文本账号文章即日起均搭配AI语音播客,点击收听Runway Gen一度是AI视频生成的领头羊,不过最近一年被各种赶超。本以为它要被市场淘汰,没想到这次憋出个大的:名为Runway Aleph的“上下文视
阅读全文本账号文章即日起均搭配AI语音播客,点击收听AI视频发展迅速,前几个月许多作品还像“动态PPT”的拼接,现在已经可以初步呈现各种激烈的动作场面(虽然仍不完美),比如这段《龙珠》的真人风格影片:怎么制作
阅读全文马斯克的旗下xAI发布了Grok 4,号称“世界最强模型”,到底强不强,还是不能看广告,而要看疗效。在模型切换到Grok 4之后,最大的区别就是原来Grok 3下方的“深度搜索”不见了,因为Grok
阅读全文之前介绍过,谷歌Veo3的文生视频功能非常强劲,今天分享一个有趣的提示词,可以创造现实中不可能存在的“扇耳光大赛”场景(使用Google Flow工具)。例如:A professional slap
阅读全文沉寂了很长时间之后,Midjourney终于顺应时代,推出了视频模型“V1”版。V1专注于图生视频(没有文生视频功能),目前仅在Midjourney官方网站可用(需要会员)。网址:https://ww
阅读全文最近大家肯定经常看到这样的视频:看着高大上,其实生成方法极其简单,即通过最新的谷歌Veo3工具,输入类似下面的提示词:提示词:身着现代雨衣的中国女记者,与全副武装的中国三国时期蜀国士兵,在泥泞的山路上
阅读全文不少网友发现,即梦已经推出视频3.0 Pro(基于Seedance 1.0 Pro视频模型),这是字节最新最强的视频模型。那么它能否和可灵/Veo3一拼呢?立刻来实测:一、文生视频1、提示词:一只白色
阅读全文最近黑森林工作室推出了FLUX.1 Kontext,这是一款可以支持上下文的新工具,主要优点:一致性:在多个场景和环境中保留图像的元素本地编辑:对图像中特定元素针对性修改,不影响其余元素样式参考:保留
阅读全文AI视频已经攻克了“威尔史密斯吃意面”,下一座高山是“体操动作”,因为涉及到复杂的物理规则和人体解剖。 那么,目前最强的视频工具谷歌Veo3能否完成任务? 答案是:依旧不能!但在目前的工具当中是表
阅读全文谷歌发布了AI视频模型工具Veo 3,生成视频的同时可同步嵌入音效,且视频表现也比本已很强的Veo 2更进一步! 目前Veo 3暂未对公众开放,但可通过订阅Goolge AI会员获取访问权限。
阅读全文语音模型经过一段时间的发展,现在效果相当成熟,国产AI同样表现亮眼。MiniMax日前发布的语音大模型Speech-02在国际权威的两项语音评测榜单上,超过OpenAI和ElevenLabs登顶,而且
阅读全文之前GPT-4o生成吉卜力画风,着实火了一阵。其实GPT-4o的生图能力远不止于此,今天就来介绍一些特别的提示词,其中有的效果估计你已经见过(却不知怎么生成)!注:所有参考提示词中括号【 】里面
阅读全文阿里开源了当前最强的千问3(Qwen3)模型,包含从0.6B到235B的非常全面的规格,总有一款适合你。官方宣称其亮点在于:1、显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越之前的模型;2
阅读全文HiDream-I1是HiDream-ai(HiDream-ai)开源的文生图模型,17B参数,在多个基准测试中表现出色,许多网友实测认为:不逊于Flux。目前HiDream已获得ComfyUI官方原
阅读全文可灵刚刚推出了2.0版重大更新,作为目前主流视频生成工具,可灵这次更新颇受关注。下面就和1.6版进行详细对比测试(每个案例生成四次,选取表现最好的一次):一、文生视频1、提示词:一只白色的猫从街边的矮
阅读全文市面上效果优秀的数字人产品,通常价格昂贵(比如HeyGen),不过近期硅基智能开源了一款工具HeyGem,可作为平替。看下效果,让老黄念一段“英伟达耍猴”的新闻消息:接下来就讲讲本地部署方法(Wind
阅读全文最近很火的GPT4o转绘,让每个人都有了当“艺术家”的机会。比如简单制作一个吉卜力画风的《星际穿越》预告片! 图像转绘:GPT4o 图生视频:可灵Kling 其实GPT的新绘图功能远不止这一种,理
阅读全文AI领域竞争加剧,或许是受到此前Gemini 2.0 Flash的刺激(点击看文章),OpenAI一改墨迹的作风,直接推出GPT4o的图像生成模式。新功能对Plus、Pro、Team、免费用户全量开放
阅读全文相信很多人都玩过一些闭源视频工具(如可灵、Pika)的特效功能,膨胀、挤压、变身...通过阿里开源的万相Wan2.1加上合适的LoRA,这些不难实现,比如把这个宇树机器人挤扁:下面就讲讲具体操作过程。
阅读全文