Sora重要更新:角色一致性大幅增强!
虽然对于直接上传真人图像仍有限制,但Sora 2在角色一致性方面也做了努力。包括:- 可以把已生成视频中的形象存为角色(可以是真人)。- 可以上传本地视频(必须是非真人形象)存为角色。具体操作步骤(从
阅读全文虽然对于直接上传真人图像仍有限制,但Sora 2在角色一致性方面也做了努力。包括:- 可以把已生成视频中的形象存为角色(可以是真人)。- 可以上传本地视频(必须是非真人形象)存为角色。具体操作步骤(从
阅读全文Sora刚刚宣布两项重要升级:1、Pro用户可以在网页端使用“故事板”。2、所有用户都可以生成最长15秒的视频,其中Pro用户可以生成25秒(通过故事板)。来看两个案例:1、城市穿梭画面做城市宣传片很
阅读全文如题,ComfyUI刚宣布已接入Sora 2的API,你只需:1、将ComfyUI升级到最新版(通过运行update文件夹下如图的执行文件更新):2、自行添加如图所示节点“OpenAI Sora -
阅读全文本文搭配AI语音播客,可点击收听OpenAI的Sora当年掀起一股AI视频革命的热潮,结果正式发布后效果让人大跌眼镜。憋了一年多,终于端上了Sora 2,摆出“王者归来”的姿态。但是众所周知,演示效果
阅读全文本文搭配AI语音播客,可点击收听阿里通义实验室日前发布Wan2.5-Preview(下称Wan2.5),相比之前模型,有几大改善:1、多模态架构,支持文本、图像、视频、音频输入和输出2、大幅改善指令遵
阅读全文可灵数字人功能正式上线,最大卖点是可以生成长达1分钟的视频(市面上产品通常只能15秒),实测虽然仍存在瑕疵,但已达到第一梯队的水平。 目前数字人的点数消耗量:720P每秒4点、1080P每秒8点。
阅读全文Nano Banana和即梦4.0以强大的改图功能出圈,但其实它们直接生图同样好用。今天分享的提示词,可以生成以假乱真的自拍照。由于把画面各元素进行了分割,有充分的细节微调空间。请看部分案例:案例1:
阅读全文本文搭配AI语音播客,可点击收听谷歌Nano Banana最近特别火,不过国内大厂反应也很快,字节跳动推出的即梦4.0(Seedream 4.0),就号称对标Nano。用户只要在即梦界面选择如图选项,
阅读全文Nano Banana改图最近很火,谷歌官方表示:Nano Banana可以在以下场景做到优秀的表现:- 文本转图像:根据简单的或复杂的文字描述生成高质量的图像。- 图像+文本转图像(编辑):提供一张
阅读全文多年来,拍证件照都讲究“海马体”,不过随着AI生图的一致性加强,“海马体”也快被取代了。今天就利用Nano Banana,通过下列提示词来生成证件照:截取图片人像头部,做成2寸证件照,要求:1、白底2
阅读全文最近外网比较火的一幅图令人忍俊不禁,截至目前已经获得上千万次观看:X网友@Tz_2022已利用Nano Banana复刻了这个梗,并可以自由替换二次元角色图和妹子(图2-图5),无论角色是不是人类,都
阅读全文本账号文章即日起均搭配AI语音播客,点击收听Nano Banana(纳米香蕉)被认为当前最强的修图模型,尽管谷歌表示它真正的名字应该是Gemini 2.5 Flash Image Preview,但我
阅读全文本账号文章即日起均搭配AI语音播客,点击收听一、神秘的纳米香蕉AI图像生成领域最近发生趣事:一款名为Nano Banana(纳米香蕉)的工具突然出现在X平台、论坛、Discord,并获得用户广泛赞誉。
阅读全文本账号文章即日起均搭配AI语音播客,点击收听AI时代,许多创作降低到零门槛,比如绘本生成,利用谷歌的Gemini可以轻松做到。你可以直接进入Gemini的Storybook页面:https://gem
阅读全文本账号文章即日起均搭配AI语音播客,点击收听GPT-5刚发布一天,网友们已经对它进行了大量测试,评价“褒贬不一”,负面主要集中在:1、模型自动切换,熟悉的GPT-4o、o3都没了。2、一些简单问题竟然
阅读全文本账号文章即日起均搭配AI语音播客,点击收听北京时间8月8日凌晨,OpenAI发布三款新模型:GPT-5、GPT-5 mini 和 GPT-5 nano,这些模型在多个方面都有显著提升。发布会上关于新
阅读全文本账号文章即日起均搭配AI语音播客,点击收听阿里开源又出硬货:刚发布的Qwen-Image,官方宣称“在复杂文本渲染和精确图像编辑方面取得显著进展”,并且取得ComfyUI的原生支持。一、能力测试首先
阅读全文本账号文章即日起均搭配AI语音播客,点击收听Runway Gen一度是AI视频生成的领头羊,不过最近一年被各种赶超。本以为它要被市场淘汰,没想到这次憋出个大的:名为Runway Aleph的“上下文视
阅读全文本账号文章即日起均搭配AI语音播客,点击收听AI视频发展迅速,前几个月许多作品还像“动态PPT”的拼接,现在已经可以初步呈现各种激烈的动作场面(虽然仍不完美),比如这段《龙珠》的真人风格影片:怎么制作
阅读全文马斯克的旗下xAI发布了Grok 4,号称“世界最强模型”,到底强不强,还是不能看广告,而要看疗效。在模型切换到Grok 4之后,最大的区别就是原来Grok 3下方的“深度搜索”不见了,因为Grok
阅读全文之前介绍过,谷歌Veo3的文生视频功能非常强劲,今天分享一个有趣的提示词,可以创造现实中不可能存在的“扇耳光大赛”场景(使用Google Flow工具)。例如:A professional slap
阅读全文沉寂了很长时间之后,Midjourney终于顺应时代,推出了视频模型“V1”版。V1专注于图生视频(没有文生视频功能),目前仅在Midjourney官方网站可用(需要会员)。网址:https://ww
阅读全文最近大家肯定经常看到这样的视频:看着高大上,其实生成方法极其简单,即通过最新的谷歌Veo3工具,输入类似下面的提示词:提示词:身着现代雨衣的中国女记者,与全副武装的中国三国时期蜀国士兵,在泥泞的山路上
阅读全文不少网友发现,即梦已经推出视频3.0 Pro(基于Seedance 1.0 Pro视频模型),这是字节最新最强的视频模型。那么它能否和可灵/Veo3一拼呢?立刻来实测:一、文生视频1、提示词:一只白色
阅读全文