全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Sora重要更新:角色一致性大幅增强!

    作者:王抖抖发布日期:2025-10-30 21:59:05

    虽然对于直接上传真人图像仍有限制,但Sora 2在角色一致性方面也做了努力。包括:- 可以把已生成视频中的形象存为角色(可以是真人)。- 可以上传本地视频(必须是非真人形象)存为角色。具体操作步骤(从

    阅读全文
  • 文章封面

    Sora已经可以生成25秒视频,操作方法来了

    作者:王抖抖发布日期:2025-10-16 18:55:54

    Sora刚刚宣布两项重要升级:1、Pro用户可以在网页端使用“故事板”。2、所有用户都可以生成最长15秒的视频,其中Pro用户可以生成25秒(通过故事板)。来看两个案例:1、城市穿梭画面做城市宣传片很

    阅读全文
  • 文章封面

    ComfyUI接入Sora 2,视频无水印、不用邀请!

    作者:王抖抖发布日期:2025-10-08 18:24:53

    如题,ComfyUI刚宣布已接入Sora 2的API,你只需:1、将ComfyUI升级到最新版(通过运行update文件夹下如图的执行文件更新):2、自行添加如图所示节点“OpenAI Sora -

    阅读全文
  • 文章封面

    Sora 2是一记大招,还是一坨大的?10项测试深度剖析

    作者:王抖抖发布日期:2025-10-02 00:13:28

    本文搭配AI语音播客,可点击收听OpenAI的Sora当年掀起一股AI视频革命的热潮,结果正式发布后效果让人大跌眼镜。憋了一年多,终于端上了Sora 2,摆出“王者归来”的姿态。但是众所周知,演示效果

    阅读全文
  • 文章封面

    Sora 2发布!无偿分享一批邀请码(持续添加中)

    作者:王抖抖发布日期:2025-10-01 13:27:41

    阅读全文
  • 文章封面

    混元图像3.0发布,小程序和网页端可白嫖

    作者:王抖抖发布日期:2025-09-28 12:21:41

    阅读全文
  • 文章封面

    深度测试阿里Wan2.5:大超预期,声画同步直追Veo3

    作者:王抖抖发布日期:2025-09-25 18:29:28

    本文搭配AI语音播客,可点击收听阿里通义实验室日前发布Wan2.5-Preview(下称Wan2.5),相比之前模型,有几大改善:1、多模态架构,支持文本、图像、视频、音频输入和输出2、大幅改善指令遵

    阅读全文
  • 文章封面

    Midjourney V7已接入夸克!内地用户可轻松玩耍

    作者:王抖抖发布日期:2025-09-18 14:10:52

    阅读全文
  • 文章封面

    一张图生成一分钟视频,虚拟歌手要泛滥了!

    作者:王抖抖发布日期:2025-09-15 19:54:09

    可灵数字人功能正式上线,最大卖点是可以生成长达1分钟的视频(市面上产品通常只能15秒),实测虽然仍存在瑕疵,但已达到第一梯队的水平。 目前数字人的点数消耗量:720P每秒4点、1080P每秒8点。

    阅读全文
  • 文章封面

    用Nano Banana/即梦4.0生成超逼真的自拍照

    作者:王抖抖发布日期:2025-09-10 15:31:23

    Nano Banana和即梦4.0以强大的改图功能出圈,但其实它们直接生图同样好用。今天分享的提示词,可以生成以假乱真的自拍照。由于把画面各元素进行了分割,有充分的细节微调空间。请看部分案例:案例1:

    阅读全文
  • 文章封面

    即梦4.0实测:不及Nano Nanana,但仍可圈可点

    作者:王抖抖发布日期:2025-09-08 16:17:23

    本文搭配AI语音播客,可点击收听谷歌Nano Banana最近特别火,不过国内大厂反应也很快,字节跳动推出的即梦4.0(Seedream 4.0),就号称对标Nano。用户只要在即梦界面选择如图选项,

    阅读全文
  • 文章封面

    谷歌公布6条Nano Banana文生图提示词!

    作者:王抖抖发布日期:2025-09-04 11:16:38

    Nano Banana改图最近很火,谷歌官方表示:Nano Banana可以在以下场景做到优秀的表现:- 文本转图像:根据简单的或复杂的文字描述生成高质量的图像。- 图像+文本转图像(编辑):提供一张

    阅读全文
  • 文章封面

    “海马体”也要被Nano Banana取代了,生成效果拔群!

    作者:王抖抖发布日期:2025-09-02 21:24:41

    多年来,拍证件照都讲究“海马体”,不过随着AI生图的一致性加强,“海马体”也快被取代了。今天就利用Nano Banana,通过下列提示词来生成证件照:截取图片人像头部,做成2寸证件照,要求:1、白底2

    阅读全文
  • 文章封面

    用Nano Banana复制爆火梗图“单身狗的忧伤”

    作者:王抖抖发布日期:2025-09-01 16:30:11

    最近外网比较火的一幅图令人忍俊不禁,截至目前已经获得上千万次观看:X网友@Tz_2022已利用Nano Banana复刻了这个梗,并可以自由替换二次元角色图和妹子(图2-图5),无论角色是不是人类,都

    阅读全文
  • 文章封面

    最强P图工具Nano Banana完全教学手册,ComfyUI也可使用

    作者:王抖抖发布日期:2025-08-29 17:02:49

    本账号文章即日起均搭配AI语音播客,点击收听Nano Banana(纳米香蕉)被认为当前最强的修图模型,尽管谷歌表示它真正的名字应该是Gemini 2.5 Flash Image Preview,但我

    阅读全文
  • 文章封面

    Nano Banana正式公布,果然是谷歌大杀器!AI实验室和Gemini可用!

    作者:王抖抖发布日期:2025-08-26 23:31:58

    阅读全文
  • 文章封面

    生成逼真"黑神话钟馗"手办,神秘且强大的"纳米香蕉"三种使用方式

    作者:王抖抖发布日期:2025-08-25 17:27:54

    本账号文章即日起均搭配AI语音播客,点击收听一、神秘的纳米香蕉AI图像生成领域最近发生趣事:一款名为Nano Banana(纳米香蕉)的工具突然出现在X平台、论坛、Discord,并获得用户广泛赞誉。

    阅读全文
  • 文章封面

    DeepSeek V3.1发布,现已可用!把V3与R1统一为更智能的模型

    作者:王抖抖发布日期:2025-08-21 17:08:44

    阅读全文
  • 文章封面

    用Gemini一句话生成有声绘本,秒变绘本大师

    作者:王抖抖发布日期:2025-08-14 20:15:11

    本账号文章即日起均搭配AI语音播客,点击收听AI时代,许多创作降低到零门槛,比如绘本生成,利用谷歌的Gemini可以轻松做到。你可以直接进入Gemini的Storybook页面:https://gem

    阅读全文
  • 文章封面

    都说GPT-5拉跨,但它能打败“弱智吧”段子!

    作者:王抖抖发布日期:2025-08-09 11:27:45

    本账号文章即日起均搭配AI语音播客,点击收听GPT-5刚发布一天,网友们已经对它进行了大量测试,评价“褒贬不一”,负面主要集中在:1、模型自动切换,熟悉的GPT-4o、o3都没了。2、一些简单问题竟然

    阅读全文
  • 文章封面

    GPT5“新王降临”?OpenAI发布会内容速读

    作者:王抖抖发布日期:2025-08-08 08:43:51

    本账号文章即日起均搭配AI语音播客,点击收听北京时间8月8日凌晨,OpenAI发布三款新模型:GPT-5、GPT-5 mini 和 GPT-5 nano,这些模型在多个方面都有显著提升。发布会上关于新

    阅读全文
  • 文章封面

    中文生成能力不输即梦!阿里开源Qwen-Image本地部署教程及测试

    作者:王抖抖发布日期:2025-08-07 21:35:34

    本账号文章即日起均搭配AI语音播客,点击收听阿里开源又出硬货:刚发布的Qwen-Image,官方宣称“在复杂文本渲染和精确图像编辑方面取得显著进展”,并且取得ComfyUI的原生支持。一、能力测试首先

    阅读全文
  • 文章封面

    OpenAI终于Open了,发布两款强力开源模型!5分钟快速本地部署

    作者:王抖抖发布日期:2025-08-06 23:38:04

    阅读全文
  • 文章封面

    "用嘴P视频"功能上线,这世界还有真实可言吗?

    作者:王抖抖发布日期:2025-07-31 21:46:14

    本账号文章即日起均搭配AI语音播客,点击收听Runway Gen一度是AI视频生成的领头羊,不过最近一年被各种赶超。本以为它要被市场淘汰,没想到这次憋出个大的:名为Runway Aleph的“上下文视

    阅读全文
  • 文章封面

    AI视频进化到这种地步了?教你用可灵+海螺生成动作大片!

    作者:王抖抖发布日期:2025-07-30 19:16:31

    本账号文章即日起均搭配AI语音播客,点击收听AI视频发展迅速,前几个月许多作品还像“动态PPT”的拼接,现在已经可以初步呈现各种激烈的动作场面(虽然仍不完美),比如这段《龙珠》的真人风格影片:怎么制作

    阅读全文
  • 文章封面

    “世界最强模型”Grok 4实测:差强人意

    作者:王抖抖发布日期:2025-07-11 23:10:06

    马斯克的旗下xAI发布了Grok 4,号称“世界最强模型”,到底强不强,还是不能看广告,而要看疗效。在模型切换到Grok 4之后,最大的区别就是原来Grok 3下方的“深度搜索”不见了,因为Grok

    阅读全文
  • 文章封面

    用谷歌Veo3制作“动物扇耳光大赛”,大熊猫被迫营业!

    作者:王抖抖发布日期:2025-07-10 16:46:24

    之前介绍过,谷歌Veo3的文生视频功能非常强劲,今天分享一个有趣的提示词,可以创造现实中不可能存在的“扇耳光大赛”场景(使用Google Flow工具)。例如:A professional slap

    阅读全文
  • 文章封面

    Midjourney可以生成视频了,并非最好,但性价比极高!

    作者:王抖抖发布日期:2025-06-19 23:09:51

    沉寂了很长时间之后,Midjourney终于顺应时代,推出了视频模型“V1”版。V1专注于图生视频(没有文生视频功能),目前仅在Midjourney官方网站可用(需要会员)。网址:https://ww

    阅读全文
  • 文章封面

    全网爆火的“时空穿越”视频,制作方法+进阶技巧

    作者:王抖抖发布日期:2025-06-17 22:34:04

    最近大家肯定经常看到这样的视频:看着高大上,其实生成方法极其简单,即通过最新的谷歌Veo3工具,输入类似下面的提示词:提示词:身着现代雨衣的中国女记者,与全副武装的中国三国时期蜀国士兵,在泥泞的山路上

    阅读全文
  • 文章封面

    即梦AI视频3.0 Pro亮相,真能“拳打可灵、脚踢Veo3”?

    作者:王抖抖发布日期:2025-06-12 22:12:52

    不少网友发现,即梦已经推出视频3.0 Pro(基于Seedance 1.0 Pro视频模型),这是字节最新最强的视频模型。那么它能否和可灵/Veo3一拼呢?立刻来实测:一、文生视频1、提示词:一只白色

    阅读全文
下一页