SSR-Encoder：从图像提取不同特征

SSR-Encoder：从图像提取不同特征

小红书新发布的一个编码器SSR-Encoder，可以实现从一张图片种提取不同的主题（人物、物体等）特征生成图像。与 SD 现有的能力都能结合，Animatediff 也可以。

SSR-Encoder，这是一种新架构，旨在从单个或多个参考图像中选择性地捕获任何主题。它响应各种查询模式，包括文本和掩模，而无需在测试时进行微调。
SSR-Encoder结合了一个Token-to-Patch Aligner，用于将查询输入与图像块对齐，以及一个细节保留的主题编码器，用于提取和保留主题的精细特征，从而生成主题嵌入。
这些嵌入与原始文本嵌入结合使用，条件化生成过程。SSR-Encoder以其模型泛化性和效率为特点，适应于一系列自定义模型和控制模块。通过Embedding Consistency Regularization Loss进行增强，以改进训练。
SSR-Encoder：从图像提取不同特征

正文完

主题图像编码器

发表至：系统工具

2024-01-02

0

如何在 Discord 中发送粗体和大文本

无法读取数据，检查Android修复程序上的SIM卡或网络连接错误

如何阻止 Discord 在 Windows 启动时启动

如何加入错过的 WhatsApp 群组通话

Buttercup密码管理器已升级到Windows，macOS和Linux版本2.0

ChatGPT场景8：化繁为简——信息提取

周杰伦20年黑胶唱片在哪买？淘宝购买连接！

手机号注册不了数字人民币怎么办？

Malwarebytes 4.4 引入了针对 RDP 蛮力攻击和卸载的保护

用AI 帮黑白照片自动变彩色照片，简单好操作，有人拿去赚钱了！

如何找到您的 Gmail 垃圾邮件文件夹并阻止电子邮件进入垃圾邮件

Picd是带有批注选项的基本屏幕截图工具

Twitch OBS 和 NVIDIA 宣布多编码直播

如何在 Windows 10 上使用命令提示符删除文件和文件夹

修复 Win 11/10 上的 Adobe 正版软件验证失败

Microsoft Edge 在每次启动时从 Chrome 中提取数据

I2V-Adapter：直接从图片生成视频

Musicgen-remixer：将音乐重新混音

文章搜索