所有文章

郭德纲讲英语相声详细教程

郭德纲用英文说相声的短视频火爆全网,同类型的AI短视频层出不穷,更有好莱坞明星说中文的短视频,不断地出爆款,那么现在我们就开始学习如何制作一个同类型...

Stable Diffusion AnimateDiff | 最火文本生成视频插件

AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像生成过程,生成一系列与训练视频剪辑相似的...

AI虚拟主播数字人技术实现Wav2Lip

本篇是关于AI主播虚拟人的Wav2Lip技术实现与评测,后续还会有其他的相关技术实现与评测。本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语音(这里的核...

Insanely Fast Whisper:超快的Whisper语音识别脚本

项目简介 这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)...

TTS,一个奇妙的AI工具

0. 简介 TTS是一个将文本变换成语音的AI工具。在自媒体盛行的今天,很多人尝试制作视频发到自媒体平台上,通过获得流量的方式实现直接或间接变现。有部分人天...

爆火的“女孩的一生”,plus版教程它来了

animatediff和LCM的酷炫组合:制作炸裂的视频就是这么简单! 嘿,动画和视频制作的小伙伴们,今天我们来聊聊怎样用animatediff和LCM(Lower Complexity Model...

数字人:从科幻走向现实的技术革命

数字人,这一曾被视为科幻领域独有的概念,如今正逐渐走入我们的日常生活。随着科技的飞速发展,尤其是人工智能、虚拟现实、增强现实等技术的突破,数字人已...

【语音识别】OpenAI语音力作Whisper

一、介绍 Whisper 是一系列用于自动语音识别 (automatic speech recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford 等人于2022年9月...

「语音转换新速度」— 探秘Whisper JAX的70倍速提升

在AI的众多分支中,语音识别技术的突破性进展尤为引人瞩目。由Sanchit Gandhi开发的Whisper JAX就是这一创新旅程中的新星。它是OpenAI的Whisper模型的JAX版本...

AI数字人:重构人货场的新力量

随着人工智能技术的飞速发展,生成式AI正在深刻改变着电商行业的运作模式。AI数字人作为生成式AI的一个重要应用领域,正在逐渐成为电商人货场重构的主导力量...
1 2 3 4 39