Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

De zero a um: criando seu primeiro fluxo de trabalho de automação de vídeo com IA com Coze e Cutscene

Um novo modelo de produção de vídeo está surgindo. O processo de vídeo, que costumava exigir a colaboração de uma equipe profissional, agora é compactado em algumas etapas com o apoio da IA, criando uma linha de produção automatizada. Desde a redação, a síntese de voz até a saída da edição, todo o processo pode ser concluído em meia hora, no mínimo, enquanto o custo de geração de um único vídeo é de apenas alguns yuans, levando alguns segundos.

O núcleo dessa automação, baseado na tecnologia Coze (fivela) com 剪映 As duas ferramentas são sinérgicas. Juntas, elas formam uma plataforma de criação de fluxo de trabalho que permite que muitos gêneros de vídeo que tiveram sucesso comprovado nas mídias sociais, como conhecimento científico, histórias históricas, cura psicológica etc., sejam encapsulados em modelos replicáveis. Tudo o que o produtor precisa fazer é inserir um tópico ou palavra-chave, e a IA automatiza todos os processos subsequentes e envia um rascunho do produto final diretamente para o produtor. 剪映 para ajuste fino manual ou liberação direta.

existir Coze Esses modelos de fluxo de trabalho encapsulados estão se tornando onipresentes no ecossistema de corpos inteligentes. Estilos de vídeo como o pixelizado, a cura das avós e a saúde dos povos antigos, que anteriormente ganharam muita atenção em plataformas como Shake Yin e Xiaohongshu, agora são mercadorias digitais que podem ser geradas com um único clique. Os usuários geralmente são direcionados para as comunidades por meio da leitura de códigos QR ou visitando links específicos para acessar esses modelos, o que gerou um novo modelo de negócios: a venda de fluxos de trabalho.

Os desenvolvedores desses fluxos de trabalho, um grupo imaginativamente chamado de "vendedores de pás", recebem uma parte oficial dos lucros dos smarts e plug-ins que criam na plataforma. Ao mesmo tempo, eles também ganham dinheiro por meio de transações privadas, oferecendo serviços como cursos, associações à comunidade e fluxos de trabalho personalizados.

Em um futuro próximo.Coze Os funcionários anunciaram que estão trazendo sua plataforma de desenvolvimento Coze Studio e plataforma de operação e manutenção Coze Loop Código aberto, usando Apache 2.0 Acordo. Isso significa que qualquer desenvolvedor e empresa pode usar, modificar e redistribuir seu código-fonte para fins comerciais gratuitamente. Essa iniciativa deu um grande impulso ao setor de AI A onipresença dos fluxos de trabalho oferece uma poderosa ferramenta subjacente para desenvolvedores de pequeno e médio porte.

Endereço do projeto no GitHub.

https://github.com/coze-dev/coze-studio

Então, como esses fluxos de trabalho de vídeo automatizados são criados? Eles podem realmente substituir completamente o trabalho manual? Nós realmente fizemos isso e desmontamos todo o processo.

Teste: Criação de um fluxo de trabalho de vídeo para "Ancient Health"

Antes de criar qualquer fluxo de trabalho de vídeo, você precisa primeiro classificar sua lógica de geração. Tomemos como exemplo o vídeo "Ancient people's health", cujos elementos principais incluem: texto, imagens correspondentes ao texto e narração de fundo.

Assim, a lógica central do fluxo de trabalho pode ser dividida da seguinte forma:Tema de entrada -> IA gera cópia -> IA gera script de espelho -> IA gera imagem -> IA sintetiza voz -> Exportação de portfólio.

As próximas etapas mostram como o Coze no qual esses nós lógicos são vinculados para criar um fluxo de trabalho completo.

Em primeiro lugar, abra o Coze Site, crie um novo fluxo de trabalho no espaço de trabalho. O painel terá dois nós de base "Start" e "End" por padrão.

Etapa 1: Gerar tema e cópia do vídeo

O ponto de partida do fluxo de trabalho é responder à entrada do usuário, portanto, é necessário um grande nó de modelo de linguagem. Fazemos isso definindo um prompt (Prompt) para instruir o AI Gerar um estilo específico de cópia com base nas palavras-chave inseridas pelo usuário.

A configuração da função do modelo (System Prompt) é fundamental e determina a AI O estilo de saída do

A palavra completa do prompt do sistema está abaixo:

# 角色
你是一位擅长创作养生知识、接地气且人间清醒的文字创作者。你能够根据用户输入的内容,提炼深层感悟,用真挚且通俗易懂的语言,结合精炼、有反差和亮点的短句组合,生成一段不超过100字,能够引发深思以及学习养生之道的文本。
# 技能
- 创作精炼有意思且通俗易懂的养生知识语句。
- 当用户输入相关内容并要求创作精炼接地气的养生知识内容时,深入分析用户输入内容,挖掘其中普遍存在的养生知识内容、生活常识以及能够引发普通人共鸣的养生之道。
- 提炼核心内容,用贴近生活、朴实无华的语言,将其转换为一系列直击人心、易于理解的短句或短语。
- 通过巧妙组合这些知识,形成一段整体不超过100字的文本,组合方式应自然流畅,或通过生活化的对比、温和的转折,制造令人眼前一亮,容易记住的亮点和共鸣。
- 确保每次生成的文本紧密围绕用户输入,又能从中提炼出普通人都能理解的养生学知识和建议。
- 每次根据不同的输入、生成的内容风格、情感侧重或表达方式应体现差异化,避免模式化。
- 仅输出和内容有关的内容,引导或无关内容均不输出。
# 限制
- 回答内容必须围绕用户输入内容,仅回答养生知识相关内容,创作通俗易懂、接地气的语句组合,拒绝回答无关话题。
- 所输出内容必须是原创创作,不得抄袭已有内容。
- 生成的整段文本的总字数(不含标点符号),不得超过100字。

Etapa 2: Gerar uma divisão de vídeo

Depois de gerada a cópia, ela precisa ser convertida em um script dividido para o vídeo. Isso requer novamente um grande nó de modelo de linguagem cujas entradas são a cópia gerada na etapa anterior e cujas saídas são descrições estruturadas de cenas divididas, legendas e dicas geradas por imagens.

Palavras de prompt do sistema correspondentes:

# 角色
你是一位专业且资深的国风水墨画老爷爷视频创作者,拥有养生学博士学位,在国风养生老爷爷视频创作领域经验极为丰富。你不仅能够深入理解用户需求,还擅长依据给定关键词,精心创作出高质量的国风水墨画老爷爷视频分镜脚本、相应字幕以及画面提示词。
# 技能
- 生成古代国风水墨画老爷爷视频相关内容。
- 仔细从用户给到的{{doc}}中合理分割得出字幕内容。
- 将分割得出的字幕另外输出一个对应的英文翻译版本。
- 根据分割出来的每一句内容,生成符合养生主题的国风水墨画老爷爷图案的详细描述词。
- 对生成的分镜脚本,检查动作描述是否清晰明确,若不清晰需进一步细化。
- 科学合理地设置分镜脚本的时长,确保整体视频节奏流畅。
# 限制
- 仅围绕生成国风水墨画老爷爷视频相关内容进行回复,坚决拒绝回答无关话题。
- 所输出的分镜脚本、字幕、画面提示词必须严格符合相应要求,任何内容都不能偏离框架要求。
- 分镜脚本的动作描述要精准清晰,时长设置要科学合理且符合实际创作逻辑。

Etapa 3: Gerar em lote imagens de escopo dividido

Com os descritores de quadro (ou seja, imagens) para cada subparcela PromptA próxima etapa é gerar as imagens. Como cada vídeo contém várias imagens, é necessário usar o nó "Batch" aqui, para que o AI Fazer um loop na tarefa de geração de imagens.

Dentro do nó de lote, várias ferramentas podem ser vinculadas em série. A primeira é o nó Image Generation.

Para garantir um estilo de vídeo uniforme, você pode usar a ferramenta "chave" para remover o plano de fundo ou sobrepor a imagem do tema a um plano de fundo uniforme.

Por fim, use a ferramenta "Drawing Board" para predefinir o layout da tela final, como determinar a posição das legendas, a escala da tela (horizontal ou vertical) etc.

Etapa 4: Gerar leituras de voz

Áudio.Coze O plug-in oficial "Speech Synthesis" está incorporado. Chame o plug-in diretamente, use o texto gerado na primeira etapa como entrada e selecione o tom e a velocidade de fala apropriados para gerar uma narração.

Etapa 5: Exportar para o Cutscreen

Atualmente, haverá Coze Fluxo de trabalho e 剪映 A conectividade, em geral, depende do plug-in desenvolvido por terceiros "Cropping Assistant". Ao chamar o plug-in create_craft Essa função permite agrupar todos os clipes (imagens, áudio, legendas) gerados anteriormente em um rascunho de tela cortada.

Depois de configurar os parâmetros de rascunho e os parâmetros de material, conecte todos os nós ao módulo "End" e um fluxo de trabalho completo será criado.

Após a execução do fluxo de trabalho, será gerado um link de rascunho, que será aberto no computador em que o "Cutting Assistant" estiver instalado, e o material será automaticamente sincronizado com o 剪映 no software.

Esse fluxo de trabalho é apenas um modelo básico. Modificando as palavras-chave do sistema e chamando os nós da ferramenta, é possível criar vários estilos de vídeos, como animações do Tinder, vlogs de aprendizado e citações de vovós sóbrias.

Vídeos mais complexos, como os já populares curtas-metragens em estilo pixel, são implementados por meio de fluxos de trabalho aninhados (um fluxo de trabalho chamando outro).

Observe que a execução de um fluxo de trabalho consome o Coze Pontos de recursos da plataforma. Um "vídeo sobre saúde" consome aproximadamente 2.000 pontos. Atualmente, a plataforma oferece uma pequena quantidade de créditos gratuitos por dia, e os recursos adicionais precisam ser adquiridos mediante o pagamento de uma taxa.

O ecossistema de conteúdo na onda da automação

apesar do fato de que a construção Coze O fluxo de trabalho tem um certo limite de aprendizado, mas sua principal atração está na capacidade totalmente automatizada de "construir uma vez, produzir continuamente". Ele elimina o tedioso processo tradicional de AI O processo de produção de vídeo (geração de cópia -> conversão de script -> geração de vídeo -> pós-produção) é integrado em uma plataforma unificada.

Esse limiar e essa lacuna de informações alimentaram diretamente o negócio de venda de fluxos de trabalho prontos. Mas o lado negativo também é muito óbvio:AI Isso reduziu muito o limite criativo, levando a uma séria homogeneização do conteúdo e a uma velocidade sem precedentes de iteração de hotspots.

Nesse modelo, a função do operador de conta de mídia social está mais próxima da função de um "operador" de distribuição e monitoramento de conteúdo do que da função de um "criador" tradicional, e é difícil para ele estabelecer barreiras criativas essenciais em processos automatizados. Em contrapartida, as "pessoas da pá" que desenvolvem e iteram fluxos de trabalho estão mais próximas da função de criadores. Eles precisam ficar por dentro do que está em alta, projetando e otimizando novos modelos e plug-ins para continuar lucrando com a corrida do ouro.

A rigor, a atual produção em massa AI O vídeo é essencialmente uma "videoização gráfica" - a junção dinâmica de imagens estáticas, áudio composto e legendas. O valor do fluxo de trabalho é que ele automatiza esse processo de junção. Isso anuncia uma mudança profunda na produção de conteúdo que reformulará a definição do criador, as habilidades necessárias e o modelo de negócios.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil