A Oomol é uma plataforma de fluxo de trabalho programável por IA que oferece um aplicativo de desktop chamado Oomol Studio. O núcleo dessa plataforma é uma visualização que permite aos usuários criar processos automatizados arrastando e soltando nós funcionais como blocos de construção. Esses nós podem ser trechos de código (compatíveis com Python e Node.js), serviços de API ou módulos LLM (Large Language Model) integrados à plataforma. A Oomol oferece um ambiente de desenvolvimento unificado para programação e processamento de dados, e os usuários não precisam instalar e configurar ambientes Python ou Node.js em seus próprios computadores porque a plataforma resolve o problema da consistência do ambiente por meio da tecnologia de contêineres. O problema da consistência do ambiente. Dessa forma, os fluxos de trabalho criados podem ser executados e compartilhados sem problemas em qualquer dispositivo com o Oomol instalado. A plataforma é adequada não apenas para desenvolvedores e cientistas de dados que precisam trabalhar com dados, mas também para desenvolvedores não profissionais, como criadores de conteúdo, para automatizar tarefas repetitivas, como legendas de vídeo, compactação de imagens etc., com o objetivo principal de ajudar os usuários a transformar rapidamente suas ideias em produtos automatizados executáveis.
Lista de funções
- Criação de fluxo de trabalho visualInterface gráfica: fornece uma interface gráfica para criar processos de tarefas automatizadas arrastando e soltando nós com diferentes funções e conectando-os.
- Ambiente de programação incorporadoUse os ambientes de desenvolvimento Python e Node.js integrados e baseados em contêineres diretamente, sem instalação local.
- Editor de código profissionalIntegração de um editor de código baseado em VSCode que ofereça suporte ao preenchimento automático de código, realce de sintaxe e visualização de registros.
- Visualização de dadosSuporte para o uso de
pandas
responder cantandoplotly
e outras bibliotecas para processar os dados e gerar e apresentar gráficos diretamente na plataforma. - Módulo de IA incorporadoA plataforma tem uma variedade de módulos LLM (Large Language Models) integrados que podem ser chamados diretamente para simplificar o desenvolvimento de aplicativos de IA.
- compartilhamento comunitário: os usuários podem compartilhar fluxos de trabalho completos ou módulos funcionais individuais que criaram com a comunidade, além de poderem usar diretamente os resultados compartilhados por outras pessoas na comunidade.
- processamento multimídiaSuporte ao agrupamento de bibliotecas de processamento de vídeo (por exemplo, FFmpeg) como nós de função para facilitar aos criadores de conteúdo a automatização de tarefas de áudio e vídeo.
- Processamento de dados estruturados e não estruturadosCapacidade de estruturar processos de forma flexível para lidar com diferentes tipos de dados, incluindo dados tabulares e arquivos multimídia, como áudio, vídeo e PDF.
Usando a Ajuda
O Oomol Studio ajuda os usuários a conectar trechos de código e serviços de API por meio de interações visuais intuitivas para transformar rapidamente ideias em aplicativos reais. A seguir, uma introdução detalhada do fluxo de uso e da operação da função.
1. instalar o Oomol Studio
Primeiramente, é necessário fazer o download do aplicativo para o seu sistema operacional no site oficial da Oomol.
- Visite o site oficialAbra o site oficial da Oomol em seu navegador
https://oomol.com/
. - Faça o download do pacote de instalaçãoClique no botão "Download for Windows" na página inicial e clique em download. Atualmente, a plataforma é compatível apenas com o Windows x64.
- Instalação de aplicativosClique duas vezes no pacote de instalação após a conclusão do download e siga as instruções na tela para concluir a instalação.
2. visão geral da interface
Após iniciar o Oomol Studio, você verá uma interface principal composta por diferentes áreas, que se assemelha ao layout de muitos ambientes de desenvolvimento integrado (IDEs).
- Lista de nós esquerdosNo lado esquerdo da interface está a área funcional principal, onde todos os nós disponíveis são exibidos. Os nós são as unidades básicas que compõem os fluxos de trabalho, como "ler arquivo", "executar código Python", "chamar API" etc. Você pode arrastar os nós daqui para a tela central. Você pode arrastar os nós daqui para a tela central.
- Área central de lonaEspaço de trabalho: Este é o espaço de trabalho em que você criará o fluxo de trabalho automatizado arrastando e soltando e conectando nós.
- Área de configuração do parâmetro direitoQuando você seleciona um nó na tela, o lado direito da interface exibe opções detalhadas de configuração de parâmetros para esse nó. Você pode definir os dados de entrada do nó, ajustar o código, configurar a chave de API etc. aqui.
- Saída inferior e área de registroApós a execução do fluxo de trabalho, é possível ver as mensagens de registro em tempo real, os resultados da execução do código ou os gráficos visuais gerados na parte inferior da interface.
3. criação do primeiro fluxo de trabalho: legendagem automática de vídeo
Veja a seguir um exemplo prático de como usar a Oomol para criar um fluxo de trabalho automatizado para adicionar legendas traduzidas aos vídeos.
Etapa 1: Preparação e conceitualização do projeto
Nosso objetivo é implementar um processo automatizado: inserir um arquivo de vídeo local, o fluxo de trabalho reconhece automaticamente a fala no vídeo, converte-a em texto, depois traduz o texto para o idioma especificado e, por fim, adiciona as legendas traduzidas ao vídeo original.
Etapa 2: Criar o fluxo de trabalho
- Novos projetos de construçãoCrie um novo projeto de fluxo de trabalho no Oomol Studio.
- Adicionar o nó "Read Video" (Ler vídeo)Nó de processamento de vídeo: Localize um nó para processamento de arquivos na lista de nós à esquerda ou um nó de processamento de vídeo dedicado e arraste-o para a tela. Na área de configuração de parâmetros à direita, defina o nó para apontar para o caminho do arquivo de vídeo local que você deseja processar.
- Adicionar o nó "Speech Recognition" (Reconhecimento de fala)Localize e arraste um nó Speech-to-Text da lista de nós, por exemplo
Whisper
nó. Conecte a saída do nó Read Video (que representa o arquivo de vídeo) ao nóWhisper
A entrada para o nó. Isso indica que o arquivo de vídeo será usado como entrada para o reconhecimento de fala. - Adicionar o nó "Tradução de texto"Em seguida, arraste um módulo LLM incorporado ou um nó de chamada de API para tradução. Coloque o nó
Whisper
A saída do nó (texto reconhecido) é conectada à entrada do nó de tradução. Na área de parâmetros à direita, você pode configurar o idioma de destino da tradução, por exemplo, do inglês para o chinês. - Adicionar o nó "Subtitle Generation and Composition" (Geração e composição de legendas)Por fim, arraste um nó de processamento multimídia, por exemplo
FFmpeg
Nó. Esse nó recebe duas entradas: o arquivo de vídeo original e o texto da legenda traduzida. Portanto, você precisa conectar a saída do nó inicial "read video" e a saída do nó "text translation" ao nóFFmpeg
entrada do nó. As entradas para o nóFFmpeg
A área de parâmetros do nó que você precisa configurar para executar a operação "Add Subtitle" (Adicionar legenda). - Adicionar o nó "Save File" (Salvar arquivo)Adicionar um nó para salvar arquivos no final do fluxo de trabalho, colocando a tag
FFmpeg
A saída do nó (o vídeo processado) é conectada a esse nó e o caminho e o nome do arquivo para salvamento são definidos.
Etapa 3: Operação e comissionamento
- Iniciando um fluxo de trabalhoClique no botão "Run" (Executar) na parte superior da interface, e o Oomol iniciará a partir do primeiro nó e executará cada operação na ordem em que você a conectou.
- Ver registroDurante a execução, é possível ver a saída em tempo real e o status de cada nó na área de registro na parte inferior. Se algo der errado, os registros fornecerão mensagens de erro detalhadas para ajudá-lo a localizar rapidamente o problema. Por exemplo, pode ser uma chave de API inválida ou um caminho de arquivo incorreto.
- Prévia dos resultadosAlguns nós permitem a visualização prévia dos resultados. Por exemplo, um nó de processamento de dados pode mostrar o gráfico gerado diretamente na área inferior, facilitando a verificação se os resultados intermediários estão de acordo com o esperado.
4. explorar os fluxos de trabalho da comunidade
Se você não tiver certeza de como começar do zero, procure inspiração na comunidade.
- Acesso à comunidadeLocalize o portal "Comunidades" ou "Comunidades de fluxo de trabalho" no aplicativo Oomol ou no site oficial.
- Localizar e usarOomol Studio: há vários fluxos de trabalho prontos compartilhados por outros usuários na comunidade, como "Extração de conteúdo de documentos PDF", "Análise de dados de ações e backtesting", "Tradução de mangá" etc. Você pode fazer o download desses projetos diretamente e abri-los no Oomol Studio para ver como os outros os criaram. Você pode fazer o download direto desses projetos e abri-los no Oomol Studio para ver como outros os criaram. Você também pode aproveitar esses fluxos de trabalho existentes e modificá-los para atender às suas necessidades específicas.
cenário do aplicativo
- Ciência de dados e análise
Os usuários podem criar fluxos de trabalho para buscar automaticamente dados de bancos de dados ou APIs, usar o ambiente Python integrado para limpeza e processamento de dados e, por fim, utilizar oplotly
Os relatórios de visualização são gerados a partir de bibliotecas, etc. Todo o processo é feito em uma única parada, sem a necessidade de alternar entre diferentes softwares. - Automação da criação de conteúdo
Os blogueiros de vídeo podem criar um fluxo de trabalho que adiciona automaticamente legendas multilíngues a novos vídeos. O fluxo reconhece a fala do vídeo, chama a API de tradução e usa oFFmpeg
A compactação de legendas no vídeo aumenta muito a eficiência da distribuição de conteúdo. - Assistência para desenvolvimento e teste
Os desenvolvedores podem usar o Oomol para se conectar a vários serviços internos de API e criar processos automatizados de teste de API. Ao configurar diferentes parâmetros de entrada, você pode testar em lote a estabilidade e a correção das APIs e gerar relatórios de teste. - Manuseio de informações pessoais
Os usuários comuns podem criar um fluxo de trabalho para organizar seus arquivos pessoais. Por exemplo, compactar automaticamente todas as imagens em uma pasta específica ou converter eBooks em PDF baixados em um formato legível por máquina e extrair informações importantes para arquivamento.
QA
- Preciso instalar meu próprio ambiente Python ou Node.js para usar a Oomol?
Não. A Oomol usa a tecnologia de contêineres para criar um ambiente de desenvolvimento unificado em Python e Node.js que não exige nenhuma instalação ou configuração local. Isso garante que os fluxos de trabalho sejam executados da mesma forma em qualquer dispositivo, eliminando a dependência do tipo "funciona no meu computador". - A Oomol suporta o trabalho com arquivos de vídeo e áudio?
Sim, a Oomol oferece suporte ao processamento de multimídia. Os usuários podem usar os recursos de processamento multimídia da Oomol encapsulando funções comoFFmpeg
Essas bibliotecas de processamento profissional são usadas para criar nós de função personalizados que permitem operações complexas, como transcodificação, edição, legendagem e outras operações em arquivos de áudio e vídeo em um fluxo de trabalho. - Usuários sem nenhum conhecimento de programação podem usar a Oomol?
Pode ser usado. Para usuários que não sabem programar, é possível criar fluxos de trabalho arrastando e soltando módulos que já estão empacotados na comunidade para realizar tarefas como compactação de arquivos e processamento de PDF, por exemplo. No entanto, para obter funcionalidades mais complexas e personalizadas, escrever pequenas quantidades de código (por exemplo, scripts Python) permitirá que a plataforma atinja seu maior potencial. - Outras pessoas podem ver meu código nos fluxos de trabalho que compartilho na comunidade?
Sim. O compartilhamento da comunidade da Oomol é baseado na fonte, semelhante a comunidades de código aberto como o GitHub. Quando você compartilha um fluxo de trabalho, outras pessoas podem visualizá-lo e desenvolvê-lo, e esse compartilhamento aberto foi projetado para promover a colaboração e a inovação entre os usuários.