Oomol 是一个AI可编程工作流平台,它提供了一个叫做Oomol Studio的桌面应用程序。这个平台的核心是通过可视化的方式,让用户可以像搭建积木一样,通过拖放功能节点来创建自动化流程。这些节点可以是代码片段(支持Python和Node.js)、API服务,或是平台内置的大语言模型(LLM)模块。Oomol为编程和数据处理提供了一个统一的开发环境,用户不需要在自己的电脑上安装和配置Python或Node.js环境,因为平台通过容器技术解决了环境一致性的问题。这样一来,创建的工作流可以在任何安装了Oomol的设备上无缝运行和共享。平台不仅适合需要处理数据的开发者和数据科学家,也适合内容创作者等非专业开发者,用来自动化处理例如视频加字幕、图片压缩等重复性任务,主要目标是帮助用户将想法快速变成可执行的自动化产品。
機能一覧
- 可视化工作流搭建: 提供图形化界面,通过拖放不同功能的节点并连接它们,来构建自动化任务流程。
- 内置编程环境: 无需本地安装,直接使用内置的、基于容器的Python和Node.js开发环境。
- プロフェッショナル・コードエディター: 集成了基于VSCode的代码编辑器,支持代码自动补全、语法高亮和日志查看功能。
- データの可視化: 支持使用
pandas
歌で応えるplotly
等库处理数据,并直接在平台内生成和展示图表。 - 内置AI模块: 平台内建了多种大语言模型(LLM)模块,可以直接调用,简化AI应用开发。
- コミュニティ・シェアリング: 用户可以将自己创建的完整工作流或单个功能模块分享到社区,也能够直接使用社区中其他人分享的成果。
- マルチメディア処理: 支持封装视频处理库(如FFmpeg)为功能节点,方便内容创作者自动化处理音视频任务。
- 结构化与非结构化数据处理: 能够灵活构建流程,处理包括表格数据和音视频、PDF等多媒体文件在内的不同数据类型。
ヘルプの使用
Oomol Studio通过直观的视觉交互帮助用户连接代码片段和API服务,将想法快速转化为实际应用。以下是详细的使用流程和功能操作介绍。
1. 安装Oomol Studio
首先,你需要从Oomol官方网站下载适用于你操作系统的应用程序。
- 公式ウェブサイトを見る:在浏览器中打开 Oomol 官方网站
https://oomol.com/
. - インストールパッケージをダウンロードする:在首页找到“下载适用于Windows的版本”按钮并点击下载。目前平台仅支持Windows x64版本。
- アプリケーションのインストール:下载完成后,双击安装包,按照屏幕上的提示完成安装。
2.インターフェイスの概要
启动Oomol Studio后,你将看到一个由不同区域组成的主界面,它类似于很多集成开发环境(IDE)的布局。
- 左侧节点列表:界面的左侧是核心的功能区,这里陈列了所有可用的节点。节点是构成工作流的基本单元,例如“读取文件”、“执行Python代码”、“调用API”等。你可以从这里拖动节点到中央的画布上。
- 中央画布区域:这是你的工作区,你将在这里通过拖放和连接节点来构建你的自动化工作流。
- 右侧参数配置区:当你选中画布上的一个节点时,界面的右侧会显示该节点的详细参数配置选项。你可以在这里设置节点的输入数据、调整代码、配置API密钥等。
- 底部输出与日志区: 运行工作流后,你可以在界面底部看到实时的日志信息、代码执行结果或生成的可视化图表。
3. 创建第一个工作流:视频自动加字幕
下面通过一个实际例子,介绍如何使用Oomol创建一个自动化为视频添加翻译字幕的工作流。
步骤一:项目准备与构思
我们的目标是实现一个自动化流程:输入一个本地视频文件,工作流会自动识别视频中的语音,将其转换成文字,然后将文字翻译成指定语言,最后将翻译好的字幕添加到原视频中。
步骤二:搭建工作流
- 新築プロジェクト:在Oomol Studio中创建一个新的工作流项目。
- 添加“读取视频”节点:从左侧节点列表中找到一个用于处理文件的节点,或者一个专门的视频处理节点,将其拖到画布上。在右侧的参数配置区,设置该节点,让它指向你要处理的本地视频文件路径。
- 添加“语音识别”节点:从节点列表中找到并拖入一个语音识别(Speech-to-Text)节点,例如
Whisper
节点。将“读取视频”节点的输出端(代表视频文件)连接到Whisper
节点的输入端。这表示视频文件将作为语音识别的输入。 - 添加“文本翻译”节点:接下来,拖入一个内置的LLM模块或API调用节点用于翻译。将
Whisper
节点的输出(识别出的文字)连接到翻译节点的输入。在右侧参数区,你可以配置翻译的目标语言,例如从英文翻译成中文。 - 添加“字幕生成与合成”节点:最后,拖入一个多媒体处理节点,例如
FFmpeg
节点。该节点需要两个输入:一个是原始视频文件,另一个是翻译好的字幕文本。因此,你需要将最初的“读取视频”节点的输出和“文本翻译”节点的输出,同时连接到这个FFmpeg
节点的输入端。在FFmpeg
节点的参数区,你需要配置它执行“添加字幕”的操作。 - 添加“保存文件”节点:在工作流的末尾添加一个用于保存文件的节点,将
FFmpeg
节点的输出(处理完成的视频)连接到此节点,并设置好保存的路径和文件名。
步骤三:运行与调试
- 启动工作流:点击界面上方的“运行”按钮,Oomol就会从第一个节点开始,按照你连接的顺序依次执行每个操作。
- ログを見る:在执行过程中,你可以在底部的日志区看到每个节点的实时输出和状态。如果某个环节出错,日志会提供详细的错误信息,帮助你快速定位问题。例如,可能是API密钥无效,或者文件路径不正确。
- プレビュー結果:部分节点支持结果预览。例如,数据处理节点可能会直接在底部区域展示生成的图表,方便你检查中间结果是否符合预期。
4. 探索社区工作流
如果你不确定如何从零开始,可以从社区寻找灵感。
- 访问社区:在Oomol应用内或官网上,找到“社区”或“工作流社区”入口。
- 查找与使用:社区里有其他用户分享的各种现成工作流,例如“PDF文档内容提取”、“股票数据分析与回测”、“漫画翻译”等。你可以直接下载这些项目,在Oomol Studio中打开它们,查看别人是如何搭建的。你也可以在这些现有工作流的基础上进行修改,以满足自己的特定需求。
アプリケーションシナリオ
- 数据科学与分析
用户可以搭建工作流,自动从数据库或API获取数据,使用内置的Python环境进行数据清洗和处理,最后利用plotly
等库生成可视化报告。整个过程无需在不同软件间切换,一站式完成。 - 内容创作自动化
视频博主可以创建一个工作流,自动为新视频添加多国语言字幕。该流程能识别视频语音,调用翻译API,并使用FFmpeg
将字幕压制进视频,极大提升了内容分发的效率。 - 开发与测试辅助
开发人员可以利用Oomol连接内部的各种API服务,构建自动化的API测试流程。通过配置不同的输入参数,可以批量测试API的稳定性和正确性,并生成测试报告。 - 个人信息处理
普通用户可以创建一个工作流来整理个人文件。例如,自动压缩指定文件夹内的所有图片,或者将下载的PDF电子书转换为机器可读的格式,并提取关键信息进行归档。
品質保証
- 使用Oomol需要自己安装Python或Node.js环境吗?
不需要。Oomol使用容器技术内置了统一的Python和Node.js开发环境,用户无需在本地进行任何安装或配置。这确保了工作流在任何设备上都能以相同的方式运行,解决了“在我的电脑上能跑”的环境依赖问题。 - Oomol是否支持处理视频和音频文件?
是的。Oomol支持多媒体处理。用户可以通过封装如FFmpeg
这样的专业处理库来创建自定义功能节点,从而在工作流中实现对音视频文件的转码、剪辑、添加字幕等复杂操作。 - 完全不懂编程的用户可以使用Oomol吗?
可以使用。对于不懂编程的用户,可以通过拖放社区中已经封装好的模块来搭建工作流,实现例如文件压缩、PDF处理等任务。但要实现更复杂和定制化的功能,编写少量代码(如Python脚本)将能发挥平台更大的潜力。 - 我在社区分享的工作流,其他人能看到我的代码吗?
可以。Oomol的社区共享是基于源码的,类似于GitHub等开源社区。当你分享一个工作流时,其他人可以查看并在此基础上进行二次开发,这种开放共享的方式旨在促进用户间的协作和创新。