OpenClaw 是一个开源的多模态大模型项目,支持多种格式的输入和输出,以下是其主要支持的格式:

输入格式支持:
-
文本
- 纯文本对话
- (如.txt、.md等)
-
图像
- 常见格式:JPEG、PNG、WEBP
- 支持图像内容理解和分析
-
音频
- 支持WAV、MP3等格式
- 具备语音识别(ASR)能力
-
视频
- 支持MP4、AVI等格式
- 能提取视频帧进行分析
输出格式:
- 文本回答(主要输出形式)
- 结构化数据(JSON格式)
- 代码生成(多种编程语言)
- 文件处理结果
特殊格式支持:
- 多文档处理:支持同时上传多个文件进行分析
- 混合模态输入:支持文本+图像、文本+音频等组合输入
- 长上下文:支持超过128K tokens的长文本处理
使用方式示例:
messages=[
{"role": "user", "content": "分析这张图片", "image": "path/to/image.jpg"}
]
)
注意事项:
- 文件大小限制(通常单文件<50MB)
- 支持批量处理但有限制
- 具体格式支持可能因部署版本而异
建议查阅最新的OpenClaw官方文档获取最准确的格式支持信息,因为项目在持续更新中,如果你有特定的格式需求,我可以帮你进一步确认!
标签: 示例代 码OpenClaw API
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。