Qwen3-Omni-30B-A3B-Captioner

Qwen3-Omni-30B-A3B-Captioner

Qwen/Qwen3-Omni-30B-A3B-Captioner

約Qwen3-Omni-30B-A3B-Captioner

Qwen3-Omni-30B-A3B-Captionerは、AlibabaのQwenチームからのVision-Language Model (VLM)で、Qwen3シリーズの一部です。これは、高品質で詳細かつ正確なImageキャプションを生成するために特別に設計されています。30Bの総パラメータエキスパートの組み合わせ(MoE)アーキテクチャに基づいており、ModelはImageの内容を深く理解し、それを豊かで自然な言語Textに翻訳することができます。

利用可能な Serverless

クエリをすぐに実行し、使用量のみを支払います

$

0.1

$

0.4

100万トークン(Input/Output)ごとに

メタデータ

作成する

2025/10/04

ライセンス

-

プロバイダー

Qwen

ハギングフェイス

仕様

Available

建築

キャリブレートされた

はい

専門家の混合

はい

合計パラメータ

30B

アクティブ化されたパラメータ

推論

いいえ

Precision

FP8

コンテキスト長

66K

Max Tokens

66K

対応機能

Serverless

対応

Serverless LoRA

サポートされていません

Fine-tuning

サポートされていません

Embeddings

サポートされていません

Rerankers

サポートされていません

Image入力をサポートする

対応

JSON Mode

対応

構造化されたOutputs

サポートされていません

ツール

対応

Fim Completion

対応

Chat Prefix Completion

対応

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow