約GLM-4.5V

モデルのGLM-Vファミリーの一部として、GLM-4.5VはZhipuAIの基盤モデルGLM-4.5-Airに基づいており、画像、ビデオ、文書理解、GUIエージェント操作などのタスクでSOTA性能を達成しています。

GLM-4.5Vの高度なMultimodal推論が、さまざまな現実世界のアプリケーションに革新的なソリューションを提供する様子を発見してください。

Multimodalコンテンツインテリジェンス

画像、Video、複雑なドキュメントを含む多様な視覚およびTextualコンテンツから深い洞察を引き出し、包括的な分析とレポートを行います。

ユースケース例:

"30分の製造監視Videoで主要なイベントを自動的に要約し、特定のオブジェクトを識別し、品質管理のためのタイムスタンプ付きレポートを生成しました。"

インテリジェントGUIオートメーション

AIエージェントがWeb、デスクトップ、モバイルインターフェースとやり取りし、視覚的な理解と精密なアクションを通じて複雑なタスクを実行します。

ユースケース例:

"レガシーなJavaベースのERPシステムをナビゲートし、特定の注文詳細を抽出し、クラウドベースの最新物流プラットフォームにInputし、手動処理時間を60%削減するエージェントを開発しました。"

深いドキュメント&チャート分析

複雑な財務報告書、科学論文、技術的な設計書を分析し、構造化データを抽出し、トレンドを特定し、詳細な要約を生成します。

ユースケース例:

"150ページの製薬研究論文を処理し、埋め込まれたチャートとテーブルから重要な実験結果を抽出し、薬剤の効能と安全性プロファイルを規制レビューのためにまとめました。"

視覚QA&異常検出

製品、製造ライン、またはデジタル資産を視覚的に検査し、欠陥、一貫性の欠如、または基準からの逸脱を特定することで品質管理を自動化します。

ユースケース例:

"高解像度カメラを使用して食料包装ラインを監視し、誤表示された製品や包装の欠陥をリアルタイムで検出し、消費者に不良商品が届くのを防ぎました。"

メタデータ

作成する

2025/08/13

ライセンス

MIT

プロバイダー

Z.ai

ハギングフェイス

仕様

Deprecated

建築

キャリブレートされた

はい

専門家の混合

はい

合計パラメータ

106B

アクティブ化されたパラメータ

12B

推論

いいえ

Precision

FP8

コンテキスト長

66K

Max Tokens

66K

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow

Japanese

© 2025 SiliconFlow