GLM-Z1-32B-0414

GLM-Z1-32B-0414

約GLM-Z1-32B-0414

GLM-Z1-32B-0414は、深い思考能力を持つ推論Modelです。このModelは、コールドスタートと拡張された強化学習を通じてGLM-4-32B-0414をベースに開発され、数学、コード、論理を含むタスクに対するさらなるトレーニングが行われました。ベースModelと比較して、GLM-Z1-32B-0414は数学的能力と複雑なタスクを解決する能力を大幅に向上させています。トレーニングプロセス中に、チームはペアワイズランキングフィードバックに基づいた一般的な強化学習も導入し、Modelの一般的な能力をさらに強化しました。32Bのパラメータしか持っていないにもかかわらず、一部のタスクでは671Bパラメータを持つDeepSeek-R1に匹敵する性能を示します。AIME 24/25、LiveCodeBench、GPQAのベンチマークでの評価を通じて、このModelは強力な数学的推論能力を示し、より広範な複雑なタスクに対するソリューションをサポートできます。

GLM-Z1-32B-0414の深層思考と高度な推論能力がさまざまな分野でどのように複雑な課題を解決するかを発見します。

高度な科学的発見

複雑なデータセットを分析し、数学的証明を生成および検証し、深い段階的な推論とともに技術論文を作成することで研究を加速します。

ユースケース例:

"量子物理学チームの支援により、粒子相互作用の新しい理論Modelを導き出し、実験設計時間を大幅に短縮しました。"

高度なコード分析

基本的なコード補完を超えます。論理的な誤りを特定し、アルゴリズムを最適化し、アーキテクチャの改善を提案するために、コード全体を分析します。

ユースケース例:

"高並行性のGoマイクロサービスで重要なレースコンディションを特定し、複雑なプロセス間通信を追跡して、正確で最適化された修正を提供しました。"

深い金融市場戦略

市場データやレポートに対して多段階の定量分析を行い、因果関係を推論して、詳細でデータ駆動型の戦略的提案を生成します。

ユースケース例:

"リアルタイムの市場感情とマクロ経済指標を分析して動的な取引戦略を作成し、堅実な財務上の推論で最適な参入/退出ポイントを特定しました。"

複雑なシステムロジックの検証

エンジニアリング設計や規制フレームワークのような複雑なシステムを監査し、論理的な依存関係を通じて推論し、不整合を識別し、潜在的なコンプライアンス問題を指摘します。

ユースケース例:

"産業用制御システムのPLCコードと安全プロトコルをレビューし、重要な論理的欠陥を発見して、安全な再設計を提案しました。"

メタデータ

作成する

ライセンス

MIT

プロバイダー

Z.ai

ハギングフェイス

仕様

Deprecated

建築

GLM-4

キャリブレートされた

いいえ

専門家の混合

いいえ

合計パラメータ

32B

アクティブ化されたパラメータ

32B

推論

いいえ

Precision

FP8

コンテキスト長

131K

Max Tokens

131K

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?

AI開発を 加速する準備はできていますか?