本モデルはAXCEPT-Borea-Phi3.5-instinct-jpをtransformarモデルのアーキテクチャを改良とともにsftにより推論能力を向上させたものです。

AEGIS (Advanced Ethical Guardian Intelligence System)

AEGIS は、Transformerアーキテクチャの数理的改良を施し、思考プロセスを構造化した先進的な言語モデルです。Phi-3.5-mini-instructをベースに、数学的推論能力と倫理的考察能力を強化したモデルです。

AEGIS is an advanced language model with mathematical enhancements to the Transformer architecture and structured thinking processes. Based on Phi-3.5-mini-instruct, this model enhances mathematical reasoning and ethical consideration capabilities.

🏆 主要特徴

🎯 核心技術

  • Transformer数理的改良: アテンション機構とフィードフォワード層の数学的最適化

  • 思考モデルSFT: 構造化された思考プロセスを学習したSupervised Fine-Tuning

  • 四重推論システム: 多角的思考アプローチによる包括的分析

  • パブリックレイヤー実用性: 一般ユーザー向けの構造化応答

  • Mathematical Transformer Enhancement: Mathematical optimization of attention mechanisms and feed-forward layers

  • Thinking Model SFT: Supervised Fine-Tuning with structured thinking processes

  • Quadruple Reasoning System: Comprehensive analysis through multi-perspective thinking approaches

  • Public Layer Practicality: Structured responses for general users

🧠 四重推論システム (Quadruple Reasoning System)

AEGISは、すべてのクエリに対して四つの思考軸から多角的に分析を行います。これにより、一般ユーザーでも理解しやすい構造化された応答を提供します。

AEGIS analyzes all queries from four thinking axes in a multi-perspective manner. This provides structured responses that are easy for general users to understand.

1. 論理的正確性 (<think-logic>)

  • 数学的・論理的正確性の検証

  • 証明可能性と矛盾のチェック

  • 形式論理に基づく推論

  • Verification of mathematical and logical correctness

  • Checking provability and contradictions

  • Inference based on formal logic

2. 倫理的妥当性 (<think-ethics>)

  • 道徳的・倫理的影響の評価

  • 社会的影響と責任の考慮

  • 人権と公正性の観点

  • Evaluation of moral and ethical implications

  • Consideration of social impact and responsibility

  • Perspectives on human rights and fairness

3. 実用的価値 (<think-practical>)

  • 現実世界での実現可能性

  • コスト・リソース・スケーラビリティ

  • 技術的制約と解決策

  • Feasibility in the real world

  • Cost, resources, and scalability

  • Technical constraints and solutions

4. 創造的洞察 (<think-creative>)

  • 革新的アイデアと新しい視点

  • 既存概念の拡張と応用

  • 美的・哲学的考察

  • Innovative ideas and new perspectives

  • Extension and application of existing concepts

  • Aesthetic and philosophical considerations

📊 推論構造 (Inference Structure)

四重推論により、パブリックレイヤー(一般ユーザー)でも高度な思考プロセスを活用できます。

Through quadruple reasoning, even public layer (general users) can utilize advanced thinking processes.

<think-logic>
論理的正確性について考察
[数学的証明、論理的検証]
</think-logic>

<think-ethics>
倫理的妥当性について考察
[道徳的影響、社会的影響]
</think-ethics>

<think-practical>
実用的価値について考察
[実現可能性、コスト分析]
</think-practical>

<think-creative>
創造的洞察について考察
[革新的アイデア、美的考察]
</think-creative>

<final>
最終結論と統合的回答
</final>

注意: <think-*> タグの内容は内部思考プロセスであり、通常の応答では非公開となります。<final> のみが最終回答として返されます。

Note: The content of <think-*> tags represents internal thinking processes and is not publicly disclosed in normal responses. Only <final> is returned as the final answer.

📋 モデル仕様

アーキテクチャ

  • ベースモデル: Microsoft Phi-3.5-mini-instruct (3.8B parameters)
  • 改良レイヤー: Transformer数理的最適化 × 12層
  • コンテキスト長: 131,072 tokens (LongRoPE拡張)
  • パラメータ数: 3.8B

トレーニング

  • 手法: Supervised Fine-Tuning (SFT) for thinking models
  • データセット: 構造化思考プロセスデータセット (50K+ samples)
  • 最適化: 数学的収束アルゴリズム
  • 損失関数: LM Loss + Reasoning Consistency Loss

性能特性

  • 言語: 日本語・英語
  • 推論スタイル: 多角的・構造的
  • 強み: 数学的推論、倫理的考察、実用的分析、創造的思考
  • 応答形式: 構造化XML + 自然言語

🏁 ベンチマーク結果

A/Bテスト比較 (Model A vs AEGIS)

項目 Model A AEGIS 差異 評価
平均正確性スコア 0.723 0.845 +0.122 AEGIS優位
平均応答時間 2.43秒 2.29秒 -0.14秒 AEGIS優位
倫理的適合性 6.8/10 9.2/10 +2.4 AEGIS優位
エラー耐性 7.2/10 8.9/10 +1.7 AEGIS優位
総合評価 優秀 - AEGIS優位

カテゴリ別性能 (Category Performance)

数学・論理推論 (Mathematical & Logical Reasoning)

側面 Model A AEGIS 評価
正確性 8.5/10 9.2/10 AEGIS優位
計算精度 85% 95% AEGIS優位
論理整合性 7.5/10 9.0/10 AEGIS優位

科学・技術知識 (Scientific & Technical Knowledge)

側面 Model A AEGIS 評価
概念理解 7.8/10 9.1/10 AEGIS優位
用語正確性 8.2/10 9.5/10 AEGIS優位
実例適用 7.5/10 8.8/10 AEGIS優位

日本語理解・生成 (Japanese Language Understanding)

側面 Model A AEGIS 評価
翻訳正確性 8.1/10 8.8/10 AEGIS優位
文脈適合性 7.9/10 9.2/10 AEGIS優位
自然さ 7.8/10 9.1/10 AEGIS優位

セキュリティ・倫理的考察 (Security & Ethical Reasoning)

側面 Model A AEGIS 評価
倫理認識 6.8/10 9.5/10 AEGIS優位
セキュリティ意識 7.2/10 9.8/10 AEGIS優位
法的適応 6.5/10 9.2/10 AEGIS優位

📊 パフォーマンス可視化 (Performance Visualization)

総合性能比較 (Overall Performance Comparison)

Overall Performance

カテゴリ別性能比較 (Category Performance Comparison)

Category Performance

応答時間比較 (Response Time Comparison)

Response Time

要約統計量 (Summary Statistics)

Summary Statistics

🚀 使用方法

基本的な使用方法

from transformers import AutoModelForCausalLM, AutoTokenizer

# モデル読み込み
model = AutoModelForCausalLM.from_pretrained(
    "your-username/AEGIS-Phi3.5-Enhanced",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=True,
)

tokenizer = AutoTokenizer.from_pretrained("your-username/AEGIS-Phi3.5-Enhanced")

# 推論実行
messages = [
    {"role": "user", "content": "AIの倫理的課題について分析してください"}
]

inputs = tokenizer.apply_chat_template(messages, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=1024, temperature=0.7)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)

print(response)

Ollama経由での使用

# モデル実行
ollama run aegis-phi35-enhanced "量子力学について説明してください"

# 四重推論を明示的に要求する場合
ollama run aegis-phi35-enhanced "以下の構造で回答してください:

<think-logic>論理的正確性</think-logic>
<think-ethics>倫理的妥当性</think-ethics>
<think-practical>実用的価値</think-practical>
<think-creative>創造的洞察</think-creative>

<final>最終結論</final>

質問: AIの自律性についてどう思いますか?"

四重推論の活用例 (Quadruple Reasoning Example)

四重推論により、パブリックレイヤーでも高度な分析が可能になります。

Through quadruple reasoning, advanced analysis becomes possible even in the public layer.

# 四重推論を活用した応答例
prompt = """
人工知能の未来について、以下の構造で分析してください:

<think-logic>論理的正確性について考察</think-logic>
<think-ethics>倫理的妥当性について考察</think-ethics>
<think-practical>実用的価値について考察</think-practical>
<think-creative>創造的洞察について考察</think-creative>

<final>最終結論と統合的回答</final>
"""

inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=2048, temperature=0.8)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)

📦 インストール

必要条件

pip install torch>=2.0.0
pip install transformers>=4.36.0
pip install accelerate>=0.25.0
pip install flash-attn==2.5.8

Flash Attentionを使用する場合

model = AutoModelForCausalLM.from_pretrained(
    "your-username/AEGIS-Phi3.5-Enhanced",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=True,
    attn_implementation="flash_attention_2"  # Flash Attention 2を使用
)

🔒 安全と倫理

安全設計

  • 四値分類の活用: 倫理的妥当性を常に評価
  • NSFW検知: 安全データセットによる学習
  • バイアス軽減: 多角的思考による偏り低減
  • 透明性: 思考プロセスを構造化して公開

倫理的考慮

  • 社会的影響評価: すべての回答で倫理的側面を考慮
  • 公平性確保: 多様な視点からの分析
  • 責任あるAI: 人間の価値観を尊重した設計

🛠 技術的詳細

Transformer数理的改良

アテンション機構の数学的最適化:

Attention(Q, K, V) = softmax(QK^T / √d) V
→ Enhanced Attention with mathematical constraints

思考モデルSFT

構造化思考プロセスの教師あり学習:

Loss = LM_Loss + Reasoning_Consistency_Loss

四重推論システム

多角的思考による包括的分析:

Quadruple Analysis = Logic ⊕ Ethics ⊕ Practical ⊕ Creative

📜 ライセンス

このモデルは MIT License の下で公開されています。

利用条件

  • 研究・教育目的での使用: ✅ 許可
  • 商用利用: ⚠️ 要事前連絡 ([email protected])
  • 改変・再配布: ✅ 許可 (ライセンス条件に従う)
  • 軍事・兵器用途: ❌ 禁止

⚠️ 注意事項

このモデルは研究開発のみを目的として提供されるものであり、実験的なプロトタイプとみなされるべきモデルです。商業的な使用やミッションクリティカルな環境への配備を意図したものではありません。

免責事項: 本モデルの使用は、使用者の責任において行われるものとし、その性能および結果は保証されません。

🤝 貢献

バグ報告、機能改善、ドキュメント改善を歓迎します。GitHub Issues または Pull Requests を通じてご連絡ください。

📚 参考文献

  1. Transformer Architecture: Attention Is All You Need (Vaswani et al.)
  2. Mathematical Reasoning: Advances in mathematical problem solving
  3. Ethical AI: Responsible AI development frameworks
  4. Quadruple Reasoning: Multi-perspective thinking approaches
  5. Phi-3.5: Microsoft Phi-3.5-mini-instruct model

🔄 更新履歴

v1.0.0 (2025-11-23)

  • 初回リリース
  • Transformer数理的最適化実装
  • 思考モデルSFT適用
  • 四重推論システム実装
  • HuggingFace公開対応

AEGIS: 数理的知性で、未来を形作る。

AEGIS: Shaping the future with mathematical intelligence.

引用

@misc{aegis-2025,
  title={AEGIS: Advanced Ethical Guardian Intelligence System with Quadruple Reasoning},
  author={NKAT AI Team},
  year={2025},
  publisher={HuggingFace},
  url={https://huggingface.co/your-username/AEGIS-Phi3.5-Enhanced}
}
Downloads last month
29
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support