Home
Login

PyTorchをベースとした最先端のリアルタイム物体検出モデルYOLOv5。物体検出、画像セグメンテーション、画像分類タスクをサポート。

AGPL-3.0Python 42.3kultralyticsultralytics Last Updated: 2025-06-24

Ultralytics YOLO プロジェクト詳細

プロジェクト概要

Ultralytics YOLO は、最先端の物体検出、インスタンスセグメンテーション、姿勢推定、トラッキング、分類などの機能を提供することに重点を置いた、高度なコンピュータビジョンフレームワークです。このプロジェクトは、長年のコンピュータビジョンとAIの基礎研究に基づいて構築された、最先端のYOLOモデルのコレクションです。

プロジェクトアドレス: https://github.com/ultralytics/ultralytics

コア機能

🎯 マルチタスクサポート

  • 物体検出: 画像またはビデオ内の物体を識別および特定します。
  • インスタンスセグメンテーション: 画像またはビデオを、異なるオブジェクトまたはカテゴリに対応する領域に分割します。
  • 姿勢推定: 人体または物体の姿勢とキーポイントを検出および分析します。
  • 画像分類: 画像全体を分類および識別します。
  • 物体追跡: ビデオシーケンス内で複数のターゲットを追跡します。
  • 有向バウンディングボックス検出(OBB): 回転するオブジェクトの検出をサポートします。

🚀 最新モデルバージョン

YOLO11

YOLO11はUltralyticsの最新YOLOモデルであり、物体検出、セグメンテーション、姿勢推定、トラッキング、分類など、複数のタスクで最先端のパフォーマンスを提供し、強化された特徴抽出機能を備えています。

主な改善点:

  • 強化された特徴抽出: 改善されたバックボーンネットワークとネックアーキテクチャ
  • 最適化された精度と効率: 高い精度を維持しながら処理速度を向上
  • より正確な物体検出: アーキテクチャの改善による検出パフォーマンスの向上
YOLO12

YOLO12は、注意メカニズムを中心とした物体検出手法を採用しており、さまざまなコアコンピュータビジョンタスクで優れたパフォーマンスを発揮します。

🔧 技術的優位性

  1. リアルタイムパフォーマンス: モデルは高速、正確、かつ使いやすく、最適化されたアーキテクチャにより、精度を犠牲にすることなく高速パフォーマンスを保証します。
  2. 継続的な更新: パフォーマンスと柔軟性を向上させるために継続的に更新されます。
  3. 簡単な統合: シンプルなPython APIと豊富なドキュメントサポート。
  4. クロスプラットフォーム展開: NVIDIA Jetson、NVIDIA GPU、macOSシステムなどのさまざまなデバイスでの展開をサポートします。

主要な機能モジュール

トレーニングモード (Training)

  • カスタムデータセットのトレーニングをサポートします。
  • さまざまなトラッキングツール(Comet、Weights & Biasesなど)を統合します。
  • ハイパーパラメータの最適化と実験管理。
  • リアルタイムの指標監視。

推論モード (Inference)

  • バッチ処理と単一画像推論。
  • ビデオストリームのリアルタイム処理。
  • さまざまな推論バックエンドのサポート。

検証モード (Validation)

  • モデルのパフォーマンス評価。
  • 指標の計算と可視化。
  • ベンチマークツール。

エクスポートモード (Export)

  • さまざまな形式でのエクスポートをサポートします(ONNX、TensorRT、CoreMLなど)。
  • モバイルおよび組み込みデバイスの最適化。

アプリケーションシナリオ

業界アプリケーション

  • スマートセキュリティ: リアルタイム監視と異常検出。
  • 自動運転: 道路上のターゲットの識別と追跡。
  • 産業品質検査: 製品の欠陥検出と分類。
  • 医療画像処理: 医療画像の分析と診断支援。
  • 小売業: 客層分析と商品識別。
  • スポーツ分析: アスリートの動作分析と試合統計。

技術統合

  • ロボットビジョン: 環境認識とナビゲーション。
  • 拡張現実: リアルタイムのターゲット識別と追跡。
  • スマートホーム: 人員検出と行動認識。

技術アーキテクチャ

モデルアーキテクチャの特長

  • 改善されたバックボーンネットワーク: 特徴抽出能力を向上させます。
  • 最適化されたネック構造: マルチスケール特徴の融合を強化します。
  • 効率的な検出ヘッド: 速度と精度を両立させます。

コアテクノロジー

  • 注意メカニズム: YOLO12に導入された注意中心設計。
  • 特徴ピラミッドネットワーク: マルチスケール特徴処理。
  • アンカーボックスの最適化: 適応型アンカーボックスの生成と最適化。

インストールと使用

クイックスタート

# インストール
pip install ultralytics

# Python APIの使用
from ultralytics import YOLO

# モデルのロード
model = YOLO('yolo11n.pt')

# トレーニング
model.train(data='coco8.yaml', epochs=100, imgsz=640)

# 推論
results = model('path/to/image.jpg')

# エクスポート
model.export(format='onnx')

コマンドラインの使用

# トレーニング
yolo train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640

# 推論
yolo predict model=yolo11n.pt source='path/to/image.jpg'

# 検証
yolo val model=yolo11n.pt data=coco8.yaml

# エクスポート
yolo export model=yolo11n.pt format=onnx

パフォーマンスの特長

速度の優位性

  • リアルタイム処理能力、高フレームレートビデオをサポート。
  • 最適化された推論エンジン。
  • マルチGPU並列処理のサポート。

精度表現

  • COCOデータセットで最先端のmAP指標を達成。
  • 速度と精度のトレードオフのバランス。
  • さまざまなモデルサイズをサポート(nano、small、medium、large、extra-large)。

リソース効率

  • メモリ使用量の最適化。
  • 計算リソースの効率的な利用。
  • 量子化やプルーニングなどのモデル圧縮技術をサポート。

まとめ

Ultralytics YOLOは、現在最も先進的で完全なコンピュータビジョンソリューションの1つであり、強力なモデルパフォーマンスを提供するだけでなく、完全なツールチェーンとエコシステムを備えています。学術研究、産業アプリケーション、または個人プロジェクトのいずれにおいても、このフレームワークで適切なソリューションを見つけることができます。継続的な更新と改善により、ユーザーは常に最新の技術進歩と最高のエクスペリエンスを得ることができます。

Star History Chart