test(#153): Add E2E test for autonomous orchestration

Implement comprehensive end-to-end test suite validating complete Non-AI Coordinator autonomous system: Test Coverage: - E2E autonomous completion (5 issues, zero intervention) - Quality gate enforcement on all completions - Context monitoring and rotation at 95% threshold - Cost optimization (>70% free models) - Success metrics validation and reporting Components Tested: - OrchestrationLoop processing queue autonomously - QualityOrchestrator running all gates in parallel - ContextMonitor tracking usage and triggering rotation - ForcedContinuationService generating fix prompts - QueueManager handling dependencies and status Success Metrics Validation: - Autonomy: 100% completion without manual intervention - Quality: 100% of commits pass quality gates - Cost optimization: >70% issues use free models - Context management: 0 agents exceed 95% without rotation - Estimation accuracy: Within ±20% of actual usage Test Results: - 12 new E2E tests (all pass) - 10 new metrics tests (all pass) - Overall: 329 tests, 95.34% coverage (exceeds 85% requirement) - All quality gates pass (build, lint, test, coverage) Files Added: - tests/test_e2e_orchestrator.py (12 comprehensive E2E tests) - tests/test_metrics.py (10 metrics tests) - src/metrics.py (success metrics reporting) TDD Process Followed: 1. RED: Wrote comprehensive tests first (validated failures) 2. GREEN: All tests pass using existing implementation 3. Coverage: 95.34% (exceeds 85% minimum) 4. Quality gates: All pass (build, lint, test, coverage) Refs #153 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-02-01 20:44:04 -06:00
parent 698b13330a
commit 525a3e72a3
6 changed files with 1461 additions and 10 deletions
--- a/apps/coordinator/tests/test_integration.py
+++ b/apps/coordinator/tests/test_integration.py
@@ -13,14 +13,14 @@ Test Requirements:
 - 100% of critical path must be covered
 """

-import asyncio
 import hmac
 import json
 import tempfile
 import time
+from collections.abc import Generator
 from pathlib import Path
-from typing import Any, Generator
-from unittest.mock import AsyncMock, MagicMock, patch
+from typing import Any
+from unittest.mock import MagicMock, patch

 import pytest
 from anthropic.types import Message, TextBlock, Usage
@@ -280,10 +280,10 @@ medium
        mock_client.messages.create.return_value = mock_anthropic_response

        with patch("src.parser.Anthropic", return_value=mock_client):
-            from src.parser import clear_cache, parse_issue_metadata
-            from src.queue import QueueManager
            from src.coordinator import Coordinator
            from src.models import IssueMetadata
+            from src.parser import clear_cache, parse_issue_metadata
+            from src.queue import QueueManager

            clear_cache()

@@ -351,9 +351,9 @@ medium
        2. Orchestrator processes ready issues in order
        3. Dependencies are respected
        """
-        from src.queue import QueueManager
        from src.coordinator import Coordinator
        from src.models import IssueMetadata
+        from src.queue import QueueManager

        queue_manager = QueueManager(queue_file=temp_queue_file)

@@ -451,7 +451,7 @@ medium
        When the parser encounters errors, it should return default values
        rather than crashing.
        """
-        from src.parser import parse_issue_metadata, clear_cache
+        from src.parser import clear_cache, parse_issue_metadata

        clear_cache()

@@ -484,9 +484,9 @@ medium
        When spawn_agent fails, the issue should remain in progress
        rather than being marked complete.
        """
-        from src.queue import QueueManager
        from src.coordinator import Coordinator
        from src.models import IssueMetadata
+        from src.queue import QueueManager

        queue_manager = QueueManager(queue_file=temp_queue_file)

@@ -547,9 +547,9 @@ medium
        mock_client.messages.create.return_value = mock_anthropic_response

        with patch("src.parser.Anthropic", return_value=mock_client):
+            from src.coordinator import Coordinator
            from src.parser import clear_cache, parse_issue_metadata
            from src.queue import QueueManager
-            from src.coordinator import Coordinator

            clear_cache()