test refactoring

2026-04-24 14:45:27 +00:00 · 2026-03-19 09:34:07 -07:00
parent bd7e3ef0f3
commit dc9f878a5f
1 changed files with 51 additions and 73 deletions
--- a/codex-rs/core/src/codex_tests.rs
+++ b/codex-rs/core/src/codex_tests.rs
@@ -4355,8 +4355,12 @@ fn sandbox_policy_metadata_mapping_is_stable() {
    );
 }

-#[tokio::test(flavor = "multi_thread", worker_threads = 2)]
-async fn tool_call_metadata_stamps_escalated_review_decision_when_feature_enabled() {
+async fn setup_tool_call_metadata_runtime_test() -> (
+    Arc<Session>,
+    Arc<TurnContext>,
+    async_channel::Receiver<Event>,
+    codex_protocol::models::SandboxPolicyMetadata,
+) {
    let (mut sess, tc, rx) = make_session_and_context_with_rx().await;
    let expected_sandbox_policy = sandbox_policy_to_metadata(tc.sandbox_policy.get());
    Arc::get_mut(&mut sess)
@@ -4379,24 +4383,26 @@ async fn tool_call_metadata_stamps_escalated_review_decision_when_feature_enable
    .await;
    while rx.try_recv().is_ok() {}

-    sess.record_call_approval_outcome(
-        "call-1".to_string(),
-        ApprovalOutcomeMetadata::reviewed(&ReviewDecision::Denied),
-    )
-    .await;
-    sess.record_response_item_and_emit_turn_item(
-        tc.as_ref(),
-        ResponseItem::FunctionCall {
-            id: None,
-            name: "shell".to_string(),
-            namespace: None,
-            arguments: "{}".to_string(),
-            call_id: "call-1".to_string(),
-            metadata: None,
-        },
-    )
-    .await;
+    (sess, tc, rx, expected_sandbox_policy)
+}

+fn function_call_item(call_id: &str) -> ResponseItem {
+    ResponseItem::FunctionCall {
+        id: None,
+        name: "shell".to_string(),
+        namespace: None,
+        arguments: "{}".to_string(),
+        call_id: call_id.to_string(),
+        metadata: None,
+    }
+}
+
+async fn assert_next_emitted_function_call_metadata(
+    rx: &async_channel::Receiver<Event>,
+    expected_sandbox_policy: codex_protocol::models::SandboxPolicyMetadata,
+    expected_escalated: bool,
+    expected_review_decision: Option<codex_protocol::models::ReviewDecisionMetadata>,
+) {
    let event = tokio::time::timeout(std::time::Duration::from_secs(2), rx.recv())
        .await
        .expect("expected raw response item event")
@@ -4409,68 +4415,40 @@ async fn tool_call_metadata_stamps_escalated_review_decision_when_feature_enable
                ResponseItem::FunctionCall {
                    metadata: Some(metadata),
                    ..
-                } if metadata.is_tool_call_escalated == Some(true)
-                    && metadata.review_decision
-                        == Some(codex_protocol::models::ReviewDecisionMetadata::Denied)
+                } if metadata.is_tool_call_escalated == Some(expected_escalated)
+                    && metadata.review_decision == expected_review_decision
                    && metadata.sandbox_policy == Some(expected_sandbox_policy)
            )
    ));
 }

+#[tokio::test(flavor = "multi_thread", worker_threads = 2)]
+async fn tool_call_metadata_stamps_escalated_review_decision_when_feature_enabled() {
+    let (sess, tc, rx, expected_sandbox_policy) = setup_tool_call_metadata_runtime_test().await;
+
+    sess.record_call_approval_outcome(
+        "call-1".to_string(),
+        ApprovalOutcomeMetadata::reviewed(&ReviewDecision::Denied),
+    )
+    .await;
+    sess.record_response_item_and_emit_turn_item(tc.as_ref(), function_call_item("call-1"))
+        .await;
+    assert_next_emitted_function_call_metadata(
+        &rx,
+        expected_sandbox_policy,
+        true,
+        Some(codex_protocol::models::ReviewDecisionMetadata::Denied),
+    )
+    .await;
+}
+
 #[tokio::test(flavor = "multi_thread", worker_threads = 2)]
 async fn tool_call_metadata_stamps_non_escalated_false_when_feature_enabled() {
-    let (mut sess, tc, rx) = make_session_and_context_with_rx().await;
-    let expected_sandbox_policy = sandbox_policy_to_metadata(tc.sandbox_policy.get());
-    Arc::get_mut(&mut sess)
-        .expect("session should be uniquely owned in this test")
-        .features
-        .enable(crate::features::Feature::ItemMetadata)
-        .expect("feature flag should be enabled for this test");
+    let (sess, tc, rx, expected_sandbox_policy) = setup_tool_call_metadata_runtime_test().await;

-    sess.spawn_task(
-        Arc::clone(&tc),
-        vec![UserInput::Text {
-            text: "start".to_string(),
-            text_elements: Vec::new(),
-        }],
-        NeverEndingTask {
-            kind: TaskKind::Regular,
-            listen_to_cancellation_token: false,
-        },
-    )
-    .await;
-    while rx.try_recv().is_ok() {}
-
-    sess.record_response_item_and_emit_turn_item(
-        tc.as_ref(),
-        ResponseItem::FunctionCall {
-            id: None,
-            name: "shell".to_string(),
-            namespace: None,
-            arguments: "{}".to_string(),
-            call_id: "call-2".to_string(),
-            metadata: None,
-        },
-    )
-    .await;
-
-    let event = tokio::time::timeout(std::time::Duration::from_secs(2), rx.recv())
-        .await
-        .expect("expected raw response item event")
-        .expect("channel open");
-    assert!(matches!(
-        event.msg,
-        EventMsg::RawResponseItem(ref ev)
-            if matches!(
-                &ev.item,
-                ResponseItem::FunctionCall {
-                    metadata: Some(metadata),
-                    ..
-                } if metadata.is_tool_call_escalated == Some(false)
-                    && metadata.review_decision.is_none()
-                    && metadata.sandbox_policy == Some(expected_sandbox_policy)
-            )
-    ));
+    sess.record_response_item_and_emit_turn_item(tc.as_ref(), function_call_item("call-2"))
+        .await;
+    assert_next_emitted_function_call_metadata(&rx, expected_sandbox_policy, false, None).await;
 }

 #[tokio::test(flavor = "multi_thread", worker_threads = 2)]