typedef-ai
diff --git a/‎src/fenic/_backends/local/semantic_operators/analyze_sentiment.py‎
Lines changed: 2 additions & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/analyze_sentiment.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fenic/_backends/local/semantic_operators/base.py‎
Lines changed: 1 addition & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/base.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src/fenic/_backends/local/semantic_operators/classify.py‎
Lines changed: 2 additions & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/classify.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fenic/_backends/local/semantic_operators/extract.py‎
Lines changed: 2 additions & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/extract.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fenic/_backends/local/semantic_operators/map.py‎
Lines changed: 2 additions & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/map.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fenic/_backends/local/semantic_operators/parse_pdf.py‎
Lines changed: 2 additions & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/parse_pdf.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fenic/_backends/local/semantic_operators/predicate.py‎
Lines changed: 2 additions & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/predicate.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fenic/_backends/local/semantic_operators/summarize.py‎
Lines changed: 2 additions & 0 deletions b/‎src/fenic/_backends/local/semantic_operators/summarize.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fenic/_backends/local/transpiler/expr_converter.py‎
Lines changed: 7 additions & 1 deletion b/‎src/fenic/_backends/local/transpiler/expr_converter.py‎
Lines changed: 7 additions & 1 deletion
diff --git a/‎src/fenic/_constants.py‎
Lines changed: 4 additions & 0 deletions b/‎src/fenic/_constants.py‎
Lines changed: 4 additions & 0 deletions
@@ -134,6 +134,7 @@ def __init__(
         model: LanguageModel,
         temperature: float,
         model_alias: Optional[ResolvedModelAlias] = None,
+        request_timeout: Optional[float] = None,
     ):
         super().__init__(
             input,
@@ -145,6 +146,7 @@ def __init__(
                     temperature=temperature,
                     response_format=SENTIMENT_ANALYSIS_FORMAT,
                     model_profile=model_alias.profile if model_alias else None,
+                    request_timeout=request_timeout,
                 ),
             ),
             EXAMPLES,
 
@@ -78,6 +78,7 @@ def send_requests(
             response_format=self.inference_config.response_format,
             top_logprobs=self.inference_config.top_logprobs,
             model_profile=self.inference_config.model_profile,
+            request_timeout=self.inference_config.request_timeout,
         )
 
         completions = [
 
@@ -43,6 +43,7 @@ def __init__(
         temperature: float,
         examples: Optional[ClassifyExampleCollection] = None,
         model_alias: Optional[ResolvedModelAlias] = None,
+        request_timeout: Optional[float] = None,
     ):
         self.classes = classes
         self.valid_labels = {class_def.label for class_def in classes}
@@ -59,6 +60,7 @@ def __init__(
                     temperature=temperature,
                     response_format=ResolvedResponseFormat.from_pydantic_model(self.output_model, generate_struct_type=False),
                     model_profile=model_alias.profile if model_alias else None,
+                    request_timeout=request_timeout,
                 ),
             ),
             examples,
 
@@ -50,6 +50,7 @@ def __init__(
         max_output_tokens: int,
         temperature: float,
         model_alias: Optional[ResolvedModelAlias] = None,
+        request_timeout: Optional[float] = None,
     ):
         self.resolved_format = response_format
         super().__init__(
@@ -61,6 +62,7 @@ def __init__(
                     temperature=temperature,
                     response_format=response_format,
                     model_profile=model_alias.profile if model_alias else None,
+                    request_timeout=request_timeout,
                 ),
                 model=model,
             ),
 
@@ -53,6 +53,7 @@ def __init__(
         model_alias: Optional[ResolvedModelAlias] = None,
         response_format: Optional[ResolvedResponseFormat] = None,
         examples: Optional[MapExampleCollection] = None,
+        request_timeout: Optional[float] = None,
     ):
         super().__init__(
             input,
@@ -64,6 +65,7 @@ def __init__(
                     response_format=response_format,
                     temperature=temperature,
                     model_profile=model_alias.profile if model_alias else None,
+                    request_timeout=request_timeout,
                 ),
             ),
             jinja_template=jinja2.Template(jinja_template),
 
@@ -50,6 +50,7 @@ def __init__(
         describe_images: bool = False,
         model_alias: Optional[ResolvedModelAlias] = None,
         max_output_tokens: Optional[int] = None,
+        request_timeout: Optional[float] = None,
     ):
         self.page_separator = page_separator
         self.describe_images = describe_images
@@ -68,6 +69,7 @@ def __init__(
                     max_output_tokens=max_output_tokens,
                     temperature=1.0,  # Use a higher temperature so gemini flash models can handle complex table formatting.  For more info see the conversation here: https://discuss.ai.google.dev/t/gemini-2-0-flash-has-a-weird-bug/65119/26
                     model_profile=model_alias.profile if model_alias else None,
+                    request_timeout=request_timeout,
                 ),
             ),
             examples=None,  # PDF parsing doesn't use examples
 
@@ -46,6 +46,7 @@ def __init__(
         temperature: float,
         examples: Optional[PredicateExampleCollection] = None,
         model_alias: Optional[ResolvedModelAlias] = None,
+        request_timeout: Optional[float] = None,
     ):
         super().__init__(
             input,
@@ -56,6 +57,7 @@ def __init__(
                   response_format=PREDICATE_FORMAT,
                   temperature=temperature,
                   model_profile=model_alias.profile if model_alias else None,
+                  request_timeout=request_timeout,
                 ),
                 model=model,
             ),
 
@@ -45,6 +45,7 @@ def __init__(
         temperature: float,
         model: LanguageModel,
         model_alias: Optional[ResolvedModelAlias] = None,
+        request_timeout: Optional[float] = None,
     ):
         self.format = format
 
@@ -56,6 +57,7 @@ def __init__(
                     max_output_tokens=self.get_max_tokens(),
                     temperature=temperature,
                     model_profile=model_alias.profile if model_alias else None,
+                    request_timeout=request_timeout,
                 ),
                 model=model,
             ),
 
@@ -581,6 +581,7 @@ def sem_map_fn(batch: pl.Series) -> pl.Series:
                 temperature=logical.temperature,
                 response_format=logical.response_format,
                 model_alias=logical.model_alias,
+                request_timeout=logical.request_timeout,
             ).execute()
 
         column_exprs = [self._convert_expr(expr) for expr in logical.exprs]
@@ -680,6 +681,7 @@ def sem_ext_fn(batch: pl.Series) -> pl.Series:
                 max_output_tokens=logical.max_tokens,
                 temperature=logical.temperature,
                 model_alias=logical.model_alias,
+                request_timeout=logical.request_timeout,
             ).execute()
 
         return self._convert_expr(logical.expr).map_batches(
@@ -700,6 +702,7 @@ def sem_pred_fn(batch: pl.Series) -> pl.Series:
                 examples=logical.examples,
                 temperature=logical.temperature,
                 model_alias=logical.model_alias,
+                request_timeout=logical.request_timeout,
             ).execute()
 
         column_exprs = [self._convert_expr(expr) for expr in logical.exprs]
@@ -722,6 +725,7 @@ def sem_classify_fn(batch: pl.Series) -> pl.Series:
                 temperature=logical.temperature,
                 examples=logical.examples,
                 model_alias=logical.model_alias,
+                request_timeout=logical.request_timeout,
             ).execute()
 
         return self._convert_expr(logical.expr).map_batches(
@@ -737,6 +741,7 @@ def sem_sentiment_fn(batch: pl.Series) -> pl.Series:
                 model=self.session_state.get_language_model(logical.model_alias),
                 temperature=logical.temperature,
                 model_alias=logical.model_alias,
+                request_timeout=logical.request_timeout,
             ).execute()
 
         return self._convert_expr(logical.expr).map_batches(
@@ -753,7 +758,7 @@ def sem_summarize_fn(batch: pl.Series) -> pl.Series:
                 format=logical.format,
                 temperature=logical.temperature,
                 model=self.session_state.get_language_model(logical.model_alias),
-
+                request_timeout=logical.request_timeout,
             ).execute()
 
         return self._convert_expr(logical.expr).map_batches(
@@ -770,6 +775,7 @@ def parse_pdf_fn(batch: pl.Series) -> pl.Series:
                 describe_images=logical.describe_images,
                 model_alias=logical.model_alias,
                 max_output_tokens=logical.max_output_tokens,
+                request_timeout=logical.request_timeout,
             ).execute()
 
         return self._convert_expr(logical.expr).map_batches(
 
@@ -20,6 +20,10 @@
 DEFAULT_MAX_TOKENS = 512
 DEFAULT_TEMPERATURE: float = 0
 
+# Model client timeout constants
+MAX_MODEL_CLIENT_TIMEOUT = 600  # 10 minutes
+DEFAULT_MODEL_CLIENT_TIMEOUT = 120  # 2 minutes
+
 # If the output type is known to us before runtime, this is a rough upper bound.
 # Higher than expected because Anthropic estimates output tokens differently than other providers
 # during tool use.
Original file line number	Diff line number	Diff line change
`@@ -78,6 +78,7 @@ def send_requests(`
`78`	`78`	`response_format=self.inference_config.response_format,`
`79`	`79`	`top_logprobs=self.inference_config.top_logprobs,`
`80`	`80`	`model_profile=self.inference_config.model_profile,`
	`81`	`+ request_timeout=self.inference_config.request_timeout,`
`81`	`82`	`)`
`82`	`83`
`83`	`84`	`completions = [`