fix: complete streaming fix for all LLM providers and improve console handling

github-actions[bot] · MervinPraison · github-actions[bot] · commit fea00ad34b0d · 2025-07-16T23:38:27.000Z
- Fix custom LLM streaming (Gemini/Vertex AI) in llm.py by removing verbose condition
- Improve console parameter consistency when streaming is enabled
- Ensures streaming works for stream=True regardless of verbose setting
- Maintains full backward compatibility

Co-authored-by: Mervin Praison &lt;MervinPraison@users.noreply.github.com&gt;
diff --git a/src/praisonai-agents/praisonaiagents/agent/agent.py b/src/praisonai-agents/praisonaiagents/agent/agent.py
@@ -1140,7 +1140,7 @@ def _chat_completion(self, messages, temperature=0.2, tools=None, stream=True, r
                     tools=formatted_tools,  # Already formatted for OpenAI
                     execute_tool_fn=self.execute_tool,
                     stream=stream,
-                    console=self.console if self.verbose else None,
+                    console=self.console if (self.verbose or stream) else None,
                     display_fn=display_generating if stream else None,
                     reasoning_steps=reasoning_steps,
                     verbose=self.verbose,
diff --git a/src/praisonai-agents/praisonaiagents/llm/llm.py b/src/praisonai-agents/praisonaiagents/llm/llm.py
@@ -2417,18 +2417,14 @@ def response(
             )
             
             if stream:
-                if verbose:
-                    with Live(display_generating("", start_time), console=console or self.console, refresh_per_second=4) as live:
-                        for chunk in litellm.completion(**completion_params):
-                            content = self._process_streaming_chunk(chunk)
-                            if content:
-                                response_text += content
-                                live.update(display_generating(response_text, start_time))
-                else:
+                with Live(display_generating("", start_time), console=console or self.console, refresh_per_second=4) as live:
                     for chunk in litellm.completion(**completion_params):
                         content = self._process_streaming_chunk(chunk)
                         if content:
                             response_text += content
+                            live.update(display_generating(response_text, start_time))
+                        if content:
+                            response_text += content
             else:
                 response = litellm.completion(**completion_params)
                 response_text = response.choices[0].message.content.strip() if response.choices[0].message.content else ""
@@ -2517,18 +2513,14 @@ async def aresponse(
             )
             
             if stream:
-                if verbose:
-                    with Live(display_generating("", start_time), console=console or self.console, refresh_per_second=4) as live:
-                        async for chunk in await litellm.acompletion(**completion_params):
-                            content = self._process_streaming_chunk(chunk)
-                            if content:
-                                response_text += content
-                                live.update(display_generating(response_text, start_time))
-                else:
+                with Live(display_generating("", start_time), console=console or self.console, refresh_per_second=4) as live:
                     async for chunk in await litellm.acompletion(**completion_params):
                         content = self._process_streaming_chunk(chunk)
                         if content:
                             response_text += content
+                            live.update(display_generating(response_text, start_time))
+                        if content:
+                            response_text += content
             else:
                 response = await litellm.acompletion(**completion_params)
                 response_text = response.choices[0].message.content.strip() if response.choices[0].message.content else ""